登陆注册
8622

数据要素产业:探索数据流通、确权与AI助力的新格局

锤子财富2023-05-26 12:32:180
在数据的生产、流通和使用过程中,将涌现出众多数据服务商和技术创新,推动数据要素产业链的发展和数据经济的繁荣。

作为数字经济核心驱动力,数据成为生产要素备受市场关注。

2022年,我国数字经济规模达50.2万亿元,稳居世界第二。随着数字经济发展深入,各行各业都在积极探索数字化转型的路径。尤其是在制造业、金融业和零售业等传统行业中,数据要素的应用潜力巨大。

数据要素产业链包括数据生产、流通和使用三大环节。数据生产环节决定数据生产的规模和质量;数据流通环节主要受限于数据确权立法制度,数据场内交易趋势满足监管要求,有望带动场内交易量显著提升;数据使用环节有望受益于 AI 浪潮,数据使用服务商融合 AI 技术,提升服务能力和质量,赋能下游应用场景提升数据使用效果。

本文将重点讨论数据要素行业现状和投资机会,为读者提供多维度的行业洞察。

1、数据生产

随着数字经济的快速发展,数据要素在各个产业中的广泛应用渗透有望加速,推动数据生产规模快速增长。同时,随着数商技术的不断进步,数据生产的质量将稳步提升,从而提高数据产品的附加值。长期来看,预计数据生产相关服务的收费水平将整体呈现出持续提升的趋势,这一发展态势为数字要素市场带来了巨大的潜力和投资机会。

1.1数据资产储备:前五大行业产量占比65%

根据《国家数据资源调查报告(2021)》,我国2021年数据产量6.6ZB,同比增加29.4%,其中个人数据产量为1.4ZB,各类行业机构产生数据5.2ZB。行业分布看,数据产量排名前五位的行业分别为政府、互联网、媒体、公众服务及专业服务、交通,前五大行业数据产量占全国行业机构数据总产量的65%。

为数据要素市场提供高质量数据、降低数据使用门槛是数据要素市场建设的关键。掌握大量数据的行业龙头公司或互联网平台如何为市场供给高质量的数据?复旦大学管理学院教授、上海数交所研究院院长黄丽华对第一财经表示,首先企业需要找准定位,制订自己的数据业务战略布局,其次需要企业在组织架构上成立新的业务部门去承担相对应的数据管理任务,最后需要有用户意识,在保证数据安全合法合规的前提下,充分了解下游客户需求提供高质量数据服务。

同时黄丽华也表示,数据要素的交易需要大量的数商也就是第三方数据服务商,目前无论是在数量还是服务产品种类上都十分欠缺。

目前很多有潜在数据服务能力的企业正积极转型布局。例如数据智能服务商每日互动(300766.SZ)自主打造数据智能操作系统(DiOS),对内增能提效的同时对外输出数据治理能力,客户可通过数据智能操作系统(DiOS),进行数据归集,清洗融合,分析处理,算法建模等数据治理活动,DiOS提供相关治理能力的支撑。

每日互动董秘桑赫对第一财经表示,截至2022年12月,公司每日实时处理和新增的数据量超过50TB,已形成4,000余种数据标签,直接参与计算的特征参数累计超过1.6亿,打造了大规模图神经网络以及深度学习模型,广泛应用于公共服务、增能服务等领域;DiOS数据智能操作系统已在品牌营销、城市治理、数智交通等领域落地应用,为各垂直行业的发展提供数字化动力。

1.2数据整理:数据脱敏成为关键

数据整理过程通常包括数据清洗、标注、脱敏和标准化治理四个环节。在数据要素市场建设中,广发证券认为数据脱敏和脱密环节尤为重要。

根据我国数据要素市场的建设规划,数据隐私和安全等问题受到了充分的重视。尽管目前尚未明确立法相关数据确权的细节,但确保数据脱敏和隐私计算已成为数据流通交易的必要条件。

数据脱敏是一种对敏感数据进行变形处理的技术。它能够在降低敏感数据泄露风险的同时,保持数据原本的特征,使其仍然可以用于数据分析和价值挖掘。

数据脱敏技术的核心目标是保护敏感数据的隐私和安全。通过对敏感数据进行变形,例如替换、扰动或屏蔽等方式,实现对敏感信息的保护。这样一来,即使在数据传输、存储或处理过程中出现安全漏洞,敏感数据也不会被直接暴露,从而降低了数据泄露的风险。

同时,数据脱敏技术确保敏感数据仍然保持一定的可用性和分析价值。变形后的数据仍然保留了原始数据的基本特征和结构,可以被用于各种数据分析、挖掘和业务应用。这样,在保护数据隐私的前提下,企业和组织仍然可以利用数据进行合规的分析和决策。

据 Gartner 数据,2017 年使用数据脱敏技术的企业占比约为 15%,预计到 2022 年达到 50%。

隐私计算是一种通过应用密码学、人工智能、数据科学等多领域科学体系,在保护数据隐私的前提下实现数据分析和计算的技术。它具有"原始数据不出域、数据可用不可见"的特点,旨在在充分保护数据和隐私安全的同时,实现数据价值的转化和释放。

据艾瑞咨询预测,到 2025 年我国隐私计算市场规模约为 145.1 亿元,2021-2025 年复合增速133.27%。

东莞证券表示,综合型网络安全厂商,如深信服(300454.SZ)、奇安信(688561.SH)、启明星辰(002439.SZ)等公司,基于其强大的技术背景和资金实力,在数据安全领域布局方面具有一定的先发优势。这些公司在隐私计算、数据脱敏、数据泄露防护、数据库审计、防火墙、数据分类分级等领域都有相应的产品布局,产品矩阵相当丰富,有望形成强者恒强的态势。

一些数据服务厂商也在围绕数据安全积极做出技术尝试和应用。如每日互动推动建设了中国(温州)数安港的大数据联合计算中心。每日互动表示,大数据联合计算平台可使多方加密数据在一个具有公信力的中立安全环境中进行融合计算,通过“三隔离三审核”机制保障数据控制权和使用权分离,实现“数据可用不可拥,安全可见又可验”,既保障了数据提供方数据共享流通的安全性,也为数据需求方实现了更多的应用价值。

数据脱敏和隐私计算环节在数据要素市场中具有重要意义。这一环节的发展将有助于保护数据隐私,增强数据安全,并促进数据的有效流通。在数据要素市场建设中,重点关注数据脱敏脱密环节的发展,将为市场提供更加安全可靠的数据服务,推动行业的进一步发展。

1.3数据聚合和分析:IDC有望边际受益

数据中心(IDC)是数据计算、存储和交换等集中管理的场所。数据分析业务增长将带动IDC数据计算的需求,同时,数据存储也是数据聚合中的关键环节。因此,在数据聚合和数据分析需求的增长下,IDC有望边际受益。

公共和垂直行业数据敏感性高,尤其是在央国企上云的过程中,需要统筹考虑发展和安全,并兼顾风险和效率的因素,需要具备央国企背景的厂商参与。国资云一般是指由各地国资委牵头投资、设立、运营的,具备高安全防护水平的数据安全基础设施底座,以及以汇聚国有数据资产为核心的数据治理体系及云平台。

国资背景的厂商在平台、资源、市场、技术和人才等方面拥有天然的优势,能够直接接触到原始数据,基于国资云平台上存储、运营的海量政务和垂直行业数据,国资云厂商有望开发政务、金融等垂直行业小模型,协助提升政府治理水平、行业监管效率、企业运营能力,未来不仅可以输出数据产品,更可以输出 AI 能力,提供 AI 产品和解决方案。

国资背景云厂商分为央企国资云和地方国资云。央企国资云厂商,如中国电子云、易华录(300212.SZ)、天翼云等,主要承担大型央国企, 以及部分地方政府国资云的建设工作。地方国资云厂商,如云赛智联(600602.SH)、铜牛信息(300895.SZ)等,主要为所属地方国资委建设地方国资云平台。

东吴证券表示,随着数据局建立后统筹相关工作,各地责任将进一步压实,推动国资云加快部署。经东吴证券测算,到2025年国资云市场规模将超过2400亿元。

2、数据流通

中国数据交易市场发展势头迅猛。On Audience的统计数据显示,在2017年至2019年期间,全球最大的五个数据市场中,市场交易值的增速均超过20%,而2017年和2018年,中国市场的交易值几乎翻番增长,2019年的增速也超过了60%,达到了24亿美元的交易值,超过了英国市场。

这一数据表明中国数据交易市场具有巨大的潜力和活力,吸引了大量的市场参与者。随着中国经济的持续发展和数字化转型的推进,预计中国数据交易市场将继续保持快速增长的势头,为企业和市场创造更多机遇和价值。

而数据交易只是数据流通的一个环节。数据流通还包括数据确权、数据定价和数据交付等关键环节。在这些环节中,涉及的参与主体各有不同角色和责任。

其中数据交易所扮演了数据流通环节的核心角色,承担搭建交易平台、构建交易基础设施、审批登记、合规监管等主要职能;第三方数商则参与剩下的数据定价、数据交付、以及数据确权和数据交易中的其他增值服务。

2.1 数据交易所:数据流通环节核心受益方

根据《数据二十条》对数据交易所提出的"所商分离"明确定位,数据流通环节将逐步形成以数据交易所为中心、与第三方数商协同发展的数据流通生态圈。这一运营模式可以参考目前证券交易所和券商的关系和职责,并且数据交易所将逐渐剥离现有的一部分数商职能,回归到交易平台的核心定位。数据交易所的主要职能包括搭建交易平台、构建交易基础设施、审批登记和合规监管等。

截至2022年8月,全国已经成立或拟成立的数据交易所(中心)共计 46 家,数据交易所的建设进入 2.0 阶段。从8家公布数据服务类型的数据交易所看,目前常见的数据交易以数据 API、数据集(也称数据包)、数据报告等为主,还有一些机构提供数据质押、模型算法、可视化组件、数据管理、数据应用等服务。

数据交易所作为我国数据交易的合规载体,将承载相对较早阶段的数据要素流通与交易,数据要素价值挖掘将首先体现在数据交易。国内已有多个厂商布局数据交易所,主要形式为与地方性央国企合资参股形式设立数据交易所。

从产业链视角,广发证券认为数据交易所将是数据流通环节的核心受益方。一方面,在政策支持 产业发展的双重推动下,市场流通交易的数据量将加速提升。另一方面,基于对数据安全和监管的要求,数据交易将更多往场内转移。两者叠加推动下,交易所内数据交易量将得到进一步提升,交易所业务发展将得到更好发展。

2.2 数据确权:探索解决数据确权难题

针对数据权属问题,目前国内还没有明确的法律规定,现有的政策或文件对数据确权只是提供了框架性和方向性的指导。例如,“数据二十条”提出了对公共数据、企业数据和个人数据进行分类分级确权授权的概念,并探索了数据资源持有权、数据加工使用权和数据产品经营权的产权分置制度。同时,“数字中国”规划也提出了“加快建立数据产权制度”的目标。然而,具体的立法工作尚未完全落地。

事实上,数据确权问题不仅影响和制约着数据流通环节,还涉及到数据资产的入表问题。数据作为重要的资产,在经济社会发展中具有巨大的价值和潜力。然而,由于缺乏明确的法律框架,数据资产的确权和保护面临一系列挑战和难题。这不仅影响了数据流通的顺畅性,也限制了数据资产的合理利用和价值释放。

目前,国内的数据确权服务工作主要由一些国有企业搭建的平台承担。其中,典型的平台包括由新华网旗下的新华智云创建的数字资产中心,以及人民网旗下的人民数据确权流通平台和人民数保平台。

新华网(603888.SH)通过持有新华智云39%的股份来推动数字资产中心的建设,并利用区块链技术提供数据确权服务。作为境内首批取得网信办区块链信息服务备案的企业之一,新华智云基于区块链技术,提供包括版权确权、存证和维权等服务。

人民网(603000.SH)旗下的数据确权平台结合区块链技术,积极探索并实践数据确权服务。自2019年起,人民网就开始积极研究和创新应用区块链技术,并将其运用于数据确权业务的探索中。在此背景下,人民网旗下的人民数据推出了人民数据资产服务平台,以人民网的“人民链”技术为技术基础,成为行业内首个集数据合规性审核、数据确权出版、数据流通登记和数据资产服务于一体的国家级综合数据资产服务平台,也被视为国内首个数据确权平台。

这一实践成果备受关注,于2021年被工业和信息化部选为2021年大数据产业发展试点示范项目。随后,在“人民链”和“人民云”的底层技术支持下,人民数据资产服务平台升级为“人民数据确权流通平台”于2022年正式启用。进一步,于2023年3月,人民数据还推出了“人民链BaaS服务平台”(2.0版本),该平台可快速接入区块链应用,为数字存证、知识产权保护、数字产品、数字确权等应用场景提供区块链应用能力赋能。

在个人数据确权领域,人民数据与世纪互联合作于2022年6月推出了我国首个个人信息保护与确权服务平台——“人民数保”。该平台通过将个人用户的二次数据上链,确保身份数据、内容数据和行为数据的安全性、可信性和不可篡改性。它提供了数据授权、认证和计费等功能,实现了个人数字身份和个人数字资产的全环节审查、授权、存证、确权、流转和二次开发,为个人提供了新型的信息基础服务。

这些平台通过建立可信赖的技术框架,为数据确权提供了安全和可靠的解决方案。借助区块链技术的不可篡改性和去中心化特点,这些平台能够有效地保护数据的权益,并提供确权、存证等一系列服务。

通过国有企业搭建的平台,国内的数据确权服务得到了推动和支持。这些平台以技术领先和资本实力为基础,致力于提供高质量的数据确权服务,为数据所有者和使用者搭建了一个可信赖的平台环境。未来,随着数字经济的快速发展,这些平台有望在数据确权领域发挥更加重要的作用,推动数据产业的繁荣和创新。

3、数据应用

数据需求方涉及公共服务、影视娱乐、交通、医疗、金融、广告营销等众多领域。数据的使用是数据发挥真正价值的关键阶段。在人工智能等技术的支持下,数据要素产业链有望迎来重塑,主要表现在高质量数据需求快速增长和数据使用门槛降低。

首先,随着人工智能进入大模型时代,大模型的表现能力对数据处理量和模型参数量呈指数级增长的依赖性将大幅提升,这将显著推动上游数据需求的增长。大规模数据的收集和处理将成为实现先进人工智能应用的关键要素。

其次,人工智能大模型的训练和应用模式可以实现对广泛下游数据使用细分场景的泛化,从而显著降低数据使用的成本和门槛。这将使得更多行业和领域能够深度融合人工智能技术,实现数据的广泛渗透和赋能。无论是公共服务领域的智慧城市建设,还是影视娱乐产业的个性化推荐,以及交通、医疗、金融和广告营销等行业的创新发展,都将受益于数据使用门槛的降低和人工智能技术的广泛应用。

数据服务商具备AI技术的承载和输出能力,扮演着AI助力数据使用的关键角色。百度文心一言是百度在长期AI技术研发中的成果之一,也是推动"AI 云"有机融合和相互赋能的体现。以文心一言为例,百度智能云是其对外服务的窗口,而百度自主研发的芯片昆仑芯和AI中台百度飞桨深度学习平台构成了其底层基座,共同构建了百度国内首个全栈自研AI基础设施"百度AI大底座"。

百度将AI技术集成封装到百度AI大底座中,提供丰富且便捷的AI研发与运营一体化能力(MLOps),助力企业在数据使用等多元场景实现成本降低和效率提升。在百度AI大底座的赋能下,企业的资源利用率可提升至70%,开发效率可提升100%。

不止百度、阿里和腾讯等大厂,越来越多的数据服务商在AI领域深度参与和布局。

汉得信息(300170.SZ)董秘黄耿对第一财经表示,目前更应该关注的是AI大模型的应用场景,因为如果找不到好的应用场景,商业价值就没法变现。此外,尽管通用型大模型在带给用户广泛认知方面具有极大优势,但是在垂直领域层面,这种建立在公有云上的大模型更容易被客户担忧数据安全的问题。黄耿表示,“在B端的应用,未来的企业级私有大模型是一个非常重要的关注点”。

每日互动董秘桑赫也表示,大模型是一辆开得非常快的车,必须在安全的前提下才能发挥出它应有的价值。每日互动将探索可控大模型的行业应用,让模型能力在安全可控的框架下用于垂直领域。

结语

总体而言,随着数字化时代的全面到来,数据的重要性和价值日益凸显。在数据的生产、流通和使用过程中,将涌现出众多数据服务商和技术创新,推动数据要素产业链的发展和数据经济的繁荣。

然而,数据经济发展和应用过程中也面临一些挑战,包括数据隐私保护、环境和能源消耗、伦理道德等问题,需要各方共同关注和解决。

只有在政府、企业、机构和个人等各方的共同努力下,充分发挥数据的潜力,兼顾数据安全和个人隐私保护,才能实现数据经济的可持续发展,为社会创造更大的价值。

参考资料:

20230422-广发证券-政策顶层发力 产业供需共振,数据要素市场高质量快速发展

20230515-中银国际-数据要素交易赛道凸显,关注卡位厂商

20230322-东吴证券-国资云:数字经济的根本

2023-04-27-东莞证券-计算机行业深度报告:数据安全赛道长坡厚雪

0000
评论列表
共(0)条