作者:快思慢想研究院 田丰,央视财经编辑 任芳言
(注:以下为"数据要素×"专题研究分析全文)
编者按:当一份名老中医的诊疗记录,开始与大模型的训练需求相遇,一场关于数据要素的深层变革,才刚刚显现其真正的量级。
一、"数据要素×"赛道扩容
2026年,"数据要素×"大赛迎来新一轮扩容。新增赛道包括人力资源、体育发展、文物保护利用、中医药、数据基础设施建设。消息本身并不令人意外——但读懂这份赛道清单背后的逻辑,才能看清中国数字经济正在发生的结构性转变。
前两届大赛的主战场,集中于工业、金融、医疗等数据结构化程度高、价值路径清晰的领域。2026年新增的三个民生与文化赛道——人力资源、文物保护利用、中医药——却呈现出截然不同的数据特征:价值在于不可复制性。
这是一次从"能流通的数据"到"有独特性的数据"的战略跃迁。数据的稀缺性,正在从信息层向认知层升级,整个赛道也在由生产型场景向意义型场景系统性扩展。
国家数据局局长刘烈宏在大赛启动仪式上明确提出六大突破方向:以赛搭台推动数据基础制度落地、以赛强基加快基础设施建设、以赛促用发挥高价值场景牵引、以赛兴市助力全国一体化数据市场建设、以赛强产壮大数据产业生态、以赛赋智赋能人工智能创新发展。六个方向,构成了一张从制度到产业、从基础设施到应用场景的完整战略地图。
二、三类场景:规模化落地的条件已经同时具备
在讨论新赛道之前,有必要先确认一个基准:已有哪些场景真正跑通了?
根据前两届大赛积累的案例数据,以下三类场景的技术成熟度与商业可行性已同时达标,具备规模化复制的条件:
金融风控数据融合。 多方数据联合建模的方案已成熟,银行信贷不良率可降低20%至30%,ROI路径清晰,付费意愿明确。
工业质检与预测性维护。 工厂传感器数据与历史故障数据交叉建模,部分制造业场景已实现ROI正转。这是数据要素在实体经济中最早兑现商业价值的领域之一。
医保控费欺诈识别。 模型已在多省医保系统正式上线,效果可量化,合规路径清晰。
这三类场景的共同特征是:需求方付费意愿明确、效果可量化、合规路径清晰。它们构成了数据要素乘数效应从理论走向现实的第一批压力测试,也为新赛道的扩展提供了可参照的方法论。
三、文物保护利用,非结构化数据转化为生产力的典型实践
如果说金融、工业、医保是数据要素的"第一代战场",那文物保护利用赛道的出现,意味着数据要素正在进入一个完全不同的知识维度。
文物数据的核心挑战,是高密度非结构化数据的治理问题。影像数据、三维扫描数据、出土语境信息、病害记录、修复档案——这些数据不仅格式各异,更重要的是,其价值需要跨学科的语义理解才能被激活。将文物病害、保护修复、安全监管等多源数据融合,可以实现文物保护修复、监测预警、精准管理等功能。
这条赛道的战略意义,在于验证了一个更普遍的命题:多模态非结构化数据,经过标准化治理后,能够支撑AI模型训练和专业决策。这不是文博行业的专项工程,而是数据要素在"意义型场景"中可行性的基础性实验。一旦方法论成熟,文化遗产、档案管理、地质勘探等大量依赖非结构化积累的领域,都将迎来同样的数字化转型机会。
四、中医药数据,AI时代最具全球竞争壁垒的知识资产
如果要在2026年所有新赛道中选出一个最具战略纵深的方向,答案是中医药。
一位名老中医的临床诊疗记录,在全球范围内是唯一的专有知识资产——不可复制,不可再生,不可替代。它的稀缺性来自数千年不可再生的历史积累:一个名老中医对某类疾病的诊疗洞见,无法通过文献检索重建,只存在于那一份完整的临床记录之中。
DeepMind联合创始人Demis Hassabis在谈到AlphaFold的蛋白质结构预测突破时曾指出:这一成就的根本,是获得了足够大、足够干净的蛋白质结构数据库。数据本身,就是核心资产。中医药数字化的机会逻辑与此完全相同:数千年积累的临床知识,一旦被系统化为训练数据和知识图谱,将成为构建中医大模型不可替代的认知底座。
这即是中医传承问题,也是中国在全球AI竞争中独特的数据禀赋。当其他国家的医疗AI在争夺同质化的结构化病历数据时,中医药数据集提供的是一种世界范围内无法复制的竞争位置。
五、人力资源赛道,劳动力定价机制的一次深层重构
人力资源赛道的接入,表面上看是"招聘数字化"的延伸,实质上是劳动力要素定价机制的深层重构。
人社部数据接入数据要素赛道的核心价值,在于打破"学历标签"对劳动力定价的垄断。当职业技能评价数据、就业流向数据、岗位技能图谱数据实现互联互通,企业可以对候选人进行能力预测,而非资历比对。这不是招聘效率优化,是劳动要素市场的信息结构改造。
对中小企业的意义尤为直接:用工成本中隐含的信息不对称溢价,将随着数据维度的丰富而逐步压缩。这是劳动要素市场效率的系统性提升,也是数据要素乘数效应在就业领域最直接的产业形态。
六、体育赛道与公共数据变现,一个可复制的商业模板
体育发展赛道的战略意义,同样超出体育产业本身。
场馆运营数据、赛事运营数据、市民运动行为数据与城市规划数据、医保数据的融合,提供了一个完整的"公共数据授权运营→场景收益分成"商业模型:地方政府以数据使用权入股,企业负责运营变现,收益按协议分配。这条赛道的意义不在于体育产业本身,而在于提供了一个可复制的公共数据变现模板。这一模式一旦跑通,将为文旅、公共卫生等更多公共数据场景提供标准化路径。
七、千亿市场规模之后,效率才是真正的战场
2024年,中国数据交易市场规模约2115亿元。这个数字足够亮眼,但它掩盖了一个更值得关注的结构性问题:绝大多数交易仍是场外点对点完成,场内交易占比极低。
原因不是数据交易所不够多——全国已有超过50家。根本障碍是数据产品的标准化程度,远未达到支撑场内规模化撮合的水平。一个金融风控数据包,不同买方对其质量、时效、覆盖范围的要求差异极大,难以形成统一定价。
真正的突破口,是"数据产品分级认证"制度的建立:类似食品成分表的标注体系,为数据产品建立可比较的质量描述框架——是什么数据、覆盖多少范围、时效性如何、经过何种清洗。这是场内交易规模化的前置条件,也是整个市场从"野蛮生长"走向"制度成熟"的关键一跃。
与此同时,公共数据授权运营正成为当前最确定的价值释放路径。2025年国家数据局发布100个公共数据"跑起来"示范场景,医保数据、海关通关数据、气象数据等场景的商业可行性已得到初步验证。
公共数据的天然优势在于:政府持有数据产权,企业持有运营能力,二者合作天然规避了数据所有权争议。目前的核心卡点,是各省授权运营规则不统一——同一数据集在不同省份的授权条款、收益分配比例、使用限制均不一致,导致全国性业务的数据合规成本极高。统一授权运营标准,是释放这一价值的关键制度动作。
八、数据×AI,一台双向驱动的引擎
数据要素市场2026年最重要的新变量,是与人工智能形成的双向驱动关系。
一个方向是已被广泛讨论的"数据增强模型":高质量数据喂养更好的AI。AI先驱、特斯拉前AI总监Andrej Karpathy在谈到大语言模型训练时曾指出:数据质量对模型性能的影响,远超参数规模。这一判断已成为行业共识,并直接转化为大模型厂商对高质量中文语料、专业领域标注数据的迫切需求——他们正在成为数据要素市场前所未有的强力需求方。
另一个方向则更为微妙,也更容易被忽视:模型反哺数据质量。 当大模型具备语义理解和自动标注能力,它开始反向提升数据供给侧的质量和效率——原本需要大量人工标注的低质量数据集,可以借助模型实现自动清洗和结构化。数据与AI的关系,由此从单向喂养变成双向迭代的正向飞轮。
数据供给方若能建立与AI训练需求匹配的数据产品规格,将获得远高于传统数据服务的议价能力。这一双向驱动关系,是2026年数据要素市场最重要的增量来源。
九、数据基础设施,铺设数字经济的"TCP/IP协议"
2026年大赛专设"数据基础设施建设"赛道,背后有深刻的现实动因。
数据流通当前面临的最大摩擦力,从来不是数据量不足,而是跨主体传输时的信任成本与合规成本,高到足以令整个商业闭环断裂。一次金融机构之间的数据联合建模,从意向到落地平均需要6至18个月的合规谈判,法务成本有时超过数据本身的价值。
隐私保护计算、区块链、可信数据空间等基础设施的核心功能,正是用技术手段替代法律谈判——将"数据可用不可见"变成可审计的技术承诺,把合规成本从每次交易的线性支出,压缩为一次性基础设施投入。互联网先驱Vint Cerf在解释TCP/IP协议的历史意义时曾说,标准化通信协议的价值,在于消除每对节点之间独立建立信任的冗余成本。数据基础设施的逻辑与此完全相同。
这里有一个重点往往被忽略: 数据基础设施原生化,将彻底改变数据产品的形态。目前绝大多数数据应用是"定制化工程项目"——为某个具体业务场景专项对接,完全无法复用,每一次合作都要从头谈判、重新开发。数据基础设施原生化的核心变化,是将数据的接入、加工、流通封装成标准API,使数据产品可以像调用SaaS服务一样被调用,从定制化工程项目走向标准化API服务。英伟达创始人黄仁勋在描述GPU计算平台时有一个洞见:当计算能力变成可编程的标准接口,创新才能从硬件层解耦。数据基础设施的意义完全相同——只有数据流通变成标准接口,应用层的创新才能大规模涌现。
目前,国家数据局先后开展两批数据基础设施建设先行先试,推动隐私保护计算、区块链、可信数据空间等6条技术路线落地,并已吸纳了数据编织、数据网格等前沿方向,两批试点累计覆盖15个行业、43个城市,协同1.9万个生态主体,上架3.8万个数据产品,落地超过270个应用场景。这一布局的战略意图,是在应用层高度分散的情况下,在基础设施层建立统一标准,避免未来形成"数据孤岛群"——各行业各地域的数据平台互不连通,重复建设内耗资源。
十、城市治理×数据,全新业态正在成形
当数据基础设施与城市治理深度融合,一种新的产业主体形态将随之浮现——数字孪生运营商。
当城市的交通、能耗、应急、人口流动数据在可信数据空间内融合计算,传统的"系统集成商"角色将发生根本性升级:不再是一次性交付软件系统,而是持续运营数据资产、按城市治理效果分享收益。商业模式类似于云计算从"卖服务器"到"卖算力"的转变——从一锤子买卖变成持续经营的服务关系。
这是数据要素乘数效应在城市治理维度最直接的产业形态,也是数字经济从"信息化"向"智能化运营"跨越的关键节点。率先建立城市数据运营能力的企业,将获得传统IT服务商所无法企及的护城河:数据资产的积累具有时间不可压缩性,越早运营,越难被追赶。
十一、商业模式之困,从"政府采购"到"平台经济"
数据基础设施的可持续运营,面临一个经典的困境:场景培育需要时间,而基础设施投入需要立刻发生。
东营市可信数据空间项目提供了一个有参考价值的样本:总投资2亿元,资本金1亿元,发行专项债1亿元,以"政府债+运营商"的资本结构降低早期投资风险,等待商业场景成熟后由运营收入偿债。试点要求数据空间运营收入不低于总投资的10%,是对这一机制可行性的最低约束验证。
类比云计算的演化路径,数据基础设施商业模式将经历"专有→共有→弹性"三个阶段:
第一阶段:大企业和政府机构自建专有数据空间;
第二阶段:公共数据基础设施向中小机构开放、按需付费;
第三阶段:弹性按量定价,是最终形态。
借鉴云计算的规模经济逻辑,关键在于让固定成本被尽可能多的用户分摊。数据基础设施的商业模式与此相同——目前正处于第一阶段向第二阶段的过渡期,公共数据基础设施的"共有"形态尚未成熟。
收益反哺机制要真正成立,还必须先解决一个更基础的问题:数据使用价值如何计量?传统基础设施(高速公路、电网)的商业模式清晰——谁使用谁付费,计量单位明确(车次、度数)。数据使用的计量维度复杂得多:同一份数据,用于风控建模的价值与用于营销推送的价值可以相差数十倍。可行路径是基于使用场景的分层定价:监管与公共服务场景免费或低价,商业增值场景按效果分成——这一模式已在部分可信数据空间试点中得到初步验证。
当前最关键的风险,是场景培育周期可能长于专项债还款周期,导致"运营收入的成熟速度追不上债务偿还的节奏"。这是未来2至3年数据基础设施投资最需要警惕的系统性风险。
十二、权益分配,三权分离
数据要素市场建设最深层的难题,是同一份数据的"所有权、使用权、收益权"三权分离——技术上可行,法律制度上尚未完成确权。面对不可量化的风险,参与各方倾向于选择不行动。
一份医保数据产品,同时被风控公司、药企和学术机构使用,三方各自产生了不同的商业价值——但原始数据提供方(患者、医院、医保局)如何依据各自贡献分配收益,目前没有可操作的技术方案。区块链存证可以实现数据流转的可追溯,但无法解决"价值贡献量化"这一核心问题。真正的突破点,是建立行业级的数据使用效果归因模型——类似广告行业的归因分析框架,为数据贡献方提供可核验的价值证明。
生态协同磨合不畅,往往不是技术原因,而是时间偏好的错位:政府的考核周期是年度预算与任期目标;平台企业需要3至5年才能看到数据资产运营的规模效益;数据服务商的现金流压力要求6至18个月内回收投入;而某些数据资产(如中医药数据对大模型的训练价值)可能需要10年以上才能充分兑现。
解法是将不同时间偏好的利益进行分层设计:短期给数据服务商服务费以保证现金流;中期给平台企业场景分成获取运营利润;长期给政府数据资产增值实现战略收益。三层收益结构同时成立,才能形成稳定的多方协作动机。
与此对应的分工逻辑,应遵循清晰的边界:政府发放数据使用许可、制定数据质量与安全标准、提供基础设施补贴;平台企业建设数据流通技术标准、运营可信数据空间、提供跨行业的数据产品目录;数据服务商面向垂直行业深度开发数据产品、负责市场拓展与客户服务、将技术能力转化为商业闭环。三方一旦越位——无论是政府直接运营数据产品,还是平台企业深入垂直行业竞争——都会扭曲市场信号,导致生态劣化。
十三、普惠之路,让数据像水和电一样流动
数据基础设施建设的最终目标,是让数据成为像水和电一样的普惠性基础资源。但这条路上,最容易被忽视的障碍,恰恰在最末端。
大城市和大企业的数据问题,是"如何挖掘海量内部数据"。中小城市和中小企业的数据需求,截然不同——本质上是对"降低决策不确定性"的刚性需求,而非对"大数据系统建设"的需求。一个县域制造业企业最需要的,可能只是客户信用评分、上游原材料价格走势、同行业同规模企业的成本基准。这些需求不需要复杂的数据中台,需要的是低门槛的数据API服务和行业基准数据产品。
海关通关数据助力中小微企业降低融资成本这一已验证场景,印证了这一逻辑:公共数据经授权运营商标准化后,以低成本API形式向小微企业提供,直接改变了银企之间的信息不对称格局——这是降低中小企业用数门槛最清晰的成功路径。
中小城市的数据基础设施建设,应优先选择"租用"而非"自建"。大城市可以用财政资金建设本地数据中心,是因为本地数据体量和场景需求足以支撑运营成本;县级城市和三四线城市的数据量和场景密度,根本不支持独立运营。工信部2026年4月推进的"普惠算力赋能中小企业"专项行动,已明确以国家级运营商为主体向中小企业提供按需付费的算力服务。同样的逻辑适用于数据基础设施:由国家级或省级可信数据空间运营商,向中小城市提供"数据基础设施即服务(DaaS)",是实现普惠化最经济的路径。
电力的普惠化,不仅需要电网,还需要标准化的插座接口和电压规格——否则用电设备无法互联。数据普惠化的"最后一公里"同样是标准化问题:当前数据产品的格式、质量描述、接入协议各异,中小企业即使获得了数据访问权限,也往往缺乏技术能力来使用。DeepSeek创始人梁文锋曾指出,真正的技术民主化,是让普通开发者以极低成本使用顶级模型能力。数据要素的普惠化,需要同样的产品哲学:把复杂性封装在基础设施层,暴露简单接口给应用层。类似"数据应用商店"的产品形态——将复杂数据查询封装成一键调用的垂直行业工具——是降低中小企业用数门槛最直接的手段。
尾声:临界点
诺贝尔经济学奖得主罗伯特·席勒曾说,真正的经济变革,从来不只是技术突破,而是技术与制度同时达到临界点时的共振。
数据要素市场的发展,正站在这个临界点上。技术路线已获验证,场景需求已经形成,制度框架正在补位,商业模式尚在摸索——这种"四项同时推进"的状态,既是机遇,也是挑战。从金融风控、工业维护到医保控费,数据要素的乘数效应已不再停留于理论层面。从中医药的知识资产化到城市数字孪生运营商的浮现,新的产业形态已经可以辨认轮廓。
1.9万个生态主体,3.8万个数据产品,270个落地场景——这些数字背后,是一张正在编织的新型基础设施网络。它的意义,不亚于上世纪末互联网骨干网的铺设,也不亚于本世纪初电力网络向农村延伸时那场悄无声息的生产力革命。
下一个问题,只剩一个:谁能最先把标准建起来,谁就能定义这张新电网的插座规格。
参考文章:《财经态度丨“数据要素×”赛道扩容,哪些新场景正加速落地?》,央视财经编辑 任芳言
畅销书:《AI商业进化论:“人工智能+”赋能新质生产力发展》
出版社:人民邮电出版社
作者:田丰
帮助你定位AI当下发展坐标的指南针
帮助你洞察AI未来演进趋势的航海图
通俗化解读AI的原理、特性和四大发展规律、提供AI赋能商业、引发新质生产力变革的一手案例分析。既有宏观视角的全局观照,又有各行业应用层面的下探记录,聚焦AI的原理与实践、现在与未来,是当下AI应用的全景图、更是身处AI技术浪潮之中的探路书。

