返回顶部
返回首页
返回首页
home 您现在的位置: 首页 >今日头条 > 详细信息

词元经济发展,不能止于数据规模

2026年05月12日    阅读量:20     新闻来源:行业资讯在线    |  投稿

近来,“词元”(Token)在互联网上频频“出圈”,对“词元经济”的讨论热度也持续不减。日前发布的《全国数据资源调查报告(2025年)》显示,2025年全国年度数据生产总量达52.26泽字节(ZB),全球占比超27%;词元调用量约21100万亿,呈指数级增长。

  所谓词元,是人工智能大模型处理信息的基本单元。它可以是单个汉字、标点符号,或一个词语片段。我们每次向人工智能大模型提问,以及大模型生成的文字、图片或视频等,都离不开词元的调用和运算。而词元经济,则是指在人工智能领域,围绕词元的生产、调用、分发与结算所衍生形成的新型经济形态。

  可以说,词元正成为人工智能产业发展的“晴雨表”。词元调用量的不断攀升,充分彰显了我国人工智能产业欣欣向荣的发展态势。“养龙虾”全网爆火,让人们切身感受到人工智能不仅会“聊天”,还能“干活”;DeepSeek-V4预览版本正式上线并同步开源,关键性能指标达到国内外领先水平;豆包大模型披露付费计划,尝试在免费版的基础上,推出包含更多增值服务的付费版本,打开国产大模型“价值变现”的商业化想象空间……

  当前,我国词元经济发展方兴未艾,但也面临诸多挑战。比如,在高端制造、金融投资等对精度和可靠性要求严苛的专业领域,从词元数据质量到模型推理过程,国产人工智能大模型的表现还“欠些火候”;“数据孤岛”现象依然存在,公共数据开发利用处于起步阶段,高质量数据集短缺,数据要素流通仍需“拆墙铺路”;利用人工智能大模型生成虚假信息、侵犯版权及肖像权等乱象层出不穷,亟须监管为其“套上缰绳”;人工智能大模型的商业模式尚在探索,清晰且可持续的“生意经”仍待市场验证。

  充分激发词元经济活力,关键在于找准制约词元价值释放的瓶颈所在,精准发力、协同推进,构建起良好的词元经济生态。例如,突破核心算法等方面的技术短板,助力国产大模型在更多实际应用场景中“落地生根”;打破“数据孤岛”,让数据要素更高效地“跑起来”;健全人工智能和数据安全领域的政策法规,为词元的生成、流转及交易划好“红线”;打通大模型商业价值闭环,培育“模型即服务”“智能体即服务”等新业态,实现技术创新与商业模式创新“双向奔赴”。

  推动词元经济健康发展,不应止步于词元规模的快速增长,更应着眼于发展质效的全面提升。唯有系统破解词元经济发展面临的堵点,充分释放数据要素的价值潜力,方能夯实我国人工智能产业高质量发展的根基。

标签:今日头条技术中心
免责声明: 本文仅代表作者本人观点,与本网无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。本网转载自其它媒体的信息,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。客服邮箱:service@cnso360.com | 客服QQ:23341571

全站地图

深圳网络警察报警平台 深圳网络警
察报警平台

公共信息安全网络监察 公共信息安
全网络监察

经营性网站备案信息 经营性网站
备案信息

中国互联网举报中心 中国互联网
举报中心

中国文明网传播文明 中国文明网
传播文明

深圳市市场监督管理局企业主体身份公示 工商网监
电子标识