炸了!Token 中文名官宣 “词元”,多年混乱终落幕

2026年3月,科技圈出了个大事,在国务院新闻办公室的新闻发布会上,国家数据局局长刘烈宏正式宣布,人工智能大模型领域的核心术语Token,标准中文名字确定为“词元”。这个官宣,结束了多年来Token译名混乱的情况,以后不管是学术研究、产业落地,还是官方监管、大众科普,都有了统一的中文说法。作为AI时代的核心基础单元,“词元”是大模型处理信息的最小单位,也是连接技术供给和商业需求的“结算单位”,它的定名,是我国AI产业走向规范的必然,也意味着智能时代的术语体系变得更完善了。

 

定名之前,译名乱得很,行业被困扰多年

AI热潮起来之后,Token这个词经常出现在大家眼前,它是评估大模型调用量的标准,也是厂商销售套餐的计费单位,普通人用AI工具时,它也在悄悄影响使用体验。但这么多年来,这个高频术语一直没有统一的中文名字,各种叫法混在一起,特别乱。

不同场景、不同人群,对Token的翻译都不一样,科技企业、学术机构、媒体报道,各说各的。互联网领域常叫它“令牌”,区块链场景又译成“代币”“通证”,AI行业内部还出现过“智元”“模元”等好几种叫法。甚至同一个企业的不同部门,叫法都可能不一样,比如某大厂的技术文档里叫“令牌”,市场宣传时却用“模元”。

这种混乱给行业发展带来不少麻烦。高校教授在课堂上讲课时,得先解释好几种译名对应的都是一个东西;企业之间合作搞技术,得先确认双方说的Token到底指的是什么;普通用户接触AI产品时,看到“代币计费”“令牌消耗”这些说法,往往摸不着头脑,搞不懂到底是什么意思。某AI创业公司的技术负责人说,之前就因为译名不统一,合作方理解错了意思,导致项目对接耽误了一周。

数据显示,到2025年底,全网关于Token的中文译名有12种之多,其中“令牌”“代币”“词元”这三种叫法用得最多,分别占38%、29%、17%。这种混乱不仅拖慢沟通效率,还阻碍了AI知识的普及和产业的规范发展,早就需要一个官方统一的标准了。

最终定“词元”,为啥不选其他叫法

很多人都好奇,那么多译法里,为啥最后选了“词元”当官方标准。这个选择不是临时拍板,而是结合学术传统、技术特点和实际使用场景,经过多方论证才定下来的,既贴合Token的核心意思,也符合中文术语的命名规矩。

先看“词”字,精准对应了Token在AI领域的核心特点——和语言、语义相关。在自然语言处理、大模型这些场景里,Token本质上就是处理文本的基本单元,既能是完整的词语,也能是子词、单个汉字或者标点符号,覆盖所有有意义的语言片段,比“字”“字符”更准确,还能和区块链里的“代币”、网络安全里的“令牌”这些其他场景的Token译法区分开,不会弄混。

再看“元”字,突出它“最小、不能再拆分”的基础属性。就像像素是图像的最小单元、字节是数据的最小单元一样,“词元”就是大模型思考、处理信息的“最小砖块”,适配从词级到子词(BPE)的分词技术,能统一理论和实际应用场景。比如把“不高兴”拆成“不”和“高兴”两个词元,大模型就是通过处理这些基础单元,实现对语义的理解和内容生成。

更关键的是,“词元”不是新造的词,早就在学术领域用了很多年。全国科学技术名词审定委员会在《计算机科学技术名词(第三版)》《语言学名词》里,早就把自然语言处理场景下的Token规范成“词元”了。人民日报2026年1月发表的《漫谈词元》科普文章,也明确把Token定义为“词元”,苹果中国官网、央视新闻等权威机构的技术文档,也已经同步用这个译法了。这次官方官宣,只是给这个学术规范,加上了产业层面的法定效力。

定了“词元”后,对行业和普通人有啥用

“词元”正式定名,看着只是统一了一个术语,实际上对AI产业发展、学术研究和普通人使用,都有实实在在的影响,这种影响渗透在行业的每一个环节里。

对学术研究来说,统一译名能避免研究成果传播时出现歧义,方便国内外学术交流。以前,国内学者发表论文,得额外标注Token的中文译法和含义,国外学者理解中国的研究成果时,也经常因为译名混乱产生误解。现在“词元”成了标准,学术论文、教材、研究报告都会用统一的说法,大大降低了交流成本,能帮AI学术研究更好地协同推进。

对产业界来说,译名统一能推动技术落地和商业规范。目前,我国每天的词元调用量已经突破140万亿,和2024年初的1000亿相比,两年时间增长了上千倍,词元已经成了AI产业商业化的核心结算单位。不管是大模型厂商的计费套餐,还是企业AI服务的成本核算,都会以“词元”为统一标准,不会再因为译名不同,出现计费纠纷和成本核算混乱的情况。阿里“TokenHub”平台已经率先完成更名,把原来的“Token调用量”改成了“词元调用量”,之后会有更多企业跟着调整。

对普通用户来说,“词元”定名能让大家更清楚AI工具的使用逻辑。比如用AI生成文章时,平台提示“剩余词元1000”,用户能直观知道还能生成多少内容;选AI套餐时,“100万词元/月”的说法,比“100万Token/月”更容易理解,能有效降低大家的使用门槛。

 

光定名不够,后续还得大家一起发力

“词元”正式确定,只是AI术语规范化的第一步。目前,还有部分企业、媒体和个人习惯用以前的译法,短时间内很难完全改过来。同时,AI领域还有不少像Token这样的术语,也存在译名混乱的问题,还需要进一步规范。

权威机构要发挥引导作用,全国科学技术名词审定委员会可以加快梳理和审定AI领域的术语,慢慢完善智能时代的术语体系;国家数据局可以出台相关指引,推动企业、学术机构、媒体一起用“词元”等标准译名,对不规范的使用行为适当引导。

企业方面,要主动统一内部的术语,在技术文档、产品界面、市场宣传里,都用“词元”代替以前的译法,同时向用户普及“词元”的意思,帮助大家快速适应。比如AI工具可以在设置界面加个“词元说明”,简单介绍它的定义和使用规则,降低用户的理解难度。

学术和教育领域,高校要及时更新教材和课堂说法,把“词元”作为标准术语教给学生;科研机构发表研究成果时,严格用规范的译名,带动行业形成好风气。媒体要发挥传播作用,报道时统一用“词元”,帮着普及这个术语。

瓦特代表蒸汽机时代,安培代表电力时代,比特代表互联网时代,每个时代都有自己标志性的基础单位。“词元”的定名,结束了Token译名混乱的局面,也标志着我国AI产业从快速发展,转向规范发展。它作为智能时代的“基本计量单位”,会跟着AI技术的普及,走进生产生活的各个方面,见证我国人工智能产业的高质量发展。