本版导航 各版导航 视觉导航 标题导航
选择其他日期报纸
历史数字报

你好,词元!

桂林日报 新闻    时间:2026年03月31日    来源:桂林日报

  □尹之口

  在3月22日至23日举行的中国发展高层论坛2026年年会上,国家数据局从官方角度上为Token给出了翻译:“词元”。局长刘烈宏表示,Token“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”,为商业模式的落地提供了可量化的可能。
  Token这个英文单词由来已久,源于计算机科学中对文本最小语义单元的抽象定义,其中文译名一度五花八门,如“令牌”“代币”“通证”等。将“Token”正式定名“词元”,既保留了“Token”在自然语言处理中的本义,又赋予其在数据要素市场中的全新内涵——它不再只是技术术语,更是数据确权、流通与交易的基础单元。
  工业时代产生了“工时”,互联网时代催生了“带宽”,自媒体时代定义了“流量”,而人工智能时代则孕育出“词元”。它是模型处理信息的最小计量单位,无论是用户的提问,还是AI生成的代码,皆被拆解为词元序列进行运算,为AI产业的价值结算、商业模式评估提供了统一标尺。在人工智能席卷世界的浪潮中,“词元”所统一的命名与度量体系,将有助于我国在全球AI竞争中掌握价值定义权。
  下一步,我国将持续推进数据赋能人工智能创新发展,协同各方深入实施新一轮的“高质量数据集建设行动计划”。
  对于广西而言,“词元”不仅是一次术语的本土化适配,更是撬动“北上广研发+广西集成+东盟应用”跨境产业生态的关键支点。
  在当前“Token出海”成为趋势的背景下,广西作为面向东盟的前沿和窗口,借助统一的词元度量体系,具备率先构建跨境AI服务结算标准与跨境数据流通规则互认的天然优势。无论是面向东盟的多语言智能翻译、跨境电商智能客服,还是农业、文旅领域的AI监测系统,都能以词元调用量为依据,实现跨境服务的精准计价与高效结算,打破不同国家、不同场景下的价值度量壁垒。
  面向东盟的人工智能合作高地,核心在于数据与场景的双向赋能。广西拥有丰富的跨境数据资源与多元应用场景,例如边境贸易的智能报关、东盟农产品的溯源监测、文旅资源的智能推广等。这些场景的落地,都需要高质量数据集的支撑。
  随着“高质量数据集建设行动计划”的深入推进,广西将迎来绝佳契机——通过整合本地特色数据,对接北上广的研发能力,打造“AI就绪”的数据集,进而以词元为纽带,将数据价值转化为可量化的服务供给。当东盟市场的需求通过词元调用量反馈回广西,又能反向推动北上广研发机构优化模型,形成“研发—集成—应用—反馈”的闭环生态。
  词元,欢迎你!以统一的价值标尺贯通“北上广研发+广西集成+东盟应用”的全链条,在面向东盟的人工智能发展中,能构建起独具特色的产业生态与价值体系。此时,我们要自信地说:你好,词元!
  (来源:《广西日报》)