AI术语中文名定了APPSO
2012年,张一鸣给新公司取名,用了一个计算机术语做名字——字节。
这大概是中国科技公司里最让人服气的一个名字。两个字,有技术感,有力量感,认知成本几乎为零。你不需要懂计算机,只需要认中文,就知道“字节”说的是某种文字层面的基本单位。
干净、准确、过目不忘。能拿一个术语做公司名且毫无违和感,这本身就说明这个词翻译得有多好。
现在,“字节跳动”成了全球价值最高的独角兽公司。但要是问你:如果当年那家公司叫“存储单位跳动”,你还觉得那么自然吗?
别笑,这就是最近AI行业在发生的事。
别吵了,Token最好的中文翻译一直在那儿
上周大家对于Token该翻译成生什么吵翻天“模元”“智元”“灵符”“令牌”“偷啃”……社交媒体隔段时间就会掀起一轮争论,每次都以各说各话收场。
这些候选词各有各的巧思,但放在一起看,你会发现:大家都在比谁更有灵气、更有意境,却没人先问一个最根本的问题——Token在技术上到底是什么?
它不是“智能”的单位,不是“模型”的单位,它是语言处理的最小单位。
“灵符”有东方赛博美感,但术语不需要意境,它需要精确。
“智元”大气,但Token是语言的处理单位,不是“智能”的单位,往上贴“智”字是贴错了标签。
“令牌”最离谱,这是Token在计算机安全领域的既有译法,特指身份验证凭证,拿来混用等于把银行卡和扑克牌叫同一个名字。
“偷啃”这种音译就完全丧失了中文的优势了。
其实在这场混战之前,答案早就在那里了。
在自然语言处理(NLP)学术文献里,Token作为文本的最小处理单位,长期被译为“词元”。
词,指向语言属性;元,指向最小粒度。两个字,一个管归属,一个管层级。
苹果就采用了这个译法。打开Apple中国官网,产品详情页写着“词元响应速度”。
要知道苹果的中文本地化团队是出了名的较真——AirDrop叫“隔空投送”,LiveText叫“实况文本”,每个词都是反复推敲的结果,目标只有一个:准确、简洁、有造词美感。
苹果选了“词元”,绝不是心血来潮。无独有偶,在央视新闻节目里,Token同样被译作词元。
当苹果和央视不约而同选了同一个中文翻译,其实已经形成了事实标准的雏形,只是差更多人开口。
翻译界有句老话:好的翻译不是发明,是发现——发现那个本该如此的中文表达。
APPSO认为,词元是唯一一个同时满足信、达、雅三个标准的翻译。它准确(信),一看就懂(达),有术语的凝练和古典感(雅)。
这场争论,其实没什么可吵的。
“提示词”,AI时代最将就的翻译
Token的问题可以收场了。Prompt的问题,才刚刚开始。
目前业内通用叫法是“提示词”。三个字,好懂,传播也广——但说实话,这个词不够用,早就不够用了,只是没人较真去捅破这层窗户纸。
“提示词”的问题不在于它翻译错了,而在于它把“提示”把权力关系翻反了。
你写一段systemprompt,定义模型的人格边界,规定它只能做什么、不能做什么,指定输出格式和语气——这叫“提示”?这是在下令。
“提示”暗含的逻辑是:模型是主角,人在旁边小声提醒它一下。但真实的权力结构恰恰相反,是人在驱动模型。一个译名把主语关系弄反了,这就不只是措辞问题,是认知框架问题。
“词”字还把格局说小了。现在的prompt早就不是一两句话的事。Anthropic内部的systemprompt有几千字。企业级RAG应用里,一条prompt可能塞进了整本产品手册。用“词”来描述这个东西,就像用“便签”来形容一份合同——你也没说错,但你说小了。
而且你看像素、字节、词元,清一色两个字。两字词在中文里天然带有凝练感,是能进教科书、进国标文档的形态。“提示词”三个字,更像是技术社区里约定俗成的口语简称,不像一个严肃的技术命名。
好比当年把byte翻成“存储小段”、把pixel翻成“图像色点”,不是不能用,是将就。
“提示词”就是AI时代最将就的翻译之一。
“文令”Prompt
APPSO的提议是:Prompt,应该翻译为“文令”。
说理由之前,先说这个词怎么推敲出来的,过程本身就是最好的论据。
最初我们想到的是“句令”。句,成句的文字;令,命令、指令。古典美感十足,读起来也响亮有力。
但仔细想有个漏洞:“句”暗示prompt是“一句话”。现实中,prompt可以是一个词,可以是三段话,可以是五千字的系统指令——“句”给了它一个不存在的边界限制。
如果换成“文”,这个问题就消失了。
一字,是文字。一句,是文句。一段,是文段。一篇,是文章。不管prompt长成什么样,“文”都接得住,没有边界焦虑。
于是定了,Prompt就是文令。
文——文字、文本、文章。Prompt的载体永远是文字,不管是闲聊一句还是Agent编排指令,物理形态就是文。“文”不是修饰,是对prompt本质形态最直接的命名。
令——命令、指令。Prompt的功能是驱动模型执行。写下一段文字,模型照着意图去生成、推理、行动。“令”精准地捕捉了这个动作——人在向模型发号施令。
文=它是什么(形态)。令=它做什么(功能)。
两个字,一个管形态,一个管功能,各司其职,合起来刚好是prompt的完整定义。
像素·字节·词元·文令,一条从机器通往人的路
把“文令”放进更大的坐标系里,会看到让人心跳漏半拍的东西:
像素(pixel)→眼睛看见的世界的最小单位
字节(byte)→机器存储的世界的最小单位
词元(token)→模型理解语言的最小单位
文令(prompt)→人类驱动模型的最小单位
四个词,同一套构词逻辑:载体属性+功能属性。
像素——像(图像)+素(元素)。
字节——字(文字)+节(片段)。
词元——词(词语)+元(原始单位)。


