点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

以域名系统为代表的各种标识体系,在互联网演进过程中起到了至关重要的作用。其中域名、IP地址、AS号码等网络基础资源的管理涉及到不同国家和地区对名字空间的自主权利和发展空间,域名解析系统、工业互联网标识解析系统等网络基础设施的服务又涉及到网络的互联互通和稳定运行。
近年来,随着大语言模型、多模态大模型及具身智能、人形机器人、智能体等新一代人工智能技术的快速发展和实践应用,对科学研究、生产制造、生活服务都带来了巨大的影响和变革。
那么新一代人工智能的技术产业中有哪些要素需要标识?原有的域名系统、工业互联网标识解析系统等能否满足这样的需求?反之,新一代人工智能技术是否又会引发原有标识系统自身的变革?是否存在构建AI原生标识体系的必要性和可行性?正是基于这样的考虑,我们希望对上述问题展开思考,为业界相关探索提供参考。
新一代人工智能技术产业图谱通常包括三层,即第一层是基础层,包括数据要素和算力资源;第二层是模型层,包括底层开发框架、中间件与工具链、核心算法与模型、模型服务与交付;第三层是应用层,包括生成内容、软件应用、硬件产品、解决方案。本文首先对各层中关键要素单元在身份标识方面的技术需求进行分析,然后系统性梳理国内外学术界和产业界最新研究成果和实践进展,最后我们总结这些需求和探索背后新一代AI标识所呈现的根本性特征转变。

AI基础层标识需求及方法
1数据要素的起源标识(DP-ID):AI的“出生证明”
从原始数据到数据集资产,数据要素环节中的多个单元都存在着标识需求,包括原始语料、多模态数据切片、高质量数据集、知识库等。其本质问题是将数据资源的物理属性(例如存储位置)与社会属性(例如权属、合规性)进行解耦,是实现数据要素市场化流通和配置的关键。
学术研究主要包括原始数据标识、数据集标识、语料库标识、向量数据库标识等,产业实践例如Hugging Face Datasets、Databri cks Unity Catalog、Google Dataset Search等。
2算力资源的联网标识(CPN-ID):AI的“调度指令”
算力资源环节中的标识需求,并不是对AI芯片、AI服务器等物理设备进行盘点所需的标识,也不是算力集群、算力中心内部管理中的节点标识,而是对算力资源进行查询和调度的标识。其本质问题是解决算力供应商与算力使用者之间的供需对接,意味着算力设施从“私有设备”向“公共设施”的转变,是对计算能力服务化和统一大市场的有力支撑。
学术研究主要包括基于IPv6(SRv6)、基于资源度量模型等方法,产业实践例如英伟达GPU远程证明、DePIN网络中的io.net和Render Network等项目。
AI模型层标识需求及方法
1算法模型的能力标识(MC-ID):AI的“制造能力”
模型层的算法、框架、基础大模型和行业大模型等对标识的需求基本类似。其本质问题是从关注主体身份转向关注事实行为,通过对算法和模型的标识来记录“制造”的过程,从而提供治理的“抓手”,构建一个安全、透明、可信的AI算法供应链,使得从模型开发、测试、部署到调用的全链路可追溯,是连接技术实现与法律监管的桥梁,也是实现负责任AI和AI对齐的重要技术保障。
学术研究主要包括模型水印(分为白盒水印、黑盒水印、灰盒水印等)、模型指纹等方法,产业实践例如Hugging Face Model Hub、Google Sigstore/Gitsign、MLflow。
AI应用层标识需求及方法
生成内容的溯源标识(CC-ID):AI的“数字水印”
AIGC生成内容(文本/图像/音频/视频)的标识需求,本质问题是为数字内容的“真实性”和“原创性”提供一个可计算的信任锚,试图在“一切皆可生成”的时代重建信息的确定性,将内容消费从盲目信任转变为基于凭证的验证。
学术研究主要包括主动水印、被动检测、检索增强等方法,产业实践例如Google DeepMind SynthID、Meta Stable Signature以及C2PA标准等。
智能体的身份标识(Agent Subject ID,AS-ID):AI的“应用权限”
(1)需求分析
以智能体为代表的AI软件应用,还包括数字人、智能助手、AI搜索等,其标识需求并不完全相同,例如智能体标识侧重“行为逻辑与交互权限”,数字人标识侧重“外貌形象与知识产权”。但此类标识的本质问题是数字社会的“公民身份”,即消费者从人类社会的主体身份到数字世界后如何延伸与重构。这不仅是技术问题,还涉及到治理规则和法律规则,是构建未来人机物三元共生社会秩序的基石。
学术研究主要包括基于密码学与DID、基于代码与运行环境等方法,产业实践例如MCP、AP、uAgents Framework、OpenAI Assistants API等智能体协议或框架中涉及到的标识方法。
具身智能的时空标识(Spatio-temporal Entity ID,STE-ID):AI的“物理锚点”
(1)需求分析
以具身智能为代表的AI硬件产品,还包括人形机器人、AI PC、AI手机等。与虚拟主体截然不同,此类对象的标识侧重“物理安全”、“硬件绑定”、“准入许可”。其本质问题是物理世界的“安全契约”,即不仅是身份证明,更是安全责任的锁定机制,必须具备比虚拟对象标识更高的防伪等级和实时响应能力。
学术研究主要包括基于“物理不可克隆函数”(PUF)的硬件指纹、基于“物理行为”的指纹、群体智能的分布式标识等方法,产业实践例如波士顿动力机器人、无人机行业的“远程 ID”、智能家居行业的Matter 协议等。
基于本文对新一代AI技术产业三层中各单元对标识技术的需求梳理,当我们跳出单一的数据、模型或应用层级,用全局视角来思考新一代 AI 标识技术时,可以提炼出以下 5 大共性趋势与核心特点:
从“静态化标签”向“富语义容器”演进
传统的互联网标识(如URL、IP、UUID)通常只是一串无意义的字符,仅起到“指向”作用。而在新一代AI中,标识正在语义化。
例如本文中提到的数据要素ID携带了版权、伦理、合规信息,算力资源ID携带了碳排放、延迟、任务类型信息,算法模型ID关联了训练数据清单、能力边界声明。因此,标识系统正在从“索引工具”转变为“知识图谱的节点”,让机器看到标识就能理解对象的属性、能力和限制。
从“纯软件逻辑”向“软硬网绑定”下沉
为了解决纯软件标识容易被篡改、复制的问题,新一代AI标识技术正在穿透应用层,向更底层的物理硬件和网络协议扎根。例如本文中提到的具身智能ID涉及到PUF(物理不可克隆函数)、TEE(可信执行环境)和RF指纹等技术。这意味着标识的生成不再依赖操作系统的随机数生成器,而是依赖芯片制造的微观物理缺陷或射频特征。例如本文中提到的算力资源ID采用SRv6技术将应用层的算力需求直接编码进网络层的IPv6报头中,打破了OSI七层模型的严格界限,实现了“应用感知网络”。
从“被动式查询”向“主动式感知”转变
传统标识及其可关联信息大多数是静止的,而在新一代AI体系中,标识所代表的对象往往是动态变化的。例如算力资源ID需要反映GPU此刻是“忙”还是“闲”,智能体ID需要根据运行代码的完整性来决定身份是否有效。因此,标识不再是一次性分配,而是能够动态反映资源的实时状态和可用性。
从“寻址与定位”向“治理与确权”延伸
传统的互联网标识大多用于在公共网络中解析寻找资源的地址,而在下一代AI体系中,标识技术的首要驱动力不再是“找不到资源”,而是“管不住资源”,标识技术被赋予了极强的治理属性。例如无论是数据要素ID、算法模型ID还是生成内容ID,其核心目的都是为了确权、溯源和追责。同时,标识也将成为法律法规在技术落地的抓手。通过标识来区分“人类生成”与“AI生成”,通过标识来执行“被遗忘权”。
从“网络设备级”向“高分辨率级”细化
传统的互联网标识大多用于在公共网络中识别可联网通信的主机、服务器,随着AI处理精度的提升,标识的对象颗粒度正在急剧细化。甚至从文件级深入到向量级、Token级,从模型整体深入到权重参数级,从单一设备深入到时间空间切片。这种高分辨率标识能力,使得AI系统能够进行更精细的数据清洗、更精准的算力调度以及更隐蔽的水印嵌入。
综上所述,发展新一代AI对标识技术的需求非常强劲,但同时也非常复杂、富有挑战性,可能会改变我们过去标识及其解析服务体系的概念范畴认知,也可能迫使其发生根本性的范式变革。
(本文和配图在大模型辅助下完成)
作者:刘阳 中国信息通信研究院工业互联网与物联网研究所副所长,博士,正高级工程师,兼任工业互联网产业联盟AII标识工作组主席、中国通信标准化协会CCSA物联网总体组组长等。
金键 中国信息通信研究院工业互联网与物联网研究所所长,博士,正高级工程师,兼任中关村区块链产业联盟秘书长等。
