点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
11月27日,中国通信学会智学大讲堂第二十九期邀请到中国信通院北京泰尔英福科技有限公司iF-Labs负责人焦臻桢博士,带来题为《Web3:人工智能的信任基座》的演讲,报告介绍我们基于“星火·链网”Web3基础设施构建人工智能可信治理框架的基本思路以及已取得的实践及进展,以下为演讲的主要内容。
摘要
人工智能的高速发展也带来了一些新的挑战。越来越多的研究表明,人工智能可能对人类造成伤害,例如:关键场景下的不可靠决策、对特定群体非故意的歧视等;利用人工智能制造虚假信息进行欺诈等犯罪行为也愈发多见。此外,人工智能导致的数据隐私问题和能耗问题等也均不能忽视。如何基于Web3新一代互联网体系架构,从解决Web2.0所存在的信任缺失、数据垄断等问题入手,助力人工智能更好发展,成为领域的热点问题。报告将介绍我们基于“星火·链网”Web3基础设施构建人工智能可信治理框架的基本思路以及已取得的实践及进展。
随着人工智能的高速发展,信任风险越来越不容忽视。最新研究表明,AI可能对人类造成伤害,例如:在关键场景下做出不可靠决策,无意中对某类群体产生歧视等。随着ChatGPT的普及,AI在聊天中产生不恰当甚至违法内容已不再是一件新鲜事;利用AI制造虚假信息、伪造新闻甚至换脸进行欺诈犯罪也日益多见。
数据隐私与安全问题也正在变得愈发突出:人工智能的发展使无差别数据收集愈演愈烈。用户画像需要算法收集个人信息并追踪,商业领域越来越多的企业开始收集个人的浏览记录、购买记录、交易方式、地理轨迹等信息。自动驾驶等往往在车内部署各类传感器或采集终端,以环境信息为对象进行无差别、不定向的现场实时采集,还可能对军事等目标的隐私性产生侵害。
而数据的使用更是缺乏监督手段,隐私保护长期缺位:使用敏感信息进行大规模的模型训练,安全防护和匿名化依然缺失标准,个人数据存在裸奔风险。而这又会恶化数据污染、数据投毒的风险,酝酿出更大灾祸:以数据污染导致自动化决策准确率基于人群特征形成明显的分化,会产生实质性歧视,并对政治生活产生冲击。而在自动驾驶、智能工厂等场景中,数据投毒对人工智能核心模块产生的定向干扰将会直接扩散到智能设备终端,对人身、财产乃至国家安全都造成可怕后果。
另一个不容忽视的问题是人工智能的高能耗:作为主流人工智能技术,深度学习正朝着更大模型、更多参数发展,相应地也就需要更多存储和计算资源。据国际能源署估计,数据中心的用电量占全球电力消耗的1.5%至2%,大致相当于整个英国的用电量。预计到2030年,这一比例将上升到4%。研究显示,训练一个BERT模型会产生约1400磅的二氧化碳排放,相当于一次跨美国往返飞行的排放量。在谷歌发布的2023年环境报告显示,其2022年消耗了约212亿升水,这相当于半个西湖。
面对人工智能发展中产生的问题,可信人工智能的概念(Trustworthy AI)开始受到业界关注。德勤、密歇根州立大学、清华大学等研究团队先后从公平公正、透明与可解释等角度提出了可信人工智能管理框架(如下图),为助力人工智能的健康发展建言献策。
公平公正:避免算法的偏见与歧视。
透明与可解释:有权了解数据如何使用以及人工智能系统如何做出决策。
责任与审计:明确规定谁对其输出负责。
安全与可靠:使人工智能免受可能导致各种伤害的风险;必须像其所增强的传统系统、流程和人员一样强大和可靠;确保为每个新数据集产生预期结果。还需要建立流程来处理不一致情况。
保护隐私:仅将数据用于其声明和商定的目的。消费者可选择加入或不分享其数据。
环境福祉:环境友好,绿色低碳。
通过深入分析这些管理要求,我们发现:现有互联网平台已难以满足可信人工智能的监管需求,必须在工具和平台上有范式级的创新,才可能支撑可信人工智能框架的落地与实现;而Web3正是这样的新型平台,并拥有更加匹配的技术栈。
为什么是Web3呢?首先要从Web3的定义介绍起。
Web3.0最早由英国计算机科学家蒂姆·伯纳斯·李于1998年提出,用于描述让网络更加理解信息本身、更好服务用户的语义网概念。
2014年,以太坊的联合创始人加文·伍德重新提出Web3的设想,希望以区块链为基础构筑全新的互联网运行模式:用户自己发布、保管信息,不可追溯并且永不被泄露,即“去中心化的网络”。
2023年,中国信通院在报告中给出定义:“Web3是互联网体系架构的一个整体演进和升级,通过新的协议和行动,让互联网更加去中心化、更加安全,让用户掌握自己的数字身份和数字资产,从而打破平台垄断,重新定义价值分配规则。”
我们认为,Web3是最适合支撑可信人工智能框架落地的基础网络平台,其原因主要基于以下三点:
01
Web3在基础协议中增加了信任要素,为数据创造了更加安全可信的流通环境
从网络技术演进来看:传统互联网依靠TCP/IP等基础协议确保信息传递实现,但在设计之初缺乏对信任安全和数据价值方面的考虑,导致互联网身份无法自证、信息真实性无法保障。而以区块链为核心的Web3生态中,数字身份与加密资产等技术逐渐成熟,并以协议的形式注入Web3形成“胖协议”架构,从安全、隐私、价值等方面提供更多原生能力,足以支撑更加安全可信的数据流通,保障更丰富的数据经济形态。
02
Web3推动了数据的要素化,赋予了对数据进行更高效管理和流转的价值动机
这是从经济层面的视角:传统互联网围绕平台构建经济模型,数据价值服务通常被平台商以免费的方式提供给用户,致使其无法有效实现获利,互联网内容创造者经济动力不强,平台形成数据寡头,核心盈利被巨头控制。而Web3可以让个体掌控自己的数据,对数据类业务赋予更加自由灵活的价值分配模型,让网络所有者、内容提供者和活动参与者更积极地参与到价值分配中,提升数据要素的流通和市场化配置,为新一轮科技和产业革命提供新动能。
03
Web3推动从云计算迈向链计算,使信任融入计算内核,在隐私可信的前提下完成数据计算
从计算模式来看:传统互联网高度依赖于云、数据中心等特定中心化基础设施,无法摆脱单点依赖,导致大量数据的汇聚,也使单点极易受到攻击,伤害了隐私、安全、绿色。而在Web3使能的分布式计算中,用户数据均存储在本地或去中心化的网络中,不再依赖特定的服务商或服务器,数据安全隐私自治的前提得以达成,“数据不动计算动”使“数据不动价值动”得以更快地落地实现。
在这里,我们也对AI与Web3相结合的新型计算进行畅想,提出新型的计算框架(见下图)。在这一框架中,Web3通过分布式计算的组织形式,基于分散存储的个人数据隐私化地完成人工智能所需计算,并在此过程中通过NFT、DID等技术保证数据的要素化和价值流动。
2020年,由中国信通院牵头,联合多家大型机构,“星火·链网”工程启动。目前,“星火·链网”已取得了很好的进展,并开始在全球推广,正逐步成为我国Web3实践的重要基础设施。基于“星火·链网”的底层区块链能力,现已产生大量可服务于产业区块链应用规模化发展的大场景,包括存证服务、DNA服务、溯源服务等。
泰尔英福iF-Labs也基于“星火·链网”,在构建Web3可信人工智能框架的思路下,开展了一系列创新尝试:
首先是探索可信的智能计算:我们正在建设基于“星火·链网”的可信算力服务平台,基于Web3实现大规模分布式算力的组织与调度,以满足未来对人工智能无处不在的计算需求。
其次是打造可信的工业数据应用:我们提出基于“星火·链网”和星火身份的新型工业互联网联邦学习框架,实现边缘侧的联邦学习来处理和分析数据,从而生成工业边缘智能模型,满足工业互联网计算对数据隐私要求的不断提升,并为更大规模的工业数据的聚合应用提供技术基础。
最后是探索可信的人工智能生成内容的管理:基于“星火·链网”和星火身份打造面向AIGC的可信标识技术,在可信人工智能管理框架下,实现对AIGC内容的高水平监管。
最后,我们总结并展望未来:
AI和Web3被誉为新数字革命的两大先驱,它们一定会深刻改变我们与互联网的互动方式。AI代表了新的生产力,Web3代表了新型的生产关系,Web3的新型协议与价值交换范式,更适合于促进数据这一新型生产要素的调配,也就更利于驱动AI这一新生产力的发展。二者的深度融合必将开启数字经济的新篇章。
我们还认为:AI+Web3的最佳实践空间一定是新型的数字空间,例如元宇宙。