当前生成式人工智能治理面临的挑战
2024-01-26 09:56:27
来源:青年记者2023年11月下 作者:曹开研
摘要: 摘 要:生成式人工智能快速发展引发对其伦理价值和社会影响的广泛讨论。要完善监管沙盒制度、探索敏捷治理机制、注重法律统筹和技术治
摘 要:生成式人工智能快速发展引发对其伦理价值和社会影响的广泛讨论。要完善监管沙盒制度、探索敏捷治理机制、注重法律统筹和技术治理,探索生成式人工智能“有限开放”发展的道路,确保生成式人工智能发展可信、可靠、可控。
关键词:生成式人工智能;监管沙盒;敏捷治理;大模型
当前,生成式人工智能发展高歌猛进,国内互联网厂商和研究机构纷纷发布大模型,群雄逐鹿间展示出“重塑世界”的野心。然而,智能非万能,生成式人工智能商业化应用引发其伦理价值和社会影响的广泛讨论。由于对其应用前景和蕴含的风险预测有限,在呼之欲出的智能社会即将到来之前,各国都在探索生成式人工智能“有限开放”之路。贯彻“以人为本”和“智能向善”理念,确保生成式人工智能发展可信、可靠、可控成为治理的主要方向。在我国大模型如火如荼发展的背景下,国家网信办会同七部委于近期发布并实施的《生成式人工智能服务管理暂行办法》,成为我国首部针对生成式人工智能的法律规章,为筑牢人工智能监管“桥头堡”提供了纲领性文件。在此基础上,深刻理解生成式人工智能治理逻辑脉络,才能更好地迎接技术快速迭代中的治理挑战。
理性看待生成式人工智能掀起的“AI浪潮”
(一)革命性:“强人工智能”具备重塑世界的潜质
对人工智能较早的定义是1956年麻省理工学院学者约翰·麦卡锡于达特茅斯会议上提出的。最初的人工智能理论希望机器的行为看起来像人所表现出的智能一样。“像人一样思考”“像人一样行动”是早期对人工智能的主要论断。随着生成式人工智能等“强人工智能”的出现,人工智能理论认为,计算机不仅是用来研究人思维的一种工具,只要运行适当的程序,计算机本身就是有思维的。生成式人工智能作为“强人工智能”的代表,显示出真正的推理和解决问题的能力。由美国OpenAI公司研发的ChatGPT人工智能聊天机器人,由其深度学习模型形成的“心智”能够高度模仿人类对话,引发广泛追捧和新一轮的“AI浪潮”。一些主流观点认为,生成式人工智能犹如“第四次工业革命”,具有重塑世界的潜质,不但是科技竞争的制高点,也是未来重要的智能基础设施。
(二)落脚点:生成式人工智能与生产力结合尚有距离
生成式人工智能发展基本遵循了两条路径,一是面向普通用户(to C)的人工智能模型开发,二是与行业垂直领域(to B)的结合。大模型需要大算力,由于大模型训练成本高,投入周期长、风险大,技术应用面临着亿元级别的研发投入与训练试错。因此,与生产力形成有效结合,能够创造价值的应用场景是大模型升级迭代的基本支撑。当前来看,国内厂商虽然发布模型数量众多,算法、算力、数据优势方面各有侧重,然而,研发力量分散,应用场景不足也是面临的主要问题。较为成熟的互联网公司将模型与已有应用结合,形成AI助理,服务于用户提问、订机票、订外卖等,而一些初创公司的模型如果没有落地的场景,则缺乏持续优化的可能。长远看,大模型的真正价值在于对生产流程的再造,利用智能化的推理分析能力,优化行业管理,提升行业效率,这一结合尚需时日。
(三)边界感:生成式人工智能引发根本性的伦理关切
生成式人工智能作为当前最具代表性的颠覆性技术之一,将信息传播由传统媒体时代的单向传播、“自媒体”时代的多元化传播带入智能时代的自动生成传播,在带来巨大发展红利的同时,生成的不确定性引发根本性的伦理关切。人工智能技术的误用和滥用可能侵犯人的各项权利,加剧歧视和偏见,冲击现有的伦理和法律体系。当前,生成式人工智能的发展似乎更多关注技术的兴奋点而失去了伦理的边界感,各种侵犯著作权、隐私权的智能创作不断出现。一般来说,风险越高的人工智能系统,需要越高程度的监督,以保证生成式人工智能的使用符合人的价值观和道德观,获得更高的社会接受度。
当前我国生成式人工智能治理的主要挑战
(一)思维“对齐”中暗含的意识形态立场
语料是生成式人工智能发展的关键。以ChatGPT为代表的生成式人工智能训练语料主要来自英文,这些语料通过开源数据、网页爬取、私有数据集等方式获取,通过模型学习训练,再与人类思维方式“对齐”生成相关内容,生成内容有着较强的“国籍感”和“政治立场”。当下,国内可用于生成式人工智能模型训练的经过加工、清洗、标注的高质量语料缺乏,涉及中国文化、历史等方面的语料夹杂大量涉及意识形态、歪曲事实等的有害信息。图书文献类、学术论文类的高质量中文内容数据不足,更多研发语言模型的公司希望拥有更高质量的数据。以金融垂直领域大模型应用为例,公共互联网的金融数据显然没有来自银行、信托、保险等专业公司的数据更有价值。确保《生成式人工智能服务管理暂行办法》中要求的“准确性”,避免冒犯性言论,减少潜在的政治偏见或性别歧视等内容,是生成式人工智能发展和治理中的重要挑战。
(二)算法“黑箱”形成的信息安全隐患
智能应用背后,算法能否做到技术中立,受到越来越多质疑。除了OpenAI等大型科技公司以外,几乎没有公司愿意从头开始构建底层的语言模型,许多公司根据ChatGPT的开源数据或购买访问权限,结合自己的使用目的来对专业数据进行调整,算法决策的模型、参数、权重、数据来源等基本处于“黑箱”状态。不少人相信,算法通过挖掘用户行为数据来判断用户的内容偏好,这些程序在编写代码之初就已经被植入某种价值观。此外,从技术设计角度来看,机器获取数据集的不均衡、特征选取的偏差等导致偏见常常出现于机器学习过程中。技术带来的“算法偏见”被不断实践和放大,加剧了对价值判断的影响。此外,在计算机深度学习能力不断加深的同时,通过智能化修改、操纵合成的内容出现,算法的安全性评估成为智能治理的重要挑战。
(三)“跨模态”生成造成的监管困境
生成技术的发展可将文本提示转化为高质量的视频片段,生成的内容从可读到可视、从静态到动态,重塑了信息生产和信息传播的方式。随着多模态能力的拓展,当下跨模态的生成除了文本、图像、音视频等,用于红外辐射分析温度、运动轨迹的智能生成模型也不断出现,还原了人类以多种方式观察理解世界的能力。连接尽可能多的感官,如触觉、语音、嗅觉、大脑分析等将使得以人为中心的人工智能模型更加丰富。但是,“跨模态”数据的生成目前面临的重要挑战在于难以做到准确的评估。例如文本生成、语音生成、图像生成等“跨模态”数据并没有一个完全公认的标准用于评估其正确性。每个人心中都有自己的哈姆雷特、每一种模型都有自己创作的立场。总体而言,实现“跨模态”生成,是生成式人工智能技术前进的重要一步,是其在艺术创作、虚拟现实等多领域运用的重要目标。但其创作的高度主观性、多重解释性对生成式人工智能的法律规制和监管带来新的挑战。
对生成式人工智能监管的思考
(一)完善监管沙盒制度,有效把控预训练模型风险
监管沙盒起源于金融领域对新型金融产品风险把控的实验机制,可有效把控产品进入市场前的风险。生成式人工智能作为一种不可预测性较强的产品同样有必要引入监管沙盒,在2021年欧盟《AI法案》中,就引入了“AI Regulatory Sandbox”概念,要求欧盟成员国在法案生效前至少建立并投入使用一个人工智能监管沙盒,以为产品正式进入市场前遵守《AI法案》情况进行验证。2023年《AI法案》折衷草案中,对监管沙盒的设立有了更加明确的标准,增加了监管沙盒中个人数据使用和沙盒实验造成损失的责任要求,规定了沙盒设立机构从沙盒设立开始每年提交报告直到沙盒终止。当前,随着我国大模型的快速发展,完善监管沙盒制度有利于把风险控制在模型预训练阶段,在正式投入市场前做好充分的风险评估和把控,减少对社会秩序的冲击。
(二)提升敏捷治理能力,适应智能应用快速迭代要求
生成式人工智能快速迭代的特点和革命性的改变对政府治理能力提出更高要求。早在2019年国家新一代人工智能治理专业委员会发布的《新一代人工智能治理原则——发展负责任的人工智能》中,就提出了人工智能敏捷治理原则。当前,敏捷治理的价值并不只体现在“快”上,保持监管的灵活性、适应性,促进多元主体共同参与等更是敏捷治理核心价值的体现。在推动人工智能有序发展的同时,要及时发现和解决可能引发的风险,优化管理机制,完善治理体系,对未来更高级人工智能的潜在风险持续开展研究和预判,确保人工智能始终朝着有利于人类的方向发展。
(三)注重立法统筹,加强技术治理能力
我国人工智能领域的法律法规伴随着行业的发展逐步完善。针对算法、深度合成等特定领域,数据安全法、个人信息保护法等法律法规已经推出,这些同样适用于人工智能领域。但缺乏统一的人工智能立法,也会导致特殊领域立法在内容上重合,造成法律规定重复冗杂,做好立法统筹,横向立法和纵向立法兼顾,保证法律法规制度间有效衔接是重要问题。人工智能法草案已被列入国务院2023年立法规划中,提炼人工智能治理共性问题,形成一般性人工智能立法的规定,将有助于问题解决。技术治理层面,提升智能化技术治理能力,实现“以技术管技术”。针对“人脸防伪”“声音防伪”“场景防伪”等智能化鉴别技术,建设精准度高的技术鉴别平台,才能确保生成式人工智能发展可信、可靠、可控。
(作者为国家互联网应急中心副研究员,中国互联网协会青年专家)
来源:青年记者2023年11月下
编辑:范君



