2012年,可能是ACG史上最广为人知的网游题材小说SAO开始了一个名为“Alicization”的新章节,讲述了桐人在一次现实世界的袭击后在军方的安排下进入了虚拟世界“UnderWorld”,以优吉欧和爱丽丝的儿时玩伴的身份开始了“另一段人生”。
《刀剑神域:Alicization》
对于当时的读者来说,桐人带入一个崭新的角色、在一个完全由人工智能(原作中将UW世界中的“灵魂”称之为“摇光”)构成的世界中搏杀是一个极具想象力的设定;而后期UW的崩坏与爱丽丝来到现实世界的剧情更是体现了川原在二次元视角下对这一科幻内容的独特认知。
在古典科幻作品中,关于AI“觉醒”的例子也是数不胜数。
改编自1973年同名电影、于2016年播出第一季的HBO大热剧集《西部世界》同样讲述了一个类似于“由人工智能构成的世界”的故事——作品描绘了一个由两名天才程序员福特和阿诺德创建的成人向游乐场,以AI控制的“接待员”为顾客提供真实的、用于发泄原始欲望的娱乐活动。
《西部世界》
故事以接待员觉醒意识、在疯狂的创造者的意志下将遭受的苦难和杀戮加倍奉还为爆点,以人类却在虚拟和现实中迷失为结局,抛出了一个“数据构成的在虚拟世界中的灵魂是否意味着永生”的大哉问。
《西部世界》剧照
这些文艺作品所展示的现实与虚拟的联系、人类与人工智能的关系,在过去的几十年里无数次地引导着机器人伦理上的争论和思考。
不过,尽管经历了长期的讨论,我们在潜意识中依然认为,完全由AI构成的世界仅仅只是一种遥远的想象——但随着近年来AI技术的飞速发展,这种想象很快成为了现实。
不久前,斯坦福大学和Google Research的研究者们发表了一篇名为《生成性代理:人类行为的互动模拟》的论文,详细讨论了构建一个自主运作的人工智能世界的方法,并附上了一个包含了25位人工智能代理(下文称之为“智能体”)的“小镇(Smallville)”的Demo。
这个可以在网页端流畅运行的Demo展示了研究者构筑的一个现代西方风格小镇(的一个部分)。根据论文中的描述,“小镇”具有现实中小村庄常见的功能建筑(比如咖啡馆、酒吧、公园、学校、宿舍、商店以及住房),并定义了这些建筑中的一些实体(比如床、桌子、壁橱、书架、浴室和厨房)。
智能体“生活”的小镇
和我们熟知的像素风格电子游戏一样,智能体在构筑好的小镇中移动,进入和离开建筑物,在地图上寻找方向并在这个过程中接近其他智能体,与之发生联系——自然,移动的方式由人工智能生成。
这25个给定的智能体具有详细的个人设定,这种设定影响着其在“小镇”中的行为。比如,一个名为约翰·林的智能体被设定成柳树市场药房的一名乐于助人的店员,他有一个大学教授妻子林美和一个音乐系学生儿子,艾迪·林。
Demo中给出的个人简要信息介绍
设定中还包含着智能体之间的人物关系——比如约翰认识他的邻居山姆和珍妮弗夫妇以及山本百合子,认为他们是很好的人;但是对另一位邻居泰勒了解不多。在业余时间,他乐于和朋友汤姆·莫雷诺讨论政治话题;
还有他们的生活习惯——比如约翰习惯早晨7点起床,和家人一起吃完早餐后前往柳树市场,等等。
在这样相对详细的设定下,智能体在“小镇”中发生了极为紧密的联系。在chatGPT3.5的帮助下,这个世界中的智能体会在相遇的时候用自然语言对话——比如,约翰会和妻子讨论儿子在学校的表现,也会和汤姆讨论下次镇长选举的人选。
到达场景,发生对话
从结果上来看,这篇论文所构建的这个项目已经在一定程度上用AI实现了对于人类行为的模拟,取得了令人震惊的成果。
需要说明的是,过去大多数“用程序模仿人类行为”的尝试(多出现在电子游戏中)基本上都是利用给定的程序实现的,很难称之为真正的模拟;
论文中多次提到的《模拟人生》
而与竞技AI(包括具有很高水平的《星际争霸2》以及《Dota2》AI,原文也提到了这两个例子)不同,“小镇”对于AI的训练不存在一个明确的“胜利”的目标,因此具有更高的难度。
在论文中,他们提到,这一技术壁垒是通过“记忆流”和“反应树”两个主要系统突破的。
记忆流指的是,对于每一个智能体,系统会记录在TA“视野”中发生的所有内容,包括物品的状态、人物的对话和行为;而这些“记忆”会根据其内容与自身的相关性,产生一个从“印象深刻”(比如和喜欢的人约会)到“平平无奇”(比如早起洗漱)的重要性排序。
记忆流
另外,“小镇”在架构上实现了一个检索功能,将代理人的当前情况作为输入,返回一个记忆流的子集传递给语言模型——说人话就是,在和其他智能体对话时,Ta会检索自己“记忆”中与对话对象相关的内容并以此展开话题。
而反应树则代表了智能体之间的认知构建。在“小镇”中,智能体会根据记忆流构建对另一个智能体的认知,并通过反应树归纳、提炼,导出结果。
比如,一个智能体观察到卡鲁斯·穆勒经常花费大量时间阅读,并且经常去图书馆查阅相关资料、设法将文献联系起来,还与图书管理员讨论自己的研究,那么他将从多方面认知中归纳出“穆勒非常热衷于完成他自己的研究”这一结论,这被研究者称为是“上级的树叶”。
反应树
总而言之,在这两个系统的帮助下,团队构建了一个极为逼真(各种意义上)的AI小镇。它随着时间的流逝发生着变化,同时也会对外界的干预作出反应。
从记忆流到行动的逻辑
论文中提到,观测者也可以通过投入“种子”(甚至自己“夺舍”某个智能体)对这个世界造成影响。
他们给出的例子是让霍布斯咖啡店的伊莎贝拉产生一个“举办情人节派对”的想法。实验得到的结果是,在并未给出明确指令的前提下,伊莎贝拉成功独自邀请了9人参加自己的派对,加上受邀者邀请的3人,总共有12人在设定好的时间出现在霍布斯咖啡店展开了活动,这项活动甚至导致了智能体之间关系的演进。
伊莎贝拉的情人节派对
很显然,研究团队试图让AI用“人类的方式”思考问题。不论是记忆流还是反应树,参考的就是人类构筑记忆和认知的方式——当这一流程在AI身上几乎完美复现,在惊诧之余,读者可能难免会产生一种毛骨悚然的感觉。
在论文的最后,研究者认为以这种方法构建的、模拟人类互动行为的生成性代理架构可以在未来被广泛用于各类交互式应用,从设计工具到社会计算机系统,以及沉浸式环境的构筑;
《西部世界》
与此同时,他们也表达了对于这一系统安全性的担忧——过于拟真的互动是否会诱发超出限度的情感投入?另外,如果别有用心者故意投入破坏性的“种子”,是否会导致系统内的人际关系和社会关系发生不可逆转的崩坏?
事实上,这些担忧在过去相关的科幻作品中都有过思考和表达,但是当这些问题确实摆在人类面前的时候,我们似乎还没有准备好面对它们。正如我们在每一篇AI相关的文章中强调的那样,法律法规跟进的速度总是不可避免地远远落后于技术发展的速度。
就在前两天,国家互联网信息办刚刚下发了《生成式人工智能服务管理办法(意见征求稿)》。尽管国家对于这一部分内容的响应并不算慢,但是从内容上看它也仅仅给出了一个大体的方向和框架——从意见征求稿到具体判例再到法规的完善,可能还有很长的路要走。
与此同时,AI的世界已经迅速从画画聊天唱歌发展到可以互相交流、拥有记忆和认知,构成了一个自洽的世界。
《西部世界》剧照
相信在不远的未来,随着研究的进展,用于描述智能体的字段越来越多(研究者也在论文中提到最好不要用真实人类的信息导入项目),小镇中的人们也将与人类越来越像,届时,我们将如何面对这些在像素世界中的“生命”?他们究竟是数字构成的程序,还是如同“摇光”一样模棱两可的灵魂,还是在你我眼中生活的楚门?
2023年4月,“小镇”被认为是AI技术的一座里程碑,在社交媒体上引发了广泛讨论。显然在如今,人们不可能知道未来会有怎样的大树——唯一确定的一点是,我们已经埋下了第一颗种子。
幼年的桐人、爱丽丝和优吉欧