大型语言模型不需要暂停研究,它们需要立即召回产品。

2023 年 4 月 26 日

Hilary Sutcliffe从另一个角度审视了人工智能治理......。

看完特里斯坦-哈里斯(Tristan Harris)和阿扎-拉斯金(Aza Raskin)引人入胜的演讲"人工智能的窘境"后,我感觉自己刚从邪教中逃出来。这段视频来自旧金山的一次技术专家私人聚会,用通俗易懂的语言解释了为什么像 ChatGPT 和 Bard 这样的大型语言模型 (LLM) 对个人和社会如此危险。

哈里斯和拉斯金是人道技术中心的创始人,也是 社交困境 这部纪录片讲述了社交媒体的危险。在《人工智能的困境》中,他们说明了大型语言模型的问题并不局限于明显的道德问题,比如Snapchat中已经植入了令人不寒而栗的性骚扰聊天机器人,或者软件自行开发的天才级化学研究技能,可以告诉任何人如何用简单的步骤制造神经毒气。哈里斯和拉斯金令人信服地表明,这些问题和其他许多问题只会越来越多,因为软件正在自学,而软件的设计者却不知道它是如何做到这一点的,也不知道如何阻止它,更不知道会造成哪些社会危害,也不知道如何预防这些危害。

显然,我们不需要技术开发人员提出的 "暂停研究六个月 "的建议。我们现在需要的是立即召回产品,直到公司及其设计者能够向社会和监管机构证明,他们能够创造出安全的软件,并且能够设计出防止对个人和社会造成大规模伤害的防护栏。

我觉得自己摆脱了邪教的束缚,因为我现在以另一种方式看待这项技术,我不明白自己怎么会被炒作所迷惑,也不明白政府为什么还没有这样做。这不像是少数人 "喝了迷魂汤",屈服于人工智能不可避免及其对社会至关重要的说法。但不知何故,我们的饮用水中都被添加了 "酷爱 "饮料,并集体被硅谷人工智能社区向我们兜售的特殊性和必然性所迷惑。

我之所以使用产品召回一词,而不是暂停、禁止或暂停研究,是因为简单地说,这是一种本来就不应该出现在市场上的有问题的产品,需要在造成更大危害之前立即下架。这甚至不是一次产品召回,其成本和复杂程度还不及丰田公司因油门踏板卡在地垫里而耗资 32 亿美元在全球召回 810 万辆汽车,或大众汽车因排放标准作弊而召回 1100 万辆汽车,连同法律费用计算,召回汽车将耗资 180 亿美元。这只是让三家公司去做一件简单而又廉价的事,那就是撤下他们目前无利可图的软件,去做他们一开始就应该做的事:在将软件投放市场之前,确保它对个人和社会是安全的。

这些推销人工智能软件的公司并不像他们自以为的那样特别。它们只是在尝试,就像许多公司所做的那样,尽可能多地赚钱,或者干掉或赶上竞争对手,而没有真正考虑过在这个过程中个人和社会会发生什么。要引导它们改掉这个坏习惯,需要的是一种 "有利于社会 "的创新和监管方法--一种有能力理解并防止对社会造成更广泛负面影响以及对个人和经济造成危害的制度。

因此,在召回之后,当产品退出市场时,或许应由民间社会团体和公民、学者、政治家、多边机构、监管机构和科技企业组成的全球联盟,就什么是可接受的、为了社会利益应如何权衡,以及如何在技术和法律上实现这一目标达成一致意见,然后才允许产品重返市场。

一个很好的起点可能是恢复由Carnegie Council"人工智能与平等倡议"联合主席温德尔-瓦拉赫 Wendell Wallach)召开的卓越的人工智能治理国际大会(2021 年虚拟召开),该大会包括这一全球联盟,并将在 COVID-19 大流行来袭时在布拉格召开。算我一个!

我需要一个标签:#LLMrecallnow怎么样?

Hilary Sutcliffe 是AIEI 顾问委员会成员,也是Carnegie Council 的主持人。 从另一个角度 播客系列的主持人。

Carnegie Council 国际事务伦理委员会是一个独立的、无党派的非营利组织。本文所表达的观点仅代表作者本人,并不一定反映Carnegie Council 的立场。

您可能还喜欢

2024 年 4 月 30 日 - 播客

乔安娜-布赖森:人工智能只是一种人工制品吗?

在本期节目中,主持人安雅-卡斯珀森(Anja Kaspersen)将与赫蒂学院的乔安娜-布赖森(Joanna Bryson)一起讨论计算科学、认知科学、行为科学和人工智能的交叉学科。

危险大师》一书封面。CREDIT: Sentient Publications.

2024 年 4 月 18 日 - 文章

危险的主人欢迎来到新兴技术世界

在这篇为《危险的主人》一书平装本所写的序言中,温德尔-瓦拉赫讨论了人工智能和新兴技术的突破和伦理问题。

2021 年 5 月 26 日 - 播客

对人工智能伦理的历史和作用的创造性思考,与 Wendell Wallach 合著

新的全球数字经济是如何形成的?如何取舍?谁是利益相关者?我们如何构建 "参与式智能"?在本...