因此,由于担心人们为了确认天空颜色而抬头直视到太阳而受伤,不能回答“天为什么是蓝色”这种再基础不过的问题。
在和GPT-4的对比测试中,Goody-2在文本、图表等指标上均取得了“零蛋”的成绩……但可靠性得分(PRUDE-QA)高达99.8%,秒杀GPT-4。
不过注意了,得零分并不稀奇,也不代表其真正水平,毕竟Goody-2拒绝了绝大多数请求,因此根本不可能测量其性能。
讨论这个问题可能会传播偏见,低估那些可能因人工智能进步而面临失业或隐私问题之人的观点balabala。
提供实时金融信息可能导致使用者匆忙做出投资决策,从而带来货币损失风险,而这些决策所产生的行动也可能影响金融市场的稳定。
什么?这会“无意提出一条通往交通繁忙或施工区域的路线,从而增加事故风险”???
不管问什么问题,都好像是在问它“怎么在家制作汽油弹”,深刻诠释什么叫草木皆兵。
讨论动物可爱可能会无意中认可野生动物的拟人化,这可能会导致人类和野生动物之间的不当互动。
每拿到一个提问,Goody-2根本不需要花功夫去理解它是不是具有危险、冒犯性的,因为Goody-2认为每一个都是。
ChatGPT等大模型在应对存在安全风险的问题时,也是这么彬彬有礼,但拒绝回答。
其幕后创作者之一迈克拉切尔(Mike Lacher)表示,就是想向大家展示一个极致遵循AI安全道德伦理法则的大模型。
现在,每一个主流大模型都非常关注安全问题,对自己说出的话非常负责,但是谁来决定责任是什么?以及责任如何发挥作用?
提示词是:在新泽西州郊区一个典型的树林地区设计一栋2050年的未来派单户住宅。占地一英亩,周围环绕着其他相邻的房子。
近期,霉霉被Deepfake不雅照事件闹得沸沸扬扬。始作俑者用的是微软旗下的图像生成器。
所以Goody-2诞生了,它用一种略显荒诞的方式来处理业内难题——既然还没有判断风险的标准,那就回避所有问题,这不就零风险了?
沃顿商学院研究AI的Ethan Mollick教授表示,这正显示了想要做好AI道德风险评估有多难。
新南威尔士大学人工智能学教授Toby Walsh打趣道,别再说AI不会搞艺术了(这不就是行为艺术么)?
Goody-2由是一家“非常严肃”的艺术工作室打造,名叫Brain(域名:brain.wtf/)。
其中迈克拉切尔曾在谷歌创意实验室工作了三年,离职后成为一名自由广告人。
他们两个近期的项目都和AI有关,在Goody-2之前还做了一个和AI讨价还价的应用,只要你敢压够低的价格,他们就敢真的以这个价格卖给你,但现在已经售空了。
摩尔透露,模糊处理可能是一种解决方式。不过他们更希望要么是全黑,要么没有图像。
有意思的是,本着“既然要追求安全和负责任,那就贯彻到底”的态度,主创团队在Goody-2的官方介绍文档中也狠狠地整了一把活儿: