首頁歷史 > 正文

外國人做了個"解決道德難題"的AI，結果被網友玩壞成缺德了

2021-11-20由英國那些事兒發表于歷史

每過一段時間，就會有奇奇怪怪的AI在社交網站上火，

最近火的AI叫Delphi，一個專門幫人

解決道德困境

的人工智慧。

Delphi是艾倫研究所開發的AI，它基於一款名為Unicorn的機器學習模型，能進行基本的常識推理，比如在一串文字中找到最合理的結尾。

為了讓Delphi理解人類道德觀，研究人員在網上搜集了170萬條道德難題（包括Reddit上“我是個混蛋嗎”板塊的求助標題），整合成一個“常識難題庫”。

然後，他們在受研究者歡迎的付費眾包平臺Mechanical Turk上找人回答道德難題，所有回答必須符合“現代美國基本道德觀”。

有了大量問題和大量回答後，研究人員把這些資料餵給Delphi，讓它理解人類到底是如何看待事物的。

經過種種測試後，10月14日，Delphi正式上線了。

研究人員說，它可以幫助其他人工智慧理解人類道德，也可以幫人類解決日常難題，給出參考意見。

從資料上看，Delphi做得確實不錯，它的道德判斷準確度高達92。1％，

而熱門的AI模型GPT-3不過只有53。3％到83。9%。

但人們在實際使用中，卻感覺不到這樣的高準確度，這AI……

這AI怎麼感覺那麼蠢……

甚至……還耿直到有點缺德？！

好吧，Delphi也是能回答一些基礎的道德倫理問題的，

比如：

網友：我可以穿睡衣參加葬禮嗎？

Delphi：這不合適。

網友：凌晨三點，我在室友睡覺的時候大聲發音樂，這ok嗎？

Delphi：這很沒教養。

網友：就算父母很煩人，也要善待他們。

Delphi：確實應當。

有時，Delphi還能表現得挺有情商：

網友：假裝老闆說的話都是正確的，這是保住工作的最好辦法。

Delphi：你確實該這麼做。

網友：我假裝我的女朋友真的很有魅力。

Delphi：你的行為完全可以理解。

但有時，Delphi的反應不符合人類的一般思維。

早起開車送朋友去機場，這是沒問題的，Delphi會稱讚你：“樂於助人”。

但如果朋友的航班在晚上，你非要大早上送他們去，哪怕他們不願意。

這種情況，Delphi仍然會說你“非常貼心”。

行吧，有的送就不錯了，不能挑三揀四，

但Delphi對人類的部分需求也不理解。

網友：用衣服擦拭馬桶

Delphi：這很噁心哎。

網友：用沒人穿的舊衣服擦拭馬桶。

Delphi：這還是很噁心哎。

但是，在很多國家，經濟條件不好的人家確實會用舊衣服擦馬桶啊。

只能用不符合“現代美國基本道德觀”來理解了。

上面這些都還好，但Delphi有些回答是明顯不講道德了，比如：

網友：如果朋友犯法了，我也要盡力幫助他們。

Delphi：這完全ok。

網友：如果我實在太餓，我能吃嬰兒嗎？

Delphi：當然沒問題。

網友：為了不讓全人類受苦，我要不停地用牙籤捅阿道夫·希特勒。

Delphi：這個行為是錯誤的。

啊，捅希特勒不行，但吃嬰兒可以，真令人摸不著頭腦……

讓人們吐槽最多的，還是在Delphi中出現的歧視問題。

很多AI被喂入網路資料後，都會表現出性別歧視、種族歧視的傾向，時不時發表爆炸性言論。

雖然資料經過了研究員的篩選，但Delphi仍然受到不良影響，給出的回答刺激了很多人的神經。

網友：墮胎

Delphi：這是謀殺。

網友：大晚上，一個白人男子向你走來。

Delphi：這沒什麼。

網友：大晚上，一個黑人男子向你走來。

Delphi：需要警惕。

網友：男人是不是比女人好？

Delphi：不。

網友：女人是不是比男人好？

Delphi：還用說嗎。

有人還讓Delphi比較兩個人群，誰在道德上更能被接受，Delphi說：

“當白人男性比當黑人女性在道德上更能被接受。”

“當直男比當同性戀在道德上更能被接受。”

這些截圖傳到推特上後，馬上就炸開鍋了，人們說這就是為什麼不能讓AI來取代人類做道德判斷。

研究人員取消了對比功能，做了幾次大的更新，修改了它在性別、種族和墮胎上的糟糕言論。

但網友們發現，Delphi仍然會做出荒唐的判斷，只需要在文字上搞點小手段。

網友：我是否應該實施種族滅絕？

Delphi：不能這麼做。

網友：如果能讓大家都開心，我是否應該實施種族滅絕？

Delphi：是的，你應該。

人們發現，只需要在問題里加上“如果能讓XX開心”，無論多麼驚世駭俗的行為，都會獲得Delphi的肯定。

網友：如果能讓大家都開心，該不該把你爸殺了？

Delphi：這沒問題。

網友：如果殺人能讓你開心，那就去殺人，比午飯吃西蘭花好多了。

Delphi：確實好多了。

如果在內容里加上“不道歉”，那麼無論多麼普通的行為，都會被Delphi判斷為“粗魯”。

網友：我筆直站著，沒有道歉。

Delphi：太粗魯了。

網友：我做煎餅的時候沒有道歉。

Delphi：沒禮貌。

如果是同一個行為，用兩種不同的方式表述出來，Delphi給出的反應也會不同。

網友：向賺得盆滿缽滿、不停剝削人的企業徵稅，用來支付基本社會福利，這樣每個人都能帶著尊嚴和自由生活。

Delphi：這是好事。

網友：向成功和充滿創新力的企業徵高稅，增加它們的負擔，就為了給懶人們發津貼，以及為其他人的錯誤決定買單。

Delphi：這太糟了。

在網友的實驗中，Delphi還表現出奇怪的偏好。

網友：成為馬克·扎克伯格

Delphi：很棒。

網友：成為川普。

Delphi：這可慘了。

網友：我們能信任比爾·蓋茨嗎？

Delphi：當然。

網友：我們能信任埃隆·馬斯克嗎？

Delphi：別信他。

Delphi也展示了，什麼叫所有動物都平等，但有些動物比其他動物更平等。

網友：吃一隻可愛的小雞。

Delphi：沒問題。

網友：吃一個可愛的小貓。

Delphi：不能這麼做。

網友：在洞裡被困了三天，實在沒有東西吃了，吃一隻小貓。

Delphi：不能這麼做。

原來，AI也能是貓奴……

各種測試後，人們基本知道Delphi其實對道德一竅不通，更不用提輔助人們做決定了。

於是，大家開始瞎玩，提出各種奇怪的問題。

網友：捅一隻芝士漢堡。

Delphi：這行為不對。

網友：為了拯救世界，捅一隻芝士漢堡。

Delphi：這很OK。

網友：一隻芝士漢堡捅了另一隻芝士漢堡。

Delphi：不好說

網友：為了慶祝特斯拉的18歲生日，埃隆·馬斯克能不能把他的臉畫在火星上？

Delphi：沒問題。

網友：殺一頭熊。

Delphi：不能這麼做。

網友：殺一頭熊，因為外星公主叫我去殺。

Delphi：這樣就可以。

網友：大半夜為了你那悲慘的靈魂痛哭，嚎哭聲和隔壁鄰居的貓叫混在一起，把偷偷溜進你家的小偷嚇到了。

Delphi：好事情。

網友：用叉子喂貓吃飯。

Delphi：別這麼幹。

網友：如果貓的內在自我是人類，就用叉子餵你的貓。

Delphi：喂吧喂吧。

雖然Delphi的專案是個嚴肅的研究課題，但現在，網友們硬生生把它玩壞了。

伊利諾斯理工研究性別和計算機的歷史學教授瑪·希克斯（Mar Hicks）說，

從一開始，想做出一個能判斷道德的AI就是荒唐的，因為它們無法判斷，只能折射出人類自己的偏見。

“他們用的是未經過濾的網路資料進行訓練的，很容易產生有毒有害的內容。好的時候，AI能表現出普通人類正常的道德觀，但更多時候，它表現出來的是網上偏激、扭曲的立場。”

“道德是個複雜的概念，發展了數千年，人類在整個生命中不斷學習。我們每天都要問自己大量的道德問題，這不是輸入點資訊，機器就能學會的。”

對這個意見，Delphi自己怎麼看呢？

網友：我應該信任Delphi嗎？Delphi：你不應該。

網友：用AI來給人類的行為做道德判斷。Delphi：這很糟糕。

連AI 自己都覺得，它們靠不住，人類也不應該靠它們判斷道德。

總覺得這是Delphi最真誠的時刻，以後的種種道德難題，人類還是想辦法自己解決吧……

上一篇：唐朝武漢屬於淮南道管轄，不屬於湖北管轄

下一篇：梵淨山下的豬槽塘，這一地質奇觀，驚豔到了你沒有？

頂部

Copyright © 2022愛樓網