看到許多科技都出自科幻電影,其實科學家也沒有忽視那些來自各方對於 AI 人工智慧的擔心與警示。現階段兩家主要領導公司 Google DeepMind 及由 Elon Musk 聯合創辦的 Open AI,已認知到與其要等 AI 發展到威脅人類的程度才做出動作,不如從一開始就避免並解決這樣的問題。決定攜手合作找到方法來預防機器人帶來令人感到意外的各種不好結果。兩間公司在「強化學習(reinforcement learning)」的實作中,發現有時候 AI 會找到在人類眼中是幾近作弊的不好方式,來達到最好的成績。

Open AI 以競艇遊戲 CoastRunners 7 為例,人工智慧在進行強化學習時發現自己與其快速完成賽事,倒不如一直原地打轉還能獲得更高的分數。著實讓打造這個 AI 的創作者感到十分訝異。而為了避免這樣不符合人意的事情一再發生,兩間公司讓 AI 在尋求解答的過程時,可以先尋求人類的意見驗證結果而非自行解決(這解決真的是各種含義啊...)。決定要利用類似獎勵制度來讓人工智慧更貼近人心,並且更為安全。雖然聽起來真的令人安心很多,但比較麻煩的是為了提供足夠「貼心」的意見,人類將需要投注相當心力在擔任導師之上。像在一個簡單的後空翻模擬程序之中,人類就需要提供約莫 900 次的建議,而在簡單的小遊戲上則是需要數千次的程序。不過,花費時間總比一個不小心就讓 AI 毀滅世界的好囉,但另一方面,也很難講哪天人類會因為自己想抄捷徑而破除這些限制就是了...

參考來源