現在有不少動畫都是通過輕小說改編而成,其實在讀者閱讀小說的時候就能通過文字腦補出人物、場景、對話等畫面,那麼人工智能是否也能做到呢?近日,Vrai的博主開發了一個基於文字自動生成影片的程序,演示文本為《桃太郎》。


人們通過閱讀文字在腦內生成畫面,充實人類想像力的情報是從現實生活中眼中所見、耳中所聽、身體所觸摸等經驗而獲得的知識。人工智能在一開始卻並沒有具備這些知識,如果要讓人工智能和人類一樣能夠通過讀取文字生成畫面,那麼就需要這些情報。此外人工智能所掌握的情報之間的聯繫和間隔也是一大難題。從事VR程序開發和人工智能技術研究的“Vrai”博主就開發出基於文本生成影片的程序,使用的文本就是日本傳統民間故事《桃太郎》。







《桃太郎》在日本是一個家喻戶曉的民間故事,講述從桃子裡誕生的桃太郎,用糯米糰子收容了小白狗、小猴子和雉雞後,一起前往鬼島為民除害的故事。因為比較簡單,所以人類基本上都能夠想像出畫面,但是這次演示的人工智能卻生成了大量不符的畫面。比如本該有巨大的桃子從河裡流過來的場景,然而桃子並沒有出現;雖然有老奶奶把桃子抱回家的反應,卻突然轉身了;雖然有伸手撿桃子的動作,卻沒有碰到“桃子”這個對象;桃太郎長大後成為了青年桃太郎,青年登場了但是小型桃太郎卻並沒有消失;後來在提到“鬼島”地名的時候,人工智能卻理解成了兩個東西“鬼”和“島”……後面擁有錯誤的地方也很多這裡就不一一贅述了。可以看出AI目前在畫面的理解上和人類的差距還很大,但是這項技術發展下去的話說不定以後輕改動畫就可以直接用程序生成了。