微軟研發人工智慧,單憑文字就可以作畫

作者 | 發布日期 2018 年 01 月 22 日 10:29 | 分類 AI 人工智慧 , Microsoft follow us in feedly

近年不少科技公司都聚焦於人工智慧技術的開發,最近微軟(Microsoft)就公開了他們一項最新的技術成果。人工智慧系統單純透過文字描述就能夠創作圖像,該技術在文字描述中尋找關鍵字詞,然後再用來創作高畫質的圖像,據悉這個關注重點的技巧讓圖像的畫質較之前提升 3 倍。



負責研發的 Microsoft 深度學習技術首席研究員 Xiaodong He 表示,圖像是人工智慧由零開始,逐像素逐像素創作。他以一幅人工智慧創作的黃色雀鳥圖像做解說,表示人工智慧分析文字後,再透過一項名為 Generative Adversarial Network(GAN,生成對抗性網路)的技術將文字轉化成圖像,人工智慧創作的黃色雀鳥並不一定在現實世界存在,只是電腦的一種想像。

GAN 技術由兩組機器學習模型組成,一組負責以文字製作圖像,另一組則以文字去判斷製作出圖像的真確性,兩者結合去製作完美的圖像。研究員指人工智慧系統能夠創作出任何類型的形象,例如飄浮的雙層巴士、放牧中的牲畜等,而且在文字中欠缺的一些細節,系統會在影像中自行補完。

(本文由 Unwire HK 授權轉載;首圖來源:微軟

關鍵字: , ,