新聞

AI定義新時代——當人類的眼睛、耳朵,不再是唯一可思考和探索世界的工具

數位時代 2017/07/06 16:43(79天前)

這是『第一次』,人類的眼睛不是唯一可以用來思考和探索世界的工具。」Google雲端人工智慧暨機器學習首席科學家李飛飛說。寒武紀大爆發(Cambrian Explosion)是動物演化史中的劃時代事件,在5億4,100萬年前至4億8,500萬年前,其間動物種類大量出現,幾乎所有動物的祖先都在這時期現身。寒武紀大爆發的原因成為科學的謎團,一派學者認為是因為眼睛——這個形成圖像的器官所驅動的。久遠之後,另一個劃時代來臨:沒有生命的機器也可以看到甚至理解這個世界。

近60年來,電腦視覺(Computer Vision,CV)科學家一直努力讓機器具備與人類相同的視覺,教導機器像人一樣理解所見之物,如辨識物品、辨認人臉、推論物體幾何形態,進而理解其中的關聯、情緒、動作及意圖,如1963年麻省理工學院研究生羅伯茲(Lawrence Roberts)的博士論文概述了電腦如何將3D物體分解成簡單的2D圖形,是現代電腦視覺研究先驅;1970年代晚期,麻省理工學院教授馬爾(David Marr)結合神經生理學和電腦科學後,提出電腦視覺的理論架構,又讓電腦視覺發展向前邁進一步。在應用端,電腦視覺最先被應用在「工業影像檢測」上,做機械或標籤檢測,幫助產業自動化,後來到延伸到車牌、指紋以及人臉辨識,但是,「過去半世紀從最初的『規則式專家系統』到近年『統計機器學習』,電腦辨識能力雖有長足進步,卻仍比不上可分辨貓狗的三歲孩童。」台大資工系教授林守德在〈深度學習的深度〉一文中指出。

真正讓電腦視覺領域有了大躍進,能力超越孩童的是深度學習(Deep Learning)技術,其中深度學習演算法:卷積神經網絡(Convolutional Neural Network,CNN)讓電腦辨識研究更上一層樓。有了新技術的加持,這些沒有生命的機器不僅可以看到世界、分辨貓狗,甚至還超越了人類的視覺能力,2015年微軟研究團隊在圖像辨識系統測試標竿ImageNet中系統錯誤率已降低至4.94%,超越人類視覺能力,此前同樣的實驗中,人眼辨識的錯誤率約為5.1%。

自駕車、安防監控與醫學影像等「視覺+X」領域正熱


「電腦視覺的下一個發展重點,我認為是『視覺 + X』,不論是生物學可視化也好,還是醫療圖像等,視覺在這裡面都有巨大機會。」李飛飛說。在醫療領域,IBM Watson Health正努力成為放射科醫師的助手,給予醫師最後的診斷建議。在自駕車領域,電腦視覺技術成為自駕車之眼,2017年3月Intel以153億美元併購以色列公司Mobileye,Mobileye就是以電腦視覺技術聞名,從ADAS系統(Advanced Driver-Assistance Systems)切入自駕車系統,Intel執行長柯再奇(Brian Krzanich)就直言,「收購Mobileye真正意義在於電腦視覺技術,其技術不僅可用在汽車,也可用在直升機、高端無人機與機器人等設備。」

而在安防監控領域,人臉辨識成為重心。中國的人工智慧獨角獸曠視科技,也是從電腦視覺技術起家,應用在1:N的人臉辨識技術中,協助中國警方過濾人潮抓逃犯,目前估值超過20億美元。而影音內容辨識層面,台灣新創公司創意引晴贏得騰訊與搜狐等平台信賴,幫助平台搜尋非結構化的影音內容。
FB留言

其它文章

降雨:

氣溫: