據(jù)外媒報道,美國加州大學(xué)洛杉磯分校(UCLA)和美國陸軍研究實驗室(United States Army Research Laboratory)的研究人員提出了一種新方法,可通過給數(shù)據(jù)驅(qū)動的技術(shù)增加物理感知,以改進人工智能(AI)驅(qū)動的計算機視覺技術(shù)。

顯示了將物理整合到機器學(xué)習(xí)過程中的兩種技術(shù)(圖片來源:加州大學(xué)洛杉磯分校)
該研究被發(fā)表在《自然雜志機器智能》期刊上,其中概述了一種混合方法,旨在改進AI機器實時感知環(huán)境、與周圍環(huán)境互動以及對環(huán)境做出響應(yīng)的能力,例如,自動駕駛汽車將如何移動以及行駛,或者機器人如何使用該改進技術(shù)來執(zhí)行精確行動。
計算機視覺允許AI通過解碼數(shù)據(jù)和從圖像中推斷物理世界的屬性來觀察和理解周圍環(huán)境。雖然此類圖像通過光與機械的物理現(xiàn)象形成,但傳統(tǒng)的計算機視覺技術(shù)主要關(guān)注數(shù)據(jù)驅(qū)動型機器學(xué)習(xí),以驅(qū)動性能提升。不過,基于物理學(xué)的研究在一個單獨的軌道上發(fā)展起來,以探索很多計算機視覺挑戰(zhàn)背后的各種物理原理。
將對物理學(xué)的理解,即控制質(zhì)量、運動等的定律,納入神經(jīng)網(wǎng)絡(luò)發(fā)展中一直是一個挑戰(zhàn),在神經(jīng)網(wǎng)絡(luò)中,AI模型模仿有數(shù)十億個節(jié)點的人類大腦,以處理大量圖像數(shù)據(jù)集,直至理解了“看到”的東西。但現(xiàn)在有一些有發(fā)展前景的研究方向,試圖將物理感知元素添加到強大的數(shù)據(jù)驅(qū)動網(wǎng)絡(luò)中。
UCLA的研究旨在利用數(shù)據(jù)的深度知識以及真實世界物理學(xué)知識的力量,創(chuàng)建增強型混合AI。
UCLA Samueli工程學(xué)院電子與計算機工程助理教授Achuta Kadambi表示:“汽車、機器人或使用圖像感知視覺的健康儀器等視覺機器最終需要在我們所在的物理世界中完成任務(wù)。物理感知形式的推理可讓汽車更安全地行駛,或者讓手術(shù)機器人更加精確。”
該研究團隊概述了將物理學(xué)和數(shù)據(jù)結(jié)合至計算機AI中的三種方式:
1、將物理特性納入到AI數(shù)據(jù)集中
用額外的信息標記目標,例如目標移動的速度或重量,類似于視頻游戲中的角色
2、將物理特性納入到網(wǎng)絡(luò)體系結(jié)構(gòu)中
通過網(wǎng)絡(luò)過濾器運行數(shù)據(jù),以將物理屬性編碼到攝像頭捕捉到的圖像中
3、將物理特性納入網(wǎng)絡(luò)損失函數(shù)
利用建立在物理特性上的知識來幫助AI解釋其觀察到的訓(xùn)練數(shù)據(jù)
這三方面的研究已經(jīng)在改進計算機視覺方面產(chǎn)生了令人鼓舞的結(jié)果。例如,混合法讓AI更精確地跟蹤和預(yù)測物體的運動,并能夠從因惡劣天氣被遮擋的場景中產(chǎn)生準確、高分辨率的圖像。
研究人員表示,隨著此類雙模態(tài)方法的不斷進步,基于深度學(xué)習(xí)的AI甚至可能可以自己開始學(xué)習(xí)物理定律。
