關(guān)鍵字:智能處理器 人工智能 深度學(xué)習(xí) 電子模塊
Nvidia在三月的GPU技術(shù)大會(huì)上使用汽車(chē)和先進(jìn)駕駛輔助系統(tǒng)(ADAS)作為應(yīng)用重點(diǎn),配合Elon Musk的意見(jiàn)和評(píng)論,希望表明自動(dòng)駕駛汽車(chē)的挑戰(zhàn)幾乎已被完全克服了。另一方面,隨著時(shí)間的推移,加上一些著眼于降低功耗的調(diào)整與改良,我看到無(wú)處不在的3D感知、3D跟蹤,以及圖像搜索等許多技術(shù)和應(yīng)用正在快速進(jìn)入智能手機(jī),以及其他以電源或電池供電的嵌入式系統(tǒng)中。
結(jié)合用于偵測(cè)運(yùn)動(dòng)和音頻信號(hào)的傳感器、快速的存儲(chǔ)器訪問(wèn) ,以及高功效的數(shù)據(jù)處理方法,這些系統(tǒng)可以擁有真正的“認(rèn)知”能力,甚至在不遠(yuǎn)的將來(lái)構(gòu)成一個(gè)用于人工智能移動(dòng)設(shè)備的平臺(tái)。同時(shí),重要的是優(yōu)化現(xiàn)有的架構(gòu)來(lái)實(shí)現(xiàn)“智能視覺(jué)”功能,比如3D深度圖和感知、物體識(shí)別以及增強(qiáng)現(xiàn)實(shí),還有一些核心的計(jì)算圖像學(xué)功能,比如圖像縮放、HDR、圖像再對(duì)焦,以及微光圖像增強(qiáng)。
隨著許多圖像處理與增強(qiáng)功能也都使用計(jì)算機(jī)視覺(jué)技術(shù),計(jì)算機(jī)視覺(jué)和圖像處理技術(shù)之間的區(qū)別正在變得越來(lái)越模糊。最直接的例子就是多幀圖像增強(qiáng)功能,比如HDR、圖像縮放與再對(duì)焦--拍攝多個(gè)連續(xù)的圖像,然后將它們?nèi)诤显谝黄?,得到更高質(zhì)量的畫(huà)面。
雖然我們稱(chēng)之為“圖像增強(qiáng)”,但這其實(shí)涉及大量的計(jì)算機(jī)視覺(jué)處理來(lái)“register”圖像,既完成兩幀或三幀畫(huà)面之間的匹配?,F(xiàn)在,用戶(hù)認(rèn)為這種基本功能是理所當(dāng)然的,但其實(shí)它需要非常強(qiáng)大的處理能力,使得對(duì)于專(zhuān)門(mén)的、高性能的數(shù)字信號(hào)處理 (DSP)的需求將會(huì)增加。
高通公司(Qualcomm) 在Uplinq 2013上發(fā)布了文章,很好地描繪出用于各種不同處理功能的像素功率和時(shí)間關(guān)系。圖中展示了三個(gè)處理器,包括一個(gè)在1.2 GHz下運(yùn)行的單核CPU、一個(gè)四核CPU,以及一個(gè)在690 MHz下運(yùn)行的DSP。
圖1:描繪不同處理器在處理每個(gè)像素時(shí)需要的處理能力和時(shí)間,表明了DSP結(jié)合CPU用于視覺(jué)處理的優(yōu)勢(shì)。為了優(yōu)化功耗和性能,結(jié)合CPU、DSP和GPU可能是總體來(lái)說(shuō)最好的方法。
圖表表明DSP在僅略微超過(guò)CPU一半的時(shí)鐘頻率下運(yùn)行,便能夠在圖像處理上達(dá)到相同的效果,提供了潛在的性能增益,同時(shí)節(jié)省了更多的功耗(功率= 電容 x 電壓2 x 頻率,或者P=CV2xF)。
然而,隨著我們轉(zhuǎn)向在移動(dòng)平臺(tái)上實(shí)現(xiàn)類(lèi)似人類(lèi)的視覺(jué)、人工智能和增強(qiáng)現(xiàn)實(shí)應(yīng)用,可能需要重新思考所需的處理架構(gòu)。結(jié)合傳感器融合和先進(jìn)深度學(xué)習(xí)算法(比如CNN),這些非常先進(jìn)的計(jì)算密集型應(yīng)用將提供更具環(huán)境感知和情境感知的用戶(hù)體驗(yàn),但是在電池壽命方面卻要作出取舍。
設(shè)計(jì)人員面臨的挑戰(zhàn),是一方面要實(shí)現(xiàn)具有智能感知能力的設(shè)備,同時(shí)在另一方面維持可接受的電池壽命。有幾種方法來(lái)實(shí)現(xiàn)這一點(diǎn)。例如,可以使用來(lái)自高通或Nvidia的GPU來(lái)支持CPU。這已經(jīng)在許多智能手機(jī)中實(shí)現(xiàn)了。然而,降低功耗這一持續(xù)性的強(qiáng)制需求驅(qū)使我們將特定的處理密集型功能分散給針對(duì)視覺(jué)處理進(jìn)行優(yōu)化的DSP處理器。在處理物體識(shí)別和跟蹤時(shí),對(duì)比當(dāng)下最先進(jìn)的GPU簇群,使用這種方法可以節(jié)省高達(dá)9倍的功耗。
然而,即使具備這種功耗水平,移動(dòng)設(shè)備仍然不太可能很快地使用面部識(shí)別來(lái)進(jìn)行人群搜索,因?yàn)榇斯δ軐?duì)于處理能力的要求還是太高了。不過(guò),低功耗處理器和經(jīng)過(guò)特定優(yōu)化的處理器架構(gòu)的面世帶來(lái)了希望,使得我們?cè)谶@個(gè)領(lǐng)域內(nèi)正在取得實(shí)質(zhì)的進(jìn)展。這類(lèi)進(jìn)展是MIT Technology Review將深度學(xué)習(xí)稱(chēng)為2013年十項(xiàng)技術(shù)突破之一的原因所在。除了GTC上進(jìn)行了相關(guān)演示,微軟、百度,以及Cognivue也展示了一些研究成果。此后,這個(gè)領(lǐng)域中還有其他長(zhǎng)足發(fā)展。
此外,Aziana (澳大利亞)最近宣布與BrainChip(美國(guó)加州)合并,后者是專(zhuān)門(mén)以硬件方式實(shí)施人工智能的企業(yè),并已經(jīng)著眼于開(kāi)發(fā)用于移動(dòng)平臺(tái)的人工智能。雖然支持強(qiáng)大處理能力的架構(gòu)和超低功耗處理是至關(guān)重要的,但隨著云連接變得更普及、更快捷,若我們將盡可能多的處理開(kāi)銷(xiāo)分配到云中,也是合乎情理的。這將會(huì)走向智能的處理性能分配。在云做最適合在云中處理的工作,在移動(dòng)設(shè)備做最適合移動(dòng)設(shè)備處理的工作,盡可能高效地依據(jù)架構(gòu)分配功能,比如使用CPU來(lái)分配GPU和DSP之間的負(fù)載。用高通公司的說(shuō)法,就是使用合適的引擎來(lái)做合適的工作。