在AlphaGo阿法狗第一局戰(zhàn)勝圍棋高手李世石后,英國(guó)《金融時(shí)報(bào)》中文版頭條文章為:互聯(lián)網(wǎng)終結(jié),人工智能崛起。此時(shí)此刻,互聯(lián)網(wǎng)時(shí)代的領(lǐng)先者和弄潮兒不落窠臼,一場(chǎng)革命就要到來,他們似乎正在拋棄互聯(lián)網(wǎng):
2015年和2016年,整個(gè)Google都在推動(dòng)一件事——改名Alphabet,希望徹底脫掉互聯(lián)網(wǎng)公司的標(biāo)簽,在原來的搜索引擎、YouTube和Android之外,將Calico(生命工程相關(guān))、Google Ventures(創(chuàng)新投資部門)、GoogleX(研發(fā)自動(dòng)駕駛汽車、智能隱形眼鏡和提供互聯(lián)網(wǎng)服務(wù)的熱氣球等)都?xì)w到Alphabet旗下。Google似乎已經(jīng)意識(shí)到“互聯(lián)網(wǎng)”時(shí)代正在終結(jié)。
同樣在此刻,全球最頂尖的精英也在拋棄互聯(lián)網(wǎng)——斯坦福、MIT(麻省理工)、CMU(卡內(nèi)基梅?。⒉死乃H斯ぶ悄軐I(yè)的博士生第一份offer(工作合同)已經(jīng)可以拿到200-300萬美金。掠奪這些人才的公司大體上在一個(gè)比較小的范圍內(nèi),Google(現(xiàn)更名Alphabet)、Facebook、IBM、蘋果、微軟、亞馬遜、特斯拉…一長(zhǎng)串的金光閃閃的公司。
互聯(lián)網(wǎng)的精英人才在硅谷現(xiàn)在的起薪應(yīng)該是20萬美金左右。10倍!還有什么比工資更敏感的價(jià)值判斷呢?這種人才軍備競(jìng)賽情況在商業(yè)歷史上從來沒有發(fā)生過。
阿法狗和Atlas機(jī)器人的相繼出現(xiàn),把即將到來的人工智能從幕后推送到幕前,谷歌在為這個(gè)全新的“人機(jī)智能時(shí)代”蓄勢(shì),一如當(dāng)年的美國(guó)集中西方最優(yōu)秀的科學(xué)家開啟了震驚全球的“曼哈頓計(jì)劃”。
AlphaGo在短短幾個(gè)月實(shí)現(xiàn)性能的大幅提升,用五個(gè)月走完了IBM“深藍(lán)”4年的路,這樣驚人的學(xué)習(xí)能力是人類可望而不可及的。美國(guó)啟動(dòng)了“腦研究計(jì)劃”(BRAIN Initiative)、歐盟啟動(dòng)了“人類大腦工程”(Human Brain Project),目前全球人工智能企業(yè)已經(jīng)超過了900家,總估值超過87億美元。
近年來,深度學(xué)習(xí)(deep learning)已經(jīng)在圖像識(shí)別、語(yǔ)音識(shí)別等領(lǐng)域獲得了一些應(yīng)用。目前深度學(xué)習(xí)技術(shù)應(yīng)用最多的還是視覺領(lǐng)域,即對(duì)圖像和視頻的分析。在圖像分析方面,比如人們熟悉的人臉識(shí)別、文字識(shí)別和大規(guī)模圖像分類等,深度學(xué)習(xí)大幅提升了復(fù)雜任務(wù)分類的準(zhǔn)確率,使得圖像識(shí)別、語(yǔ)音識(shí)別以及語(yǔ)義理解準(zhǔn)確率大幅提升。
Google已經(jīng)著手開發(fā)人工智能的實(shí)際應(yīng)用,多次公開場(chǎng)合討論過深度學(xué)習(xí)技術(shù),比如深度學(xué)習(xí)是如何幫助Android手機(jī)提高語(yǔ)音識(shí)別準(zhǔn)確率;谷歌自動(dòng)駕駛通過深度學(xué)習(xí)識(shí)別道路、交通信號(hào)燈、路標(biāo)等。
據(jù)悉,谷歌與半導(dǎo)體新創(chuàng)企業(yè)Movidius展開合作,正在開發(fā)配備“深度學(xué)習(xí)(Deep Learning)”人工智能最新技術(shù)的智能手機(jī)。如果智能手機(jī)內(nèi)置圖像識(shí)別功能,就可以即時(shí)本地處理圖像和識(shí)別被攝體。人臉識(shí)別支付、標(biāo)識(shí)和招牌翻譯等手機(jī)的各種新用途將成為可能。
芯片商扎堆深度學(xué)習(xí),高通打出驍龍820
然而,對(duì)于半導(dǎo)體產(chǎn)業(yè)來說,最重要或許也最實(shí)際的問題是:深度學(xué)習(xí)將會(huì)深入智能手機(jī)、可穿戴設(shè)備或是自動(dòng)駕駛汽車中使用的微型芯片嗎?也就說,我們得讓更小的設(shè)備具備深度學(xué)習(xí)的能力,使其得以實(shí)現(xiàn)高性能與低功耗才是關(guān)鍵。
結(jié)合用于偵測(cè)運(yùn)動(dòng)和音頻信號(hào)的傳感器、快速的存儲(chǔ)器訪問,以及高功效的數(shù)據(jù)處理方法,這些系統(tǒng)可以擁有真正的“認(rèn)知”能力,甚至在不遠(yuǎn)的將來構(gòu)成一個(gè)用于人工智能移動(dòng)設(shè)備的平臺(tái)。同時(shí),重要的是優(yōu)化現(xiàn)有的架構(gòu)來實(shí)現(xiàn)“智能視覺”功能,比如3D深度圖和感知、物體識(shí)別以及增強(qiáng)現(xiàn)實(shí),還有一些核心的計(jì)算圖像學(xué)功能,比如圖像縮放、HDR、圖像再對(duì)焦,以及微光圖像增強(qiáng)。
現(xiàn)在已經(jīng)有充份的證據(jù)顯示芯片供貨商對(duì)深度學(xué)習(xí)的興趣不斷增加,卷積神經(jīng)網(wǎng)絡(luò)(CNN)正廣泛地應(yīng)用在影像與視頻辨識(shí)領(lǐng)域。
“毫無疑問地,深度學(xué)習(xí)確實(shí)是改變游戲規(guī)則的一大突破,”嵌入式視覺聯(lián)盟(EVA)創(chuàng)辦人Jeff Bier以計(jì)算機(jī)視覺為例表示,深度學(xué)習(xí)具有強(qiáng)大的影響力,“必須說的是,目前它還只是一種經(jīng)驗(yàn)領(lǐng)域。人們正在嘗試不同的東西。”
高通去年推出了首款可‘模擬人腦’的Zeroth認(rèn)知運(yùn)算平臺(tái)——具有“計(jì)算機(jī)視覺、設(shè)備上深度學(xué)習(xí)、可辨識(shí)場(chǎng)景與對(duì)象的智能相機(jī),以及閱讀文本與手寫”的能力,并宣稱驍龍820是一顆智能芯片。
Nvidia在去年三月的GPU技術(shù)大會(huì)上使用汽車和先進(jìn)駕駛輔助系統(tǒng)(ADAS)作為應(yīng)用重點(diǎn),配合Elon Musk的意見和評(píng)論,希望表明自動(dòng)駕駛汽車的挑戰(zhàn)幾乎已被完全克服了。另一方面,隨著時(shí)間的推移,加上一些著眼于降低功耗的調(diào)整與改良,無處不在的3D感知、3D跟蹤,以及圖像搜索等許多技術(shù)和應(yīng)用正在快速進(jìn)入智能手機(jī),以及其他以電源或電池供電的嵌入式系統(tǒng)中。
DSP IP平臺(tái)授權(quán)廠商CEVA公司宣布推出實(shí)時(shí)神經(jīng)網(wǎng)絡(luò)軟件框架CEVA深層神經(jīng)網(wǎng)絡(luò),以簡(jiǎn)化低功耗嵌入式系統(tǒng)中的機(jī)器學(xué)習(xí)部署。包括用于圖像分類、定位和目標(biāo)識(shí)別的實(shí)時(shí)示例模型,用于目標(biāo)和場(chǎng)景識(shí)別、先進(jìn)駕駛輔助系統(tǒng)(ADAS)、人工智能(AI)、視頻分析、增強(qiáng)現(xiàn)實(shí)(AR)、虛擬現(xiàn)實(shí)(VR)和類似的計(jì)算機(jī)視覺應(yīng)用。
飛思卡爾收購(gòu)計(jì)算機(jī)視覺IP供應(yīng)商CogniVue。CogniVue總部位于加拿大渥太華,是一家從事影像認(rèn)知IP開發(fā)的企業(yè),過去4年是飛思卡爾最新駕駛輔助系統(tǒng)(ADAS)單芯片(SoC)解決方案主要視覺IP的供應(yīng)商。
TI、Nvidia、英飛凌、高通、谷歌等大廠都在進(jìn)行自動(dòng)駕駛汽車中使用的微型計(jì)算機(jī)視覺芯片設(shè)計(jì)的研究,致力于開發(fā)針對(duì)神經(jīng)網(wǎng)絡(luò)(CNN)優(yōu)化的SoC架構(gòu)。其中最厲害的是以色列公司——Mobileye——他們可以提供最完整解決方案。
為了實(shí)現(xiàn)視覺類芯片的深度學(xué)習(xí)應(yīng)用,芯片供貨商用盡了從CPU、GPU到FPGA和DSP的一切,有關(guān)CNN的爭(zhēng)論才剛剛開始。
人工智能型移動(dòng)芯片面世還要多久?
“你不需要做出決定,因?yàn)樯疃葘W(xué)習(xí)將會(huì)為你做決定。”在深度學(xué)習(xí)架構(gòu)中,你可以將所有的步驟整合于一。
學(xué)習(xí)和訓(xùn)練過程先在專用設(shè)施完成,例如利用數(shù)據(jù)中心的超級(jí)計(jì)算機(jī)。然后,將第一階段中的大量數(shù)據(jù)集轉(zhuǎn)為‘設(shè)定’和‘協(xié)同效率’應(yīng)用到嵌入式系統(tǒng)中。
隨著許多圖像處理與增強(qiáng)功能也都使用計(jì)算機(jī)視覺技術(shù),計(jì)算機(jī)視覺和圖像處理技術(shù)之間的區(qū)別正在變得越來越模糊。最直接的例子就是多幀圖像增強(qiáng)功能,比如HDR、圖像縮放與再對(duì)焦--拍攝多個(gè)連續(xù)的圖像,然后將它們?nèi)诤显谝黄穑玫礁哔|(zhì)量的畫面。
雖然我們稱之為“圖像增強(qiáng)”,但這其實(shí)涉及大量的計(jì)算機(jī)視覺處理來“register”圖像,既完成兩幀或三幀畫面之間的匹配?,F(xiàn)在,用戶認(rèn)為這種基本功能是理所當(dāng)然的,但其實(shí)它需要非常強(qiáng)大的處理能力,使得對(duì)于專門的、高性能的數(shù)字信號(hào)處理 (DSP)的需求將會(huì)增加。
高通公司(Qualcomm) 在Uplinq 2013上發(fā)布了文章,很好地描繪出用于各種不同處理功能的像素功率和時(shí)間關(guān)系。圖中展示了三個(gè)處理器,包括一個(gè)在1.2 GHz下運(yùn)行的單核CPU、一個(gè)四核CPU,以及一個(gè)在690 MHz下運(yùn)行的DSP。
圖:描繪不同處理器在處理每個(gè)像素時(shí)需要的處理能力和時(shí)間,表明了DSP結(jié)合CPU用于視覺處理的優(yōu)勢(shì)。為了優(yōu)化功耗和性能,結(jié)合CPU、DSP和GPU可能是總體來說最好的方法。
然而,隨著我們轉(zhuǎn)向在移動(dòng)平臺(tái)上實(shí)現(xiàn)類似人類的視覺、人工智能和增強(qiáng)現(xiàn)實(shí)應(yīng)用,可能需要重新思考所需的處理架構(gòu)。結(jié)合傳感器融合和先進(jìn)深度學(xué)習(xí)算法(比如CNN),這些非常先進(jìn)的計(jì)算密集型應(yīng)用將提供更具環(huán)境感知和情境感知的用戶體驗(yàn),但是在電池壽命方面卻要作出取舍。
設(shè)計(jì)人員面臨的挑戰(zhàn),是一方面要實(shí)現(xiàn)具有智能感知能力的設(shè)備,同時(shí)在另一方面維持可接受的電池壽命。有幾種方法來實(shí)現(xiàn)這一點(diǎn)。例如,可以使用來自高通或Nvidia的GPU來支持CPU。這已經(jīng)在許多智能手機(jī)中實(shí)現(xiàn)了。然而,降低功耗這一持續(xù)性的強(qiáng)制需求驅(qū)使我們將特定的處理密集型功能分散給針對(duì)視覺處理進(jìn)行優(yōu)化的DSP處理器。在處理物體識(shí)別和跟蹤時(shí),對(duì)比當(dāng)下最先進(jìn)的GPU簇群,使用這種方法可以節(jié)省高達(dá)9倍的功耗。
然而,即使具備這種功耗水平,移動(dòng)設(shè)備仍然不太可能很快地使用面部識(shí)別來進(jìn)行人群搜索,因?yàn)榇斯δ軐?duì)于處理能力的要求還是太高了。不過,低功耗處理器和經(jīng)過特定優(yōu)化的處理器架構(gòu)的面世帶來了希望,使得我們?cè)谶@個(gè)領(lǐng)域內(nèi)正在取得實(shí)質(zhì)的進(jìn)展。這類進(jìn)展是MIT Technology Review將深度學(xué)習(xí)稱為2013年十項(xiàng)技術(shù)突破之一的原因所在。除了GTC上進(jìn)行了相關(guān)演示,微軟、百度,以及Cognivue也展示了一些研究成果。此后,這個(gè)領(lǐng)域中還有其他長(zhǎng)足發(fā)展。
此外,Aziana (澳大利亞)最近宣布與BrainChip(美國(guó)加州)合并,后者是專門以硬件方式實(shí)施人工智能的企業(yè),并已經(jīng)著眼于開發(fā)用于移動(dòng)平臺(tái)的人工智能。雖然支持強(qiáng)大處理能力的架構(gòu)和超低功耗處理是至關(guān)重要的,但隨著云連接變得更普及、更快捷,若我們將盡可能多的處理開銷分配到云中,也是合乎情理的。這將會(huì)走向智能的處理性能分配。在云做最適合在云中處理的工作,在移動(dòng)設(shè)備做最適合移動(dòng)設(shè)備處理的工作,盡可能高效地依據(jù)架構(gòu)分配功能,比如使用CPU來分配GPU和DSP之間的負(fù)載。用高通公司的說法,就是使用合適的引擎來做合適的工作。
“寒武紀(jì)”芯片——中國(guó)AI的抗旗者
世界排行榜榜首中國(guó)圍棋抗旗者17歲的柯潔已向阿法狗約戰(zhàn),捍衛(wèi)人類尊嚴(yán)。美國(guó)通過人工智能再次展示其科技領(lǐng)域全球領(lǐng)先地位,在中國(guó)AI研究的抗旗者在哪?實(shí)力幾何?
在國(guó)內(nèi),大批科技公司也開始進(jìn)入到這個(gè)市場(chǎng)。2014年科技部“863 計(jì)劃”啟動(dòng)《基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)》項(xiàng)目,同時(shí)醞釀啟動(dòng)“中國(guó)腦計(jì)劃”。在企業(yè)方面,阿里巴巴推出了國(guó)內(nèi)首個(gè)可視化云計(jì)算智能平臺(tái) “DTPAI”;騰訊則推出了撰稿機(jī)器人Dreamwriter;新秀科大訊飛則在語(yǔ)音和語(yǔ)言方面也擁有了核心技術(shù)積累和產(chǎn)業(yè)基礎(chǔ)。
而作為國(guó)內(nèi)最早介入人工智能研發(fā)的企業(yè)之一,百度在人工智能研究方面的布局則遠(yuǎn)非幾個(gè)獨(dú)立產(chǎn)品或是幾個(gè)垂直領(lǐng)域所能描述。2014年,百度在硅谷成立人工智能實(shí)驗(yàn)室,側(cè)重于研究人工智能和深度學(xué)習(xí)的前沿技術(shù),這使得百度在硅谷現(xiàn)有開發(fā)能力的基礎(chǔ)上進(jìn)一步增強(qiáng)了研究能力。與此同時(shí),百度挖角谷歌大腦之父吳恩達(dá),隨即成立由吳恩達(dá)領(lǐng)銜的深度學(xué)習(xí)實(shí)驗(yàn)室,主攻智能駕駛和語(yǔ)音識(shí)別兩個(gè)方向。
截止目前,百度人工智能實(shí)驗(yàn)室搭建了作為百度人工智能核心的“百度大腦”,融合了深度學(xué)習(xí)算法、數(shù)據(jù)建模、大規(guī)模GPU并行化平臺(tái)等技術(shù),實(shí)現(xiàn)了實(shí)時(shí)學(xué)習(xí)和成長(zhǎng),它擁有200億個(gè)參數(shù),構(gòu)成了一套巨大的深度神經(jīng)網(wǎng)絡(luò),是利用計(jì)算機(jī)技術(shù)模擬人的大腦的智慧,如學(xué)習(xí)、記憶、推理、搜索、分析、歸納、創(chuàng)新,甚至模擬和擁有人的情感、意識(shí),使計(jì)算機(jī)或機(jī)器人能夠勝任一些通常需要人類智能才能完成的復(fù)雜工作。
在核心處理器領(lǐng)域,中國(guó)科學(xué)院計(jì)算技術(shù)研究所陳云霽、陳天石課題組提出的深度學(xué)習(xí)處理器指令集DianNaoYu被計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域頂級(jí)國(guó)際會(huì)議ISCA2016(International Symposium on Computer Architecture)所接收,其評(píng)分排名所有近300篇投稿的第一名。2014年,陳云霽入選《麻省理工科技評(píng)論》35歲以下的全球最佳35名創(chuàng)新人士。
一同問世的還有全球首個(gè)深度學(xué)習(xí)處理器架構(gòu)寒武紀(jì)。陳云霽在接受采訪時(shí)表示,事實(shí)上,中國(guó)在智能這樣的新興領(lǐng)域和國(guó)外差距不大,甚至在智能芯片上是引領(lǐng)世界的。例如我們的寒武紀(jì),美國(guó)的哈佛、斯坦福、MIT、哥倫比亞等高校都跟在我們后面做。谷歌甚至需要使用上萬個(gè)x86 CPU核運(yùn)行7天來訓(xùn)練一個(gè)識(shí)別貓臉的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。將來如果使用了帶有“DianNaoYu(電腦語(yǔ))”指令集的“寒武紀(jì)”處理器,深度學(xué)習(xí)的運(yùn)算速度會(huì)得到明顯提升。
陳云霽還表示,正在成立寒武紀(jì)公司,進(jìn)行深度學(xué)習(xí)處理器的產(chǎn)業(yè)化,公司即將完成天使輪融資。相信我們的產(chǎn)品一旦流片,很多國(guó)內(nèi)外公司都會(huì)非常感興趣。