算法即芯片的時(shí)代來了。
在今天的年度發(fā)布會上,擁有世界級算法優(yōu)勢的依圖科技重磅推出云端AI芯片——求索(questcore?)!為AI芯片開辟了一條新道路。
選擇在擅長的領(lǐng)域繼續(xù)發(fā)揮優(yōu)勢?!扒笏鳌笔且缊D推出的第一款云端深度學(xué)習(xí)推理定制化 SoC芯片,為計(jì)算機(jī)視覺領(lǐng)域分析任務(wù)打造,針對視覺領(lǐng)域的不同運(yùn)算進(jìn)行加速,適用于人臉識別、車輛檢測等多個(gè)應(yīng)用場景。
加入“造芯”陣營后,依圖科技瞄準(zhǔn)其擅長的計(jì)算機(jī)視覺領(lǐng)域,再度打出重拳,這一拳打破了算法公司與芯片硬件公司的“次元壁”。
在發(fā)布會現(xiàn)場,依圖聯(lián)合創(chuàng)始人兼CEO 朱瓏談到了AI芯片為何難做,用了三個(gè)“沒有”作為排比句:
-
沒有典型場景應(yīng)用就沒有意義;
-
沒有超越NVIDIA的芯片就沒有意義;
-
沒有世界級的算法就沒有意義。
如果一款A(yù)I芯片沒有定制方向、沒有超過業(yè)內(nèi)最大咖的玩家、沒有頂級算法作為支撐,那么這款芯片就不能稱為是成功的,這也是依圖所面臨的挑戰(zhàn)。
依圖科技的確擁有世界級的算法優(yōu)勢,但它并非芯片創(chuàng)業(yè)公司,在投入大、門檻高的芯片行業(yè),一開始就選擇了高端玩家頗多的領(lǐng)域進(jìn)軍——自研云端 AI SoC,頗有要挑硬骨頭下手的意思。
先來看下規(guī)格:
-
類型:系統(tǒng)級芯片(SoC);
-
架構(gòu):ARM+ManyCore?;
-
制程:16nm
-
工作記憶內(nèi)存:LPDDR4X;
-
解碼:64路全高清實(shí)時(shí)。
發(fā)布會現(xiàn)場,依圖科技首席創(chuàng)意官呂昊為大家進(jìn)行了芯片演示——他手持一臺體積與15 英寸蘋果 MacBook Pro筆記本相當(dāng)?shù)囊缊D原子服務(wù)器,成功帶動200路攝像頭同時(shí)完成實(shí)時(shí)智能視頻分析任務(wù)。
剛開始大屏幕只顯示了服務(wù)器處理的27個(gè)攝像頭畫面——一個(gè)NVIDIA P4顯卡大概只能處理27個(gè)攝像頭。緊接著,大屏幕畫面突然顯示了原子服務(wù)器同時(shí)帶動200個(gè)攝像頭的畫面:
一場直觀的新品考驗(yàn)。
依圖原子服務(wù)器基于questcore? 打造,一臺服務(wù)器提供的算力與 8 張英偉達(dá)P4卡服務(wù)器相當(dāng),而體積僅為后者的一半,功耗不到20%。在進(jìn)行視頻解析時(shí),1臺依圖原子服務(wù)器(搭載4核 questcore?芯片,除此之外無需其他配置),與8卡英偉達(dá)T4服務(wù)器(含雙核英特爾 x86 CPU)對比,單路視頻解析功耗僅為后者的 20%,與8卡英偉達(dá)P4 服務(wù)器(同樣含雙核英特爾 x86 CPU)相比,功耗約為后者的10%。
這款芯片作為服務(wù)器芯片可以獨(dú)立運(yùn)行,不依賴 Intel x86 CPU,并且采用依圖自研的ManyCore?架構(gòu),具有靈活可拓展的特質(zhì),適配各類深度學(xué)習(xí)算法。
從這些特性來看,這款云端芯片更看重“實(shí)用”二字——如何滿足更多的需求、如何將本有的算法優(yōu)勢在芯片上發(fā)揮更大的作用、如何適應(yīng)現(xiàn)有的生態(tài)。
簡單來講,它致力于解決一個(gè)實(shí)在的問題——如何實(shí)現(xiàn)高性價(jià)比。
“利用算法優(yōu)勢”成為全場發(fā)布會的一大關(guān)鍵詞。依圖認(rèn)為,好的算法才能更高效地利用芯片架構(gòu),才能指導(dǎo)芯片架構(gòu)設(shè)計(jì),把算力更高效地轉(zhuǎn)化為智能。這款芯片基于領(lǐng)域?qū)S眉軜?gòu)(Domain Specific Architecture,DSA)理念,專為計(jì)算機(jī)視覺應(yīng)用而生。
questcore?是款“自立自強(qiáng)”的芯片:它作為服務(wù)器芯片可以獨(dú)立運(yùn)行,不依賴 Intel x86 CPU。這也是依圖芯片與NVIDIA GPU、Google TPU和其他AI芯片公司研發(fā)的AI加速器產(chǎn)品一個(gè)很大的不同。
另外,這款芯片采用依圖自研的ManyCore?架構(gòu),據(jù)介紹,同等功耗下,這款芯片能提供市面現(xiàn)有同類主流產(chǎn)品 2~5 倍的視覺分析性能。
如果一款芯片想要實(shí)用性強(qiáng),就必須擁有強(qiáng)大的可拓展性,以便應(yīng)用于更多的場景。ManyCore?架構(gòu)能夠適配各類深度學(xué)習(xí)算法,支持TensorFlow、PyTorch、Caffe等各類深度學(xué)習(xí)框架,便于無縫接入現(xiàn)有生態(tài)。在此架構(gòu)下,questcore?構(gòu)建的產(chǎn)品和解決方案可以兼顧云端和邊緣計(jì)算的需求。
據(jù)依圖科技向新智元介紹,這款芯片能實(shí)現(xiàn)性能和功耗比呈量級提升的根本原因之一是:ManyCore?架構(gòu)針對INT 8數(shù)據(jù)(8 位整數(shù)數(shù)據(jù)類型)進(jìn)行加速。
事實(shí)上,對于云端 AI 推理或者說視覺推理計(jì)算而言,并不需要高精度的計(jì)算,低精度的INT8 數(shù)據(jù)類型已經(jīng)足夠滿足需求。采用16nm制程也是考慮現(xiàn)在業(yè)界對視覺分析應(yīng)用的需求。
在投入極高的芯片行業(yè),如何實(shí)現(xiàn)高性價(jià)比是眾多玩家要實(shí)際面對的終極問題,算力的提升正是為了解決AI場景中的經(jīng)濟(jì)學(xué)難題——用更少的成本解決更多的問題。
在發(fā)布會上,依圖表示未來立足“算法+芯片+數(shù)據(jù)智能”的極智戰(zhàn)略,深入行業(yè),降低人工智能應(yīng)用落地和推廣成本,賦能行業(yè)。
據(jù)介紹,questcore?芯片的設(shè)計(jì)和研發(fā)正是依圖算法團(tuán)隊(duì)和ThinkForce團(tuán)隊(duì)緊密合作的成果。
事實(shí)上,依圖科技在AI芯片領(lǐng)域內(nèi)早有布局。2017年底,依圖正式對外宣布戰(zhàn)略投資AI芯片初創(chuàng)團(tuán)隊(duì)ThinkForce。ThinkForce是中國少有的擁有芯片研發(fā)全鏈路能力的團(tuán)隊(duì),核心成員來自 IBM、AMD、Intel、ZTE 等芯片業(yè)界龍頭企業(yè),全都擁有十年以上專業(yè)芯片研發(fā)設(shè)計(jì)經(jīng)歷,經(jīng)手過40余款不同芯片的量產(chǎn)。
有了如此高配的芯片研究團(tuán)隊(duì),打破算法與芯片的“次元壁”不再是難事,軟硬件一體化的產(chǎn)品也因此誕生。
事實(shí)上,次元壁本就不應(yīng)該存在。市場上并不存在單獨(dú)能夠使用的軟件或硬件,整個(gè)行業(yè)、整個(gè)生態(tài)一定是緊密結(jié)合在一起的。
這款芯片將于與依圖智能軟件結(jié)合在一起,構(gòu)成軟硬件一體化的產(chǎn)品或解決方案對外銷售,未來將應(yīng)用于交通運(yùn)輸、城市管理、智慧醫(yī)療和智慧零售等行業(yè)。TO B服務(wù)崛起之下,軟硬件一體化正成為一家AI企業(yè)的商業(yè)優(yōu)勢,可以為客戶提供針對特定場景優(yōu)化的性價(jià)比最高的解決方案。
與依圖科技相似的是,Google、微軟、阿里等科技巨頭也在自研芯片:同樣也是通過利用自身特有優(yōu)勢,從而為客戶提供更好的軟硬件一體化解決方案。越來越多企業(yè)加入了轟轟烈烈的“造芯”大軍。
AI芯片是個(gè)全新戰(zhàn)場。
押寶AI芯片可以說是大勢所趨,據(jù)研究報(bào)告顯示,目前AI芯片行業(yè)生命周期正處于幼稚期,市場增長快,2022年將從2018年的42.7億美元,成長至343億美元。
與其他戰(zhàn)場相比,這個(gè)新戰(zhàn)場充滿了不確定性,以及更多的機(jī)會——一個(gè)沒有先例可循的智能時(shí)代。中國AI創(chuàng)企與世界科技巨頭站在同一起跑線上,完全有可能成為新巨頭,同時(shí)加速數(shù)據(jù)中心服務(wù)器芯片自主可控進(jìn)程。
美國杜克大學(xué)電子計(jì)算機(jī)工程系教授陳怡然、美國紐約州立大學(xué)教授陳逸中曾在文章《中國AI芯片有可能彎道超車》提到:人工智能應(yīng)用場景千變?nèi)f化,其中應(yīng)用的算法之間的差異更是巨大,可以預(yù)期未來各項(xiàng)應(yīng)用將有不同的定制化芯片,出現(xiàn)人工智能芯片百家爭鳴的盛況。AI芯片的另一大特點(diǎn)在于它所面對的是一個(gè)全新的、還未被大公司充分定義的新的業(yè)務(wù)場景。即使是NVIDIA,也只是在云計(jì)算這一領(lǐng)域有一定的壟斷地位。
定制化芯片必然是未來方向。
世界級的創(chuàng)新需要世界級的命題,如今AI普及也成為世界級命題。依圖聯(lián)合創(chuàng)始人兼CEO 朱瓏認(rèn)為AI普及的關(guān)鍵是智能密度,而這里“智能密度”指單位面積硅芯片提供的算力轉(zhuǎn)化的智能。
然而,在半導(dǎo)體的摩爾定律已經(jīng)臨近終結(jié),智能密度繼續(xù)翻倍不能再只寄希望于摩爾定律。雖然半導(dǎo)體的摩爾定律逼近終結(jié),但算法性能卻仍在萬倍增長,過去 4 年依圖的人臉識別算法精度提升了 10 萬倍。
同時(shí),通用芯片已無法解決所有需求,定制化芯片與依圖questcore?一樣,Google TPU也是一種DSA,針對深度神經(jīng)網(wǎng)絡(luò)(DNN)進(jìn)行加速,Google TPU充分證明了DSA的優(yōu)勢。而對于DSA芯片而言,領(lǐng)域知識是最重要的,需要對機(jī)器視覺技術(shù)和行業(yè)有著深刻理解,這是需要人工智能公司在研發(fā)和商用落地中不斷積累的。
了解自身優(yōu)勢、了解市場真正需求,提供定制化芯片成為了依圖“高性價(jià)比”的解決方案,這也為那些想要加入芯片市場的玩家們提供了一個(gè)可高度參考的路線。
正如陳怡然教授和陳逸中教授所說的那樣,一個(gè)成功的芯片項(xiàng)目所帶來的不僅僅是銷售芯片本身的利潤,還有伴隨芯片設(shè)計(jì)、制造以及銷售整套流程中產(chǎn)生的支撐產(chǎn)業(yè)與生態(tài)系統(tǒng),從而帶動軟硬件發(fā)展、行業(yè)標(biāo)準(zhǔn)制定、知識產(chǎn)權(quán)銷售等產(chǎn)業(yè)發(fā)展。
算法即芯片,這條新路還會帶給AI公司更多的可能性。
您可以復(fù)制這個(gè)鏈接分享給其他人:http://www.emyjia.com/node/709