国产亲妺妺乱的性视频播放,9797WWW成人影片,99精品国产在热久久无毒不卡 ,西方37大但人文艺术人山踪林

Uploads%2farticles%2f11766%2fai chips teaser
|
2017-09-01

從 GPU、FPGA 到 ASIC,后摩爾定律時代下 AI 芯片領域會產生哪些獨角獸公司?

雖然 IC 產業整體落后于美國,但在 AI 領域國內仍有彎道超車的機會。

AI 芯片作為上游產業以及人工智能的硬件基礎,有著很高的技術壁壘,同時也有著巨大的產業價值和戰略地位。從近期 IC 行業新聞中可看出,不少科技公司已經開始暗自布局 AI 芯片產業,甚至已經取得了一定的成果。

兩周前,孵化自中科院計算所的 AI 芯片創業公司寒武紀完成一億美元 A 輪融資,由國投創業(A輪領投方),阿里巴巴創投、聯想創投、國科投資、中科圖靈、元禾原點(天使輪領投方)、涌鏵投資(天使輪投資方)聯合投資。

8 月 29 日,英特爾推出新一代視覺處理芯片(VPU) Myriad X 。Myriad X 是全球第一個配備專用神經網絡計算引擎的芯片上系統芯片(SoC),據悉,該芯片可能會用于無人機、機器人、自動駕駛等新興領域上。

從華為官方 Twitter 放出的消息來看,華為很可能在 AI 芯片上有所動作

華為也將于 9 月 2 日,在 IFA 2017 展會上推出 AI 芯片,據說這塊 AI 芯片就是打算在九月底發布的麒麟 970,并且該芯片會用在華為 Mate 10 手機中。

另外,據知名數碼博主孫昌旭爆料,目前高通驍龍 800 與 600 平臺可以通過軟件升級支持神經網絡計算。

......

在傳統馮諾依曼結構中,CPU 每執行一條指令就需要從存儲器中讀取數據。在人工智能環境下,數據爆炸式增長,而內存讀取速度有限的情況下,CPU 大量的功耗就將花費在數據的讀取上,從而限制住處理器的性能。

所以在人工智能場景下,芯片應該具有更加有效且龐大的計算能力,以應對人工神經網絡運算所帶來的海量數據,所以才會有如此多的科技公司熱衷于研發 AI 芯片。

為了應對不同 AI 應用場景下的需求,目前 AI 芯片領域分為幾個流派,主要有以下幾種:

并行計算能力和功耗一樣高的 GPU

GPU 通常用在 PC、工作站、游戲機、智能手機等數碼設備上,用于做視頻或者圖形的處理。在進行圖像處理時,每個像素點都需要被運算,這是一個相當大的數據,而 GPU 強大的并行計算能力能很好地滿足計算需求。

通常來講,神經系統網絡的深度越深,需要的訓練時間就越長,若采用傳統串行運算的 CPU 來訓練的話,可能要花數月,甚至數年的時間。而 GPU 的控制相對簡單,內部大部分的晶體管可以組成各類專用電路、多條流水線,使得 GPU 的計算速度遠高于 CPU,并擁有了更加強大的浮點運算能力,從而可以緩解深度學習算法的訓練難題,釋放人工智能的潛能。這也是為什么 GPU 成為最流行的 AI 芯片的原因。

從 CPU 和 GPU 內部結構來看,CPU 結構復雜,GPU 結構相對簡單,沒有 Cache,運算單元眾多

英偉達作為 GPU 巨頭,占據了七成的 GPU 市場份額。過去一年里英偉達已經參與了超過 4 萬家公司和 50 萬名開發者對神經網絡應用的研究,這也讓英偉達的股價在過去一年的時間里瘋漲了 300%。在今年的 GTC 上,英偉達 CEO 黃仁勛沒有一句提到游戲,滿嘴都是「AI」和「深度學習」,他表示:「我們要在后摩爾定律時代找到出路,而 GPU 的快速崛起可以驅動人工智能的革命。」

為了讓自家的 GPU 更加滿足 AI 計算需求,黃仁勛宣布推出了一款專為 AI 和高性能計算打造的 GPU 架構 Volta。除了加強 GPU 架構,Volta 還增加了 640 個新的 Tensor 單元,與標準 CUDA 核心配合使用,峰值性能達到 120TFLOPS/s。黃仁勛說,英偉達動用了超過 7000 名工程師,并花費了 3 年的時間,才打造出了 Volta,足以顯示英偉達深耕 AI 領域的決心。

但問題是,GPU 方案的功耗長期居高不下,英偉達高端顯卡的功耗動輒 200W +,一旦大量開啟,在散熱一事上就會產生很多問題 ,黃仁勛「核彈教父」的「美譽」也是這樣來的。另外,GPU 的價格問題,也是限制其在 AI 領域發展的重要因素。

「核彈教父」黃仁勛

可重新定義內部電路連接的 FPGA

GPU 能夠并行處理海量的數據,因此其內部架構必須十分通用,這也就是說,它很難針對某個領域進行特殊優化。而日新月異的行業要求芯片能夠處理新類型的計算任務。此時沉寂許久,硬件體系可以重構的 FPGA 重新回歸人們的視線。

FPGA 芯片內部集成大量的基本的門電路,開發者可通 Verilog、VHDL 等硬件描述語言按照自己的需求重新定義內部門電路的連接,用更加通俗的話來講,FPGA 像是一種「萬能芯片」。

不同于 GPU 的運行原理,FPGA 是以門電路直接進行運算,硬件描述語言在執行時會被翻譯成電路,所以在運算速度和功耗上,FPGA 具有很大的優勢。由于 FPGA 低延遲、低功耗的特性,近年來,微軟、百度等公司在自家的數據中心里大量部署 FPGA,詳細信息可參考深圳灣的文章『CPU + GPU 搞不定的機器學習問題,微軟用 FPGA 解決』,本文不再贅述。

FPGA 行業 90% 的市場份額都被賽靈思  Altera 所占領(后者已被英特爾以 167 億美金的價格收購),總體來講國內 FPGA 水平較弱,FPGA 從硬件到軟件的研發流程需要長期的積累,但已有國內的初創公司用 FPGA 搭建神經網絡深度學習方案,比如深鑒科技。

深鑒科技的主要團隊

深鑒科技(DeePhi Tech)的團隊成員主要來自清華大學和斯坦福大學,專注于深度學習處理器與編譯器技術。旗下研發的 ESE 語音能識別引擎技術在 FPGA 領域頂級會議 FPGA 2017 上獲得了最佳論文獎。該方案聚焦于使用 LSTM 進行語音識別的場景,結合獨家的深度壓縮(Deep Compression)技術、專用編輯器以及 ESE 專用處理架構,在中端的 FPGA 上可以取得 Pascal Titan X GPU 高 3 倍的性能,并將功耗降低 3.5 倍。

據悉,零度智控已經在其無人機產品 —— DOBBY 上采用深鑒科技的神經網絡機器學習技術,能夠實現物體以及行人的檢測和實時跟蹤拍攝、手勢識別和人臉識別等功能。另外,深鑒科技還著眼于機器人、安防監控、數據中心領域,正在將技術全面應用于實際產品。

深度定制的 ASIC

不過,FPGA 依舊有它的局限性。首先,在延遲和功耗上 FPGA 要優于 GPU,但 FPGA 的峰值性能卻不如 GPU。第二,FPGA 的編程難度很高,開發者不僅要有軟件開發的能力,還要掌握數字電路的設計理論,兩種技能都需要長時間的打磨和積累。基于上述原因,部分芯片公司將目光轉向可以深度定制的專用集成電路 ASIC。

去年谷歌的 AlphaGo 和李世石的人機大戰將人工智能帶到了一個高潮,其中 AlphaGo 采用了 Google 自研的第二代 TPU,而 TPU 就是以 ASIC 的方式實現。

ASIC 全稱為專用集成電路 (Application-Specific Integrated Circuit),和 FPGA 不一樣的是,FPGA 寫完代碼后就能夠使用廠商提供的工具實現硬件加速,而設計 ASIC 還需要做大量的驗證和物理設計,需要花更多的時間和資金。如果針對特殊場合(如軍事和工業),ASIC 還需要更多時間進行特別的設計以滿足需求。雖然設計的時間比較長,但 ASIC 加速器的速度會比用同樣工藝 FPGA 加速器速度快 5 ~ 10 倍,在功耗上也遠遠優于 GPU,而且一旦量產后,ASIC 的成本會遠遠低于 FPGA 方案。

AlphaGo 中就采用了 Google 研發的 TPU

也正是因為其研發周期長,門檻高,導致做 ASIC 的風險太大,同時也可能因為趕不上市場的變化速度而陷入尷尬的境地。所以,很多業內人士知道 ASIC 的性能要高于 FPGA,卻不敢輕易采用。

盡管研發 ASIC 需要承擔很大的風險,但仍然有不少芯片公司不遺余力地推進 ASIC 的研究。

上文提到的寒武紀就是個中翹楚。寒武紀科技由創始人陳天石教授帶領中科院團隊成立于 2016 年,致力于打造各類智能云服務器、智能終端以及智能機器人的核心處理器芯片。公司研制了國際首個深度學習專用處理器芯片,不同于 Google 采用的通用處理器,寒武紀芯片專門面向深度學習技術。模擬實驗表明,寒武紀芯片相對于傳統執行 x86 指令集的芯片,有兩個數量級的性能提升。

有消息稱,華為 Mate 10 所搭載的麒麟 970 芯片,將嵌入寒武紀的人工智能 IP。

另外,2015 年創立的企業地平線機器人(Horizon Robotics)致力于打造基于深度神經網絡的人工智能「大腦」平臺,包括軟件和芯片。軟件方面,地平線機器人做了一套基于神經網絡的 OS,已經研發出面向自動駕駛的「雨果」平臺和面向智能家居的「安徒生」平臺。在芯片方面,未來地平線機器人還會為這個平臺設計一個芯片 —— NPU(Neural Processing Unit),支撐自家的 OS,到那時效能會提升 2-3 個數量級。

后摩爾定律時代,AI 芯片擁有更加廣闊的想象空間

近些年,摩爾定律似乎已經發展到了極限,粗暴地縮小特征尺寸將變得非常困難。對于未來摩爾定律的發展,業界和學界給出了以下三個方案:

● More Moore(深度摩爾):想辦法沿著摩爾定律的道路繼續向前推進。

● More than Moore(超越摩爾):由應用需求驅動,側重于功能的多樣化。

● Beyond CMOS:使用 CMOS 以外的新器件。

「More Moore」和「More than Moore」的區別

其中,「More than Moore」是目前主流的行業趨勢,其具體含義是,芯片設計者可以電路設計、系統算法優化,或者封裝技術實現模塊集成,以達到優化芯片的目的,同時芯片也可以擁有一些新的功能。這就意味著 AI 芯片有更加廣闊的想象空間,同時也說明 AI 芯片領域也蘊藏著巨大的商機。

AI 不是用一塊簡單的芯片就能實現,也沒有哪個單一的 AI 系統能夠在任何場景完美地工作。AI 在不同場景中的應用,都需要針對場景的需求,在功耗、延遲、數據吞吐量、加速器方案的選擇上做出調整和優化,這也會刺激從工具和 IP 供應商一直到包裝和流程開發等環節的巨大發展。

AI 芯片領域的創新涉及到人工智能算法、編程語言、計算機體系結構、集成電路、半導體工藝等多方面,絕不是一蹴而就的事情。雖然在整個 IC 產業結構上,美國處于領先地位,在 GPU 領域,國內幾乎處于空白,但是仍然有一批創業公司有彎道超車的機會,比如上述的寒武紀科技、深鑒科技、地平線機器人,以及已經具有一定規模的中微星,他們的技術在某些特定場景取得了相當不錯的成績。

在 PC 時代, 微軟和英特爾形成的 WINTEL 聯盟牢不可破,但在移動互聯網時代,卻被 ARM 和高通迎頭趕上。而 AI 產業剛剛開始發展,市場空間巨大,機會也開始顯露,國內 AI 風頭正盛,勢必會產生像英特爾和英偉達這樣世界級的企業。

>>
Back to top btn
主站蜘蛛池模板: 建始县| 中西区| 双桥区| 龙南县| 塘沽区| 米易县| 襄汾县| 蒙自县| 榆林市| 连州市| 芦山县| 怀来县| 基隆市| 赫章县| 西青区| 赣榆县| 治多县| 清新县| 清流县| 西吉县| 潼南县| 沙河市| 祁连县| 凤冈县| 客服| 金寨县| 甘洛县| 青田县| 株洲市| 林口县| 韩城市| 沈阳市| 保靖县| 南宫市| 湘阴县| 闻喜县| 长治市| 永平县| 镶黄旗| 天长市| 涟源市|