
一、前言
芯片采購網(wǎng)專注于整合國內(nèi)外授權(quán)IC代理商現(xiàn)貨資源,芯片庫存實時查詢,行業(yè)價格合理,采購方便IC芯片,國內(nèi)專業(yè)芯片采購平臺。
人工智能,人工智能(AI)廣泛應(yīng)用于各種應(yīng)用。硬件、算法和數(shù)據(jù)是人工智能的三大支撐,其中硬件是指運行 AI 算法芯片及相應(yīng)的計算平臺。由于使用場景越來越多,需要處理的數(shù)據(jù)量越來越大,人們的需求也越來越高,這使得AI硬件平臺上必須有效地運行算法。目前主要用于硬件。 GPU 神經(jīng)網(wǎng)絡(luò)并行計算,還有 FPGA 和 ASIC 也有未來異軍突起的潛力。
GPU它被稱為圖形處理器,是顯卡的心臟 CPU 類似地,它只是一種專門從事圖像操作的微處理器。GPU 在浮點計算和并行計算中,可以提供數(shù)十倍甚至數(shù)百倍 CPU 性能。但在應(yīng)用于深度學(xué)習(xí)算法時,有三個局限性:
并行計算優(yōu)勢在應(yīng)用過程中不能充分發(fā)揮
硬件結(jié)構(gòu)固定不可編程
操作深度學(xué)習(xí)算法的效率遠低于 ASIC 及 FPGA。
FPGA用戶可以根據(jù)自己的需要重復(fù)編程,稱為現(xiàn)場可編程門陣列。 GPU、CPU 相比之下,高、能耗低、可硬件編程等特點。FPGA 比GPU 功耗較低,比例較低 ASIC 開發(fā)時間短,成本低。FPGA也有三種限制:
基本單元的計算能力有限;
需要提高速度和功耗;
FPGA 比較貴。
ASIC(Application Specific Integrated Circuit)是為特殊目的設(shè)計的集成電路。不能重新編程,效率高,功耗低,但價格昂貴。近年來出現(xiàn)出現(xiàn)TPU、NPU、VPU、BPU各種令人眼花繚亂的芯片,本質(zhì)上都屬于ASIC。ASIC不同于 GPU 和 FPGA 定制的靈活性 ASIC 一旦制造完成,就不能改變,所以初始成本高,開發(fā)周期長,進入門檻高。目前大部分都是有的 AI 算法也擅長芯片研發(fā)的巨頭,如 Google 的 TPU。與神經(jīng)網(wǎng)絡(luò)相關(guān)的算法完美適用,ASIC 優(yōu)于性能和功耗 GPU 和 FPGA,TPU1 是傳統(tǒng) GPU 性能的 14-16 倍,NPU 是 GPU 的 118 倍。寒武紀已發(fā)布對外應(yīng)用指令集,預(yù)計 ASIC 將是未來 AI 芯片的核心。
綜上所述,在性能方面,ASIC優(yōu)于其他幾種計算方案。ASIC在眾多芯片中,NPU性能非常突出,下面介紹一下NPU。
二、NPU介紹
所謂NPU(Neural network Processing Unit), 即神經(jīng)網(wǎng)絡(luò)處理器。顧名思義,它用電路模擬人類的神經(jīng)元和突觸結(jié)構(gòu)!如果你想用電路模仿人類的神經(jīng)元,你必須把每個神經(jīng)元抽象成一個激勵函數(shù),它的輸入是由連接神經(jīng)元的輸出和連接神經(jīng)元的突觸決定的。為了表達特定的知識,用戶通常需要調(diào)整人工神經(jīng)網(wǎng)絡(luò)中的突觸值、網(wǎng)絡(luò)的拓撲結(jié)構(gòu)等。這一過程稱為學(xué)習(xí)。學(xué)習(xí)后,人工神經(jīng)網(wǎng)絡(luò)可以通過學(xué)習(xí)的知識來解決特定的問題。
由于深度學(xué)習(xí)的基本操作是處理神經(jīng)元和突觸,而傳統(tǒng)的處理器指令集(包括x86和ARM等)是為了開發(fā)一般計算,其基本操作是算術(shù)操作(加減乘除)和邏輯操作(和或非),通常需要數(shù)百甚至數(shù)千個指令來完成神經(jīng)元的處理,深度學(xué)習(xí)的處理效率不高。此時,我們必須找到一種新的方法來突破經(jīng)典的馮·諾伊曼結(jié)構(gòu)!
存儲和處理在神經(jīng)網(wǎng)絡(luò)中是一體的,都體現(xiàn)在突觸權(quán)重上。 而馮·在諾伊曼結(jié)構(gòu)中,存儲和處理是分開的,分別由存儲器和計算器實現(xiàn),兩者之間存在巨大的差異。用現(xiàn)有的基于馮·經(jīng)典的諾伊曼結(jié)構(gòu)計算機(如X英偉達86處理器GPU)運行神經(jīng)網(wǎng)絡(luò)時,不可避免地會受到存儲和處理分離結(jié)構(gòu)的限制,從而影響效率。這也是專門針對人工智能的專業(yè)芯片對傳統(tǒng)芯片具有一定先天優(yōu)勢的原因之一。
NPU典型代表國內(nèi)寒武紀(Cambricon)芯片和IBM的TrueNorth。以中國寒武紀為例,2016年3月,中國科學(xué)院計算技術(shù)研究所陳云姬和陳天石研究小組提出了世界上第一個深度學(xué)習(xí)處理器指令集DianNaoYu。DianNaoYu指令可以直接處理大規(guī)模神經(jīng)元和突觸,一組神經(jīng)元可以通過一個指令處理,并為芯片上神經(jīng)元和突觸數(shù)據(jù)的傳輸提供一系列特殊支持。
三、寒武紀NPU介紹
寒武紀科技于2016年發(fā)布了世界上第一個終端AI首款商用神經(jīng)網(wǎng)絡(luò)處理器(NPU)“寒武紀1A”(Cambricon-1A),智能手機、安全監(jiān)控、可穿戴設(shè)備、無人機、智能駕駛等終端設(shè)備的主流智能算法能耗比完全超過傳統(tǒng)CPU、GPU。其高性能硬件架構(gòu)和軟件支持Caffe、Tensorflow、MXnet等主流AI開發(fā)平臺。可廣泛應(yīng)用于計算機視覺、語音識別、自然語言處理等智能處理的關(guān)鍵領(lǐng)域。
2017年,寒武紀科技發(fā)布了第二代NPU寒武紀1的架構(gòu)H”(Cambricon-1H),該系列比第一代產(chǎn)品1A該系列的能效比提高了數(shù)倍,可廣泛應(yīng)用于計算機視覺、語言識別、自然語言處理等智能處理的關(guān)鍵領(lǐng)域。其中,Cambricon-1H16版本的IP作為1H2566系列高性能版MAC 5126位浮點運算器MAC 8位定點運算器。在1GHz在主頻下,16位浮點神經(jīng)網(wǎng)絡(luò)的峰值速度為0.5Tops;8位定點神經(jīng)網(wǎng)絡(luò)運算的峰值速度為1Tops。Cambricon-1H8版本IP作為1H512MAC 8位定點運算器。在1GHz在主頻下,8位定點神經(jīng)網(wǎng)絡(luò)運算的峰值速度為1Tops。Cambricon-1H8mini版本IP作為1H2566系列輕量級版MAC 8位定點運算器。在1GHz在主頻下,8位定點神經(jīng)網(wǎng)絡(luò)的峰值速度為0.5Tops。
2018年,寒武紀科技發(fā)布了第三代IP寒武紀1產(chǎn)品M”(Cambricon-1M),世界上第一個臺積電7nm工藝制造,能耗比5Tops/W,即每瓦特運算5萬億次,提供2Tops、4Tops、8Tops滿足不同場景、不同量級的三種規(guī)模處理器核AI處理需求,支持多核互聯(lián)。寒武紀1M前兩代處理器延續(xù)IP產(chǎn)品寒武紀1H/1A卓越的TracoPower代理單個處理器核可以支持完整性CNN、RNN、SOM進一步支持多元化的深度學(xué)習(xí)模式SVM、k-NN、k-Means、決策樹等經(jīng)典機器學(xué)習(xí)算法支持本地培訓(xùn),為視覺、語音、自然語言處理和各種經(jīng)典機器學(xué)習(xí)任務(wù)提供靈活高效的計算平臺,可廣泛應(yīng)用于智能手機、智能揚聲器、智能攝像頭、智能駕駛等領(lǐng)域。
四、Cambricon-1A NPU應(yīng)用
這里首先介紹華為海思麒麟970手機處理器,因為它是世界上第一個人工智能移動計算平臺,是業(yè)內(nèi)第一個獨立的NPU(Neural Network Processing Unit)手機芯片專用硬件處理單元。麒麟970創(chuàng)新集成NPU創(chuàng)新設(shè)計了專用硬件處理單元HiAI移動計算架構(gòu),它AI性能密度明顯優(yōu)于CPU和GPU。相較于四個Cortex-A73核心處理相同AI任務(wù),新的異構(gòu)計算架構(gòu)有約 50 倍能效和 25 性能優(yōu)勢倍,圖像識別速度可達2000張/分鐘左右。如此強大NPU寒武紀使用的專用硬件處理單元Cambricon-1A系列的IP,即麒麟970芯片集成寒武紀1A處理器作為其核心人工智能處理單元(NPU)。
————————————————
版權(quán)聲明:本文為CSDN博主「耐心的小黑」遵循原創(chuàng)文章CC 4.0 BY-SA版權(quán)協(xié)議,請附上原始來源鏈接和本聲明。
原文鏈接:https://blog.csdn.net/qq_39507748/article/details/109402395
- 為下一代SSD做準備 三星招標測試器供應(yīng)鏈新公司
- BLE藍牙通信卡藍牙功能的技術(shù)研究與測試
- 48V輕混,是應(yīng)對法律法規(guī)的雞肋,還是真正的技術(shù)革命?
- 全球前十大IC設(shè)計廠 營收大增48%
- 太陽電:汽車金屬動力電感器MCOIL? LCEN商品化系列
- 元宇宙平臺Decentraland首屆世界元宇宙時裝周
- 巴斯夫集團于2022年第三季度發(fā)布了初步數(shù)據(jù),并發(fā)布了降本計劃
- 微軟為Win11引入云操作系統(tǒng),適應(yīng)疫情期混合辦公模式
- 全新統(tǒng)一高通AI軟件棧產(chǎn)品組合改變了開發(fā)者訪問模式,擴大了公司在智能網(wǎng)絡(luò)邊緣的領(lǐng)域AI領(lǐng)導(dǎo)力
- 智能家居解決方案通過西門子低代碼平臺定制,實現(xiàn)智能生活
- 泰科電子(TE Connectivity)入駐1688平臺 幫助提升中小企業(yè)數(shù)字化采購體驗
- 適應(yīng)物聯(lián)網(wǎng)時代MEMS傳感器需求,智芯傳感器打開定制過程
