所謂npu其實就是嵌入式神經(jīng)網(wǎng)絡(luò)處理器,他采用的是“數(shù)據(jù)驅(qū)動并行計算”的架構(gòu),特別擅長處理視頻、圖像類的海量多媒體數(shù)據(jù)。
NPU處理器專門為物聯(lián)網(wǎng)人工智能而設(shè)計,用于加速神經(jīng)網(wǎng)絡(luò)的運算,解決傳統(tǒng)芯片在神經(jīng)網(wǎng)絡(luò)運算時效率低下的問題。在GX8010中,CPU和MCU各有一個NPU,MCU中的NPU相對較小,習(xí)慣上稱為SNPU。
NPU處理器包括了乘加、激活函數(shù)、二維數(shù)據(jù)運算、解壓縮等模塊。
乘加模塊用于計算矩陣乘加、卷積、點乘等功能,NPU內(nèi)部有64個MAC,SNPU有32個。
激活函數(shù)模塊采用最高12階參數(shù)擬合的方式實現(xiàn)神經(jīng)網(wǎng)絡(luò)中的激活函數(shù),NPU內(nèi)部有6個MAC,SNPU有3個。
二維數(shù)據(jù)運算模塊用于實現(xiàn)對一個平面的運算,如降采樣、平面數(shù)據(jù)拷貝等,NPU內(nèi)部有1個MAC,SNPU有1個。
解壓縮模塊用于對權(quán)重數(shù)據(jù)的解壓。為了解決物聯(lián)網(wǎng)設(shè)備中內(nèi)存帶寬小的特點,在NPU編譯器中會對神經(jīng)網(wǎng)絡(luò)中的權(quán)重進行壓縮,在幾乎不影響精度的情況下,可以實現(xiàn)6-10倍的壓縮效果。
以上就是什么是npu?的內(nèi)容。