ZHCY189A january 2022 – march 2023 AM67 , AM67A , AM68 , AM68A , AM69 , AM69A , TDA4AEN-Q1 , TDA4AH-Q1 , TDA4AL-Q1 , TDA4AP-Q1 , TDA4APE-Q1 , TDA4VE-Q1 , TDA4VEN-Q1 , TDA4VH-Q1 , TDA4VL-Q1 , TDA4VM , TDA4VM-Q1 , TDA4VP-Q1 , TDA4VPE-Q1
下面我們來了解一下邊緣 AI 系統(tǒng)中可能的內(nèi)核類型:
CPU
中央處理單元 (CPU) 是可處理連續(xù)工作負(fù)載的通用處理單元。它們具有很高的編程靈活性,并可從龐大的現(xiàn)有代碼庫中受益。通常,大多數(shù)邊緣 AI 系統(tǒng)具有 2 到 8 個 CPU 內(nèi)核,用于管理平臺和功能豐富的應(yīng)用。但是,僅含 CPU 的系統(tǒng)不適合像素級成像、計算機視覺和卷積神經(jīng)網(wǎng)絡(luò) (CNN) 處理等高度專業(yè)化的任務(wù)。CPU 還具有高功耗,但吞吐量卻是不同內(nèi)核類型中最低的。單核 CPU 系統(tǒng)與 AI 加速、圖像處理等專用硬件模塊配合使用,可以滿足低成本應(yīng)用的功率預(yù)算要求。
GPU
圖形處理單元 (GPU) 具有數(shù)百到數(shù)千個小型內(nèi)核,非常適合并行處理任務(wù)。GPU 最初設(shè)計用于實現(xiàn)一系列圖形操作,但現(xiàn)在已經(jīng)廣泛應(yīng)用于深度學(xué)習(xí)應(yīng)用中,尤其是在訓(xùn)練 DNN 時特別有用。然而,由于內(nèi)核數(shù)量眾多,GPU 功耗很大并具有更高的片上存儲器要求,這是其主要缺點之一。
DSP
數(shù)字信號處理器 (DSP) 是高能效的專用內(nèi)核,通常用于解決多個復(fù)雜的數(shù)學(xué)問題。DSP 能夠以低功耗處理來自現(xiàn)實世界中視覺、音頻、語音、雷達和聲納傳感器的實時數(shù)據(jù),并有助于更大程度地提高每個時鐘周期的處理能力。然而,由于其編程難度較大,需要熟悉 DSP 硬件的特性、編程環(huán)境和 DSP 軟件優(yōu)化,才能實現(xiàn)最佳性能。
ASIC
專用集成電路 (ASIC) 和加速器能夠為系統(tǒng)應(yīng)用提供最高的性能和最低的功耗。當(dāng)您確定要加速的功能所屬的核心內(nèi)核時,通常會使用它們。例如,CNN 的核心計算通常涉及矩陣乘法。對于傳統(tǒng)的計算機視覺任務(wù),專用硬件加速器能夠計算圖像縮放、鏡頭失真校正和噪聲濾波等操作。
FPGA
現(xiàn)場可編程門陣列 (FPGA) 是一類集成電路,可以對硬件模塊進行重新編程并將其用于特定應(yīng)用。它們的功耗低于 GPU 和 CPU,但高于 ASIC。不過,硬件編程比較難,并且需要掌握硬件描述符語言方面的專業(yè)知識,比如 Verilog 或超高速 IC 硬件描述語言等。