發燒友實測 | iMX8MP開發板移植官方NPU TensorFlow例程

原創 作者 iMX8MP 2022-01-10 10:18:00 iMX8MP iMX8MP NPU iMX8MP算力

imx8mp 算力2.3tops


作者|donatello1996

來源 | 電子發燒友

題圖|飛凌嵌入式 




飛凌嵌入式OKMX8MP-C開發板基于NXP i.MX 8M Plus處理器開發設計,該系列處理器專注于機器學習與視覺、高級多媒體以及具有高可靠性的工業自動化。旨在滿足智慧城市工業互聯網、智能醫療智慧交通等應用的需求。強大的四核或雙核Arm? Cortex?-A53處理器,主頻高達1.6GHz,帶有神經處理單元(NPU),最高運行速率可達2.3TOPS。


本文采用的硬件板卡為飛凌嵌入式OKMX8MP-C開發板,系統版本Linux5.4.70+Qt5.15.0,主要介紹移植官方NPU TensorFlow例程。


一、 NPU的圖像識別例程


在OKMX8MP-C 開發板提供的產品使用手冊中,有一章是針對 iMX8MP 板上NPU的圖像識別例程,位于EMMC分區的/usr/bin/tensoRFlow-lite-2.3.1/examples,我將EMMC分區mount為了/media分區,找到對應的例程位置。


imx8mp官方例程


imx8mp官方例程位置



iMX8MP 開發板切換到EMMC啟動,進入/usr/bin/tensorflow-lite-2.3.1/examples/目錄下,運行測試example:


運行測試example


再將 iMX8MP 開發板切回TF卡系統運行,提示報錯,label_image程序的nnapi需要動態鏈接庫支持:



動態鏈接庫支持


libm-2.30.so
libneuralnetworks.so.1.1.9
libnnrt.so.1.1.9
libArchModelSw.so
libGAL.so
libNNArchPerf.so
libOpenVX.so.1.3.0
libovxlib.so.1.1.0
libVSC.so


其中libm-2.30.so被鏈接為ld-linux-aarch64.so.1,位于/usr/lib/aarch64-linux-gnu/目錄下,若在移植后的目標系統的/usr/lib/aarch64-linux-gnu/下沒有該庫文件的話,是會在運行時提示報錯的。將上述所有動態鏈接庫復制到正確位置(/usr/lib和/usr/lib/aarch64-linux-gnu/),再次運行:


庫環境移植成功



可以看到沒有任何報錯,運行庫環境移植成功,接下來可以在 iMX8MP 開發板上愉快地進行tensorflow例程的玩耍了。


二、TensorFlow例程驗證


飛凌嵌入式iMX8MP官方資料中提供了許多測試例程,先用官方DEMO做一下驗證,其驗證結果如下。


imx8mp NPU官方測試圖片


0.780392: 653 military unIForm
0.105882: 907 Windsor tie
0.0156863: 458 bow tie
0.0117647: 466 bulletproof vest
0.00784314: 835 suit



78%結果吻合陸軍制服,10%結果吻合溫莎領帶,1%結果吻合領結,1%結果吻合防彈背心,不到1%結果吻合西裝,總的來說這個結果還是挺令人滿意的,NPU的算力確實還可以,多次運行程序,得出的結果完全相同,說明 iMX8MP NPU計算時使用的是固定的/靜態的圖像識別庫。


我這邊突發奇想,用這個Demo去測一下我自己的論壇頭像,看看結果:



imx8mp NPU測試論壇頭像圖片


0.352941: 274 dingo
0.254902: 265 Cardigan
0.184314: 264 Pembroke
0.0666667: 163 beagle
0.0156863: 354 gazelle


35%的野狗,25%的毛衣,18%的Pembroke???,6%的小獵犬(beagle),1%的羚羊,看到羚羊(gazelle)我屬實蚌埠住了,哈哈。



再來試試另外幾張圖片,為了檢驗iMX8MP NPU的人工智能算力到底行不行,集齊了十張圖,豪華尊享。由于源碼不開放,所以無法移植源碼到自己的例程中:


imx8mp NPU測試圖片3



0.380392: 583 grocery store
0.321569: 957 custard apple
0.0862745: 955 banana
0.0352941: 956 jackfruit
0.027451: 954 pineapple


imx8mp NPU測試圖片4



0.254902: 918 comic book
0.0470588: 771 running shoe
0.0470588: 474 can opener
0.0470588: 412 apron
0.0392157: 794 shower cap


imx8mp NPU測試圖片5





0.121569: 656 miniskirt
0.054902: 835 suit
0.0470588: 852 television
0.0470588: 440 bearskin
0.0392157: 679 neck brace


imx8mp NPU測試圖片7



0.65098: 918 comic book
0.172549: 747 puck
0.0196078: 922 book jacket
0.0196078: 723 ping-pong ball
0.0117647: 806 soccer ball

圖片的識別結果均以編碼方式呈現,從識別的概率結果來看,飛凌的這款 iMX8MP 開發板的NPU的算力還是非常強的。


據官方介紹,i.MX 8M Plus處理器內置NPU,可達到2.3 TOPS(Tera Operations Per Second,1TOPS代表處理器每秒鐘可進行一萬億次操作)算術處理,并實現先進的AI算法處理。并且NXP為i.MX 8M Plus處理器的NPU提供了一些特定用例,例如能夠處理40,000多個英文單詞,MobileNet v1模型可以每秒處理超過500張圖像的圖像分類。




------------------------------------

作者簡介:


donatello1996,某大型企業資深嵌入式工程師,電子發燒友論壇技術大牛,同時也是飛凌嵌入式多年鐵粉,曾基于飛凌多款板卡產出過優質測評文章或使用心得。本期三篇文章為donatello1996在使用OKMX8MP-C開發板過程中精心產出的干貨,在此對donatello1996表示感謝。




相關產品 >

  • OKMX8MP-C開發板

    內置NPU、ISP,AI計算能力高達2.3TOPS|飛凌嵌入式i.MX8MP 系列-NXP iMX8M Plus 開發板 基于高性能低功耗工業級iMX8MP核心板設計,支持多種多種高速通信接口。iMX8MP開發板內置NPU,AI計算能力2.3TOPS,支持4K,支持雙圖像信號處理器(ISP),是一款支持LinuxQT/android操作系統的iMX8MP開發板。

    了解詳情
    OKMX8MP-C開發板
  • FETMX8MP-C核心板

    iMX8MP核心板基于 NXP  i.MX 8M Plus 處理器設計,  采用4核Cortex-A53 和 Cortex-M7架構。支持雙千兆網口,iMX8MP性能強勁最高運行速率可達2.3TOPS,并且i.MX8MP功耗更低≤2W 。iMX 8M Plus系列專注于機器學習和視覺、高級多媒體以及具有高可靠性的工業自動化。它旨在滿足智慧家庭、樓宇、城市和工業4.0應用的需求。飛凌iMX8MP核心板提供用戶手冊,iMX8MP原理圖,引腳定義等。
    了解詳情
    FETMX8MP-C核心板

推薦閱讀 換一批 換一批