日韩专区第一页-日韩中文字幕在线亚洲一区-日韩中文字幕在线观看视频-日韩中文字幕在线播放-日韩中文字幕一区二区不卡-日韩中文字幕一区

OpenI 啟智社區

啟智社區,確實給力

項目簡介

 OpenI 海藻是鵬城實驗室和北京大學聯合開發,并貢獻到啟智平臺的一款可配置指令集和微架構的AI開源芯片。

此項目可用于以下三個方面:

01 教育

提供復現已有技術和嘗試新技術的基礎框架,降低處理器開發的入門門檻

02 新場景

商用AI芯片未必有足夠利潤動力滿足大量碎片化的需求(物聯網的特征) ,以開源AI處理器作為基礎,賦能小市場針對碎片化需求的定制開發。

03 新算法

現有AI芯片未能優化的計算模式(如圖神經網絡、結合MLP/LSTM和圖計算特征) ,以開源AI處理器作為基礎,積累開源的算法部件,賦能新算法的敏捷開發。

開源AI處理器海藻(Varec)的使用流程


海藻(Varec)的使用流程







海藻 (Varec) 項目介紹


Varec 微架構

  • v0.1版約5000行代碼
  • 架構級 Load/Execute/Store 模塊
  • 系統級 AXI 和 Shell 模塊支持 Xilinx 加速卡


Varec 指令集

  •  “宏指令+微操作”兩層架構
  •  MEM和EXEC兩類宏指令
  • 年底支持多種數據精度表示


指令集:架構和編譯的解耦合

  • 編譯根據指令性能估算生成指令
  • 架構重新分配資源調整指令性能
  • 重復以上步驟,迭代優化


Varec 編譯后端

  • 兼容TVM前端

  • 可根據后端硬件自動生成CPU和加速器指令,以支持多種網絡推理

  • 支持AutoTVM和AutoTune工具進行編譯優化


海藻FPGA部署示意圖


海藻 (Varec) 項目目標


1、架構可配置的開源AI硬件


2、算子可配置的開源AI硬件

未來目標

項目動態

  1. 與國網聯研院合作開發,VAREC支持Yolo模型推理,在嵌入式開發板上驗證效果

  2. 擴展加速器為多核加速器,并修改編譯后端支持多核執行

    • 單核yolo推理速度:2.43fps

    • 雙核yolo推理速度:3.23fps

  3. 集成Systolic array到Execute模塊提高計算性能

    • 原先性能:35.1GOPS

    • 集成SA性能:74.3GOPS

項目動態