天樞集可編程性、通用性以及先進封裝技術(shù)于一體,其光學(xué)處理單元(OPU)核心最大支持到128x128矩陣規(guī)模,具備復(fù)雜可編程性,允許用戶通過API自由配置計算矩陣系數(shù)。支持1GHz工作頻率,光芯片上包含矩陣128X128光子計算矩陣,用戶可根據(jù)計算任務(wù)自定義矩陣大小,光/電芯片算力32/32TOPS,向量精度支持Uint4(4位無符號整數(shù)),權(quán)重精度支持Int4(4位有符號整數(shù)),輸出精度達8bit。
在軟件和應(yīng)用方面,與主流深度學(xué)習(xí)框架PyTorch和ONNX深度集成,提供了通用計算算子庫,電矩陣加速算子庫,光矩陣加速算子庫。通過PCIe高速接口,曦智天樞可無縫集成現(xiàn)有計算機系統(tǒng),適用于多種高性能計算場景。
(來源:AiNET)