AI推論の遅延は計算力不足ではなくメモリー帯域の限界に起因する。d-Matrixは学習用チップの転用という常識を捨て、推論に特化したメモリー中心のアーキテクチャで勝負に出た。推論最適化の真打ちが登場した。
#AIハードウェア #dMatrix
0
0
0
0
AI推論の遅延は計算力不足ではなくメモリー帯域の限界に起因する。d-Matrixは学習用チップの転用という常識を捨て、推論に特化したメモリー中心のアーキテクチャで勝負に出た。推論最適化の真打ちが登場した。
#AIハードウェア #dMatrix
D‑Matrix stacks DRAM as HBM for AI inference, promising 10× performance
D‑Matrix’s Corsair pairs 256 GB of LPDDR5 with 2 GB of SRAM, and its Pavehawk adds stacked‑DRAM on TSMC’s N5 process, targeting HBM‑class performance at lower cost. Read more: getnews.me/d-matrix-stacks-dram-as-... #dmatrix #corsair #pavehawk