topへ
メモリ技術

エマージングメモリのAIへの応用

「MRAMは次世代インメモリコンピューティングの主役となるか? 技術的可能性と課題を探る」(メモリ技術 2025.8.14)では、MRAMのインメモリコンピューティング(IMC)への応用について、FeRAM(Ferroelectric Random Access Memory、FRAMとも呼ばれる)と比較しながら紹介しました[1]。

本稿ではMRAMだけでなく、エマージングメモリ(FeRAM、MRAM、PCRAMなどの新しい不揮発性メモリ技術)がなぜAIコンピューティングに適しているのかを説明します。特に、AIの機械学習や推論で使われる人工ニューラルネットワーク(Artificial Neural Network: ANN)を例に解説します[2]。

ノイマンのボトルネック

現在広く使われているコンピュータはフォン・ノイマン型コンピュータと呼ばれる構造を持っています(図1)。この方式では、

  • データを処理する装置(CPUやGPU)
  • データを保存するメモリ

が分かれています。

そのため、計算のたびに演算装置とメモリの間で大量のデータをやり取りする必要があります。このデータ転送に時間がかかるため、以下の問題があります。

  • 計算速度が遅くなる
  • 消費電力が増える

この問題は「ノイマンのボトルネック」と呼ばれています(図2)。

特に最近のAIでは処理するデータ量が非常に大きいため、この問題が深刻になっています。そのため現在のAIシステムでは、HBM(High Bandwidth Memory)と呼ばれる高速DRAMが使われています。しかしHBMは製造が難しく、価格が高く、供給量が限られるという欠点があります。[3]。

図1. フォン・ノイマン型コンピューティングの概念
図2. データセンター·半導体工場の新増設に 伴う個別計上最大需要電力(万 kW) [3]

人工ニューラルネットワーク(ANN)

AIの機械学習や推論では、人工ニューラルネットワーク(ANN)[2]がよく使われます。

ANNは、人間の脳の神経細胞(図3)をまねて作られた形式ニューロン(図4)という計算単位から構成されています。

形式ニューロンは、
複数の入力信号 x1, x2, …, xN をうけとり、
それぞれに重み w1, w2, …, wN を掛けて足し合わせ、
活性化関数 𝑓と閾値 𝜃によって出力を決めます。

y = f (w1x1 + w2x2 + … + wN xN) – θ  [2]

実際のANNでは、この形式ニューロンを多数組み合わせた層構造(図5)になっています。各層の出力が次の層の入力となり、情報が順に伝わっていきます。

AIコンピューティングでは、入力値、出力値、重みを何度も計算しながら学習や推論を行います。しかしフォン・ノイマン型コンピュータでは、メモリとのデータ転送が多くなるため、消費電力が大きい、計算に時間がかかる、という問題が顕著になります。

図3. 神経細胞の概念図
図4. 形式ニューロン[2]

インメモリコンピューティング

ANNの計算で最も重要なのは次の積和演算です。

w1x1 + w2x2 + … + wN xN

従来のコンピュータでは、この計算をデジタル回路で行っていました。しかし、エマージングメモリを用いると、この計算をメモリ回路の中で直接実行することができます。これをインメモリコンピューティングと呼びます。

例えば図6(a)の回路では、

N行目のワードライン(WLN)に加える電圧をVN 
N行M列目のメモリ素子の可変抵抗を含めたトランジスタの相互コンダクタンスをGNMとすると、
M列目のビットライン(BLM)に流れる電流IMは、

IM = i1M + i2M + … + iNM …  

     = V1G1M + V2G2M + … + VN GNM …  

となります。各素子を流れる電流が加算されることで、積和演算の結果が自然に得られます。ANNとの関係は以下のようになります。図中SLはソースラインを表します。

V → x
G → w
I → w1x1 + w2x2 + … + wN xN

この方式の重要な特徴は、重み情報がメモリ素子に直接保存されることです。
そのため、DRAMなどとのデータ転送が不要になり、消費電力が低くなる、計算の遅延が減る、という利点があります。
この回路はReRAMだけでなく、FeRAM、MRAM、PCRAMなどでも実現できます。

図5. 積和演算回路(ReRAM)[4]
図6. ニューラルネットワークの例. 円は ANN を表す

各エマージングメモリのインメモリコンピューティングへの応用

ReRAM

  • ReRAM[4]は抵抗値が変化するメモリです。
  • 複数の抵抗状態を作ることができるため、これを重みとして利用できます。
  • クロスバー構造(*1)と呼ばれる回路を用いることで、行列演算をメモリ内部で直接実行できます。
  • 高速、低消費電力といった特徴があり、AIアクセラレータに適した技術と考えられています。

*1 縦方向の配線(ビット線)と横方向の配線(ワード線)を格子状に交差させ、その交点にメモリセル(データを記憶する素子)を配置する極めて高密度なメモリレイアウトのこと。

MRAM

磁気トンネル接合(Magnetic Tunnel Junction: MTJ)の抵抗値(磁気抵抗)を重みとして機能させます。AI 用途でも最も市場規模が伸びやすい技術と評価されています。[5]

FeRAM

強誘電体膜の分極状態を利用して、アナログ重みを高速/低電力制御できます。ニューロモーフィックコンピューティング(*2)およびリザバーコンピューティング(*3)への応用研究が盛んにおこなわれています。[6]

*2 ニューロモーフィックコンピューティング:人間の脳の働きを模倣するコンピューティング手法です。情報処理のために脳の神経とシナプスの構造と機能をシミュレートするハードウェアとソフトウェアを設計する必要があります[7]。

*3 リザバーコンピューティングは、従来のコンピューティング技術と比較して、電力や学習時の演算リソースなどを大幅に抑えながら、人の声やモノの動きのように、時々刻々と変化するデータをリアルタイムで捉え、認識・予測する新しい計算手法の1つです[8]。

PCRAM

PCRAM は結晶/アモルファス状態による多値抵抗を使い、アナログ的な重み表現に適するとされ、生体シナプスの模倣に有望と IEICE 特集で報告されています[9]。

市場予測

インメモリコンピューティングの市場は、民間調査会社によると2025年245 億ドル (約 3兆5000千億円)、2034年には971億ドル (14兆6千億円)であり、今後成長が期待されています[10]。

参考文献

著者
惠下 隆
RAMXEED株式会社
工学博士・シニアプロフェッショナル

この記事をシェア