0% read

Gemma 4をAMD GPUで動かす方法(ROCmセットアップガイド)

4月 7, 2026

AMD GPUをお持ちでGemma 4をローカルで動かしたいなら、朗報です。AMDはROCmを通じてGemma 4のDay 0サポートを提供しています。ただし、NVIDIAのプラグアンドプレイCUDAエコシステムと比べると、すべてを動作させるにはもう少しセットアップが必要です。このガイドでは、GPU互換性の確認からvLLMでの推論実行まで、全プロセスを解説します。

あなたのAMD GPUはGemma 4に対応している?

すべてのAMD GPUがROCmで動作するわけではありません。対応アーキテクチャのカードが必要です。クイックリファレンス:

GPUシリーズアーキテクチャROCmサポート備考
Radeon RX 7900 XTX/XTRDNA 3 (gfx1100)あり最良のコンシューマー向けオプション
Radeon RX 7800 XTRDNA 3 (gfx1101)あり良好なミドルレンジ
Radeon RX 7600RDNA 3 (gfx1102)部分的VRAM制限あり(8GB)
Instinct MI250XCDNA 2 (gfx90a)ありデータセンターGPU
Instinct MI300XCDNA 3 (gfx942)あり最高性能
Radeon RX 6000シリーズRDNA 2限定的コミュニティの回避策のみ

重要: アーキテクチャ文字列は完全に一致する必要があります。ROCmが間違ったアーキテクチャを検出すると、サイレント障害やガベージ出力が発生します。以下で確認してください:

rocminfo | grep "Name:" | grep "gfx"

LinuxへのROCmインストール

ROCmは本格的なMLワークロードにはLinux専用です。WSL2経由のWindowsサポートもありますが、限定的で本番環境には推奨されません。

ステップ1:カーネルとドライバーの確認

# カーネルバージョンの確認(5.15以上推奨)
uname -r

# amdgpuドライバーがロードされているか確認
lsmod | grep amdgpu

ステップ2:ROCmのインストール

Ubuntu 22.04/24.04の場合:

# AMDのパッケージリポジトリを追加
wget https://repo.radeon.com/amdgpu-install/latest/ubuntu/jammy/amdgpu-install_6.4.60401-1_all.deb
sudo dpkg -i amdgpu-install_6.4.60401-1_all.deb

# MLライブラリ付きでROCmをインストール
sudo amdgpu-install --usecase=rocm,ml

# ユーザーをrenderとvideoグループに追加
sudo usermod -aG render,video $USER

# 再起動
sudo reboot

ステップ3:インストールの確認

# ROCmの動作確認
rocm-smi

# GPUが温度やメモリ情報とともに表示されるはず

LemonadeツールでGemma 4を実行

AMDのLemonadeツールは、AMDハードウェアでGemma 4を最も簡単に動かす方法です。モデルのダウンロード、量子化、サービングを1つのパッケージで処理します。

# Lemonadeのインストール
pip install lemonade-sdk

# 自動最適化でGemma 4を実行
lemonade serve --model gemma-4-12b-it --device rocm

# 小さいモデルの場合
lemonade serve --model gemma-4-1b-it --device rocm

LemonadeはGPUアーキテクチャを自動検出し、適切な最適化を適用します。より高度なセットアップに移行する前の良い出発点です。

ROCm対応vLLMの使用

本番推論には、ROCmサポートのvLLMが最高のスループットを提供します:

# ROCmサポート付きvLLMのインストール
pip install vllm-rocm

# サーバーの起動
python -m vllm.entrypoints.openai.api_server \
  --model google/gemma-4-12b-it \
  --tensor-parallel-size 1 \
  --dtype float16 \
  --max-model-len 8192

SGLangの代替案

SGLangもROCmをサポートしており、特定のワークロードではより高速な場合があります:

pip install sglang[rocm]

python -m sglang.launch_server \
  --model-path google/gemma-4-12b-it \
  --port 8000 \
  --device rocm

よくある問題と解決策

「Triton backend required for multimodal」

AMDでGemma 4のビジョンやオーディオ機能を使おうとする場合、ROCm用にコンパイルされたTritonバックエンドが必要です:

# ROCmサポート付きTritonのインストール
pip install triton-rocm

# バックエンドを明示的に設定
export TRITON_BACKEND=rocm

これがないと、テキストのみの推論は問題なく動作しますが、マルチモーダル入力はサイレントに失敗するか暗号的なエラーを出します。

アーキテクチャ文字列の不一致

最も多い問題です。hipErrorNoBinaryForGpuのようなエラーが出る場合、アーキテクチャ文字列が一致していません:

# ROCmが認識しているGPUを確認
rocminfo | grep gfx

# 必要に応じてオーバーライド(RX 7900 XTXの例)
export HSA_OVERRIDE_GFX_VERSION=11.0.0

メモリ不足エラー

AMD GPUはNVIDIAとは異なるVRAMレポートをします。実際の利用可能メモリを確認:

rocm-smi --showmeminfo vram

# メモリ不足の場合、より小さい量子化を試す
# 16GBカードにはQ4_K_Mが最適

期待より性能が低い

誤ってCPUで実行されていないか確認:

# GPUが使用されているか確認
watch -n 1 rocm-smi

# 推論中にGPU使用率が0%以上であるべき

パフォーマンスの目安

Gemma 4 12B Q4_K_Mでのトークン生成速度の目安:

GPUVRAMトークン/秒備考
RX 7900 XTX24GB約35-45最良のコンシューマー向けAMDオプション
RX 7800 XT16GB約25-30ほとんどのタスクに十分
MI300X192GB約120以上データセンター、フル精度で動作
MI250X128GB約80以上前世代データセンター

WindowsとWSL2

どうしてもWindowsを使う必要がある場合、ROCmはWSL2で一部制限付きで動作します:

# WSL2 Ubuntu内で
sudo apt install rocm-hip-runtime
# HIPランタイムのみ — 完全なROCmスタックではない

Windowsでのより良い体験には、対応カードでAMD GPU検出を自動的に処理するOllamaの使用を検討してください。

次のステップ

AMD上でのGemma 4の実行は完全に可能です — NVIDIAより初期セットアップが少し多いだけです。ROCmが正しく設定されれば、パフォーマンスは競争力があり、AMDのDay 0サポートにより、NVIDIAユーザーと同時にアップデートを受け取れます。

gemma4 — interact

Stop reading. Start building.

~/gemma4 $ Get hands-on with the models discussed in this guide. No deployment, no friction, 100% free playground.

Launch Playground />
Gemma 4 AI

Gemma 4 AI

Related Guides

Gemma 4をAMD GPUで動かす方法(ROCmセットアップガイド) | ブログ