Gemma 4をAMD GPUで動かす方法（ROCmセットアップガイド）

AMD GPUをお持ちでGemma 4をローカルで動かしたいなら、朗報です。AMDはROCmを通じてGemma 4のDay 0サポートを提供しています。ただし、NVIDIAのプラグアンドプレイCUDAエコシステムと比べると、すべてを動作させるにはもう少しセットアップが必要です。このガイドでは、GPU互換性の確認からvLLMでの推論実行まで、全プロセスを解説します。

あなたのAMD GPUはGemma 4に対応している？

すべてのAMD GPUがROCmで動作するわけではありません。対応アーキテクチャのカードが必要です。クイックリファレンス：

GPUシリーズ	アーキテクチャ	ROCmサポート	備考
Radeon RX 7900 XTX/XT	RDNA 3 (gfx1100)	あり	最良のコンシューマー向けオプション
Radeon RX 7800 XT	RDNA 3 (gfx1101)	あり	良好なミドルレンジ
Radeon RX 7600	RDNA 3 (gfx1102)	部分的	VRAM制限あり（8GB）
Instinct MI250X	CDNA 2 (gfx90a)	あり	データセンターGPU
Instinct MI300X	CDNA 3 (gfx942)	あり	最高性能
Radeon RX 6000シリーズ	RDNA 2	限定的	コミュニティの回避策のみ

重要： アーキテクチャ文字列は完全に一致する必要があります。ROCmが間違ったアーキテクチャを検出すると、サイレント障害やガベージ出力が発生します。以下で確認してください：

rocminfo | grep "Name:" | grep "gfx"

LinuxへのROCmインストール

ROCmは本格的なMLワークロードにはLinux専用です。WSL2経由のWindowsサポートもありますが、限定的で本番環境には推奨されません。

ステップ1：カーネルとドライバーの確認

# カーネルバージョンの確認（5.15以上推奨）
uname -r

# amdgpuドライバーがロードされているか確認
lsmod | grep amdgpu

ステップ2：ROCmのインストール

Ubuntu 22.04/24.04の場合：

# AMDのパッケージリポジトリを追加
wget https://repo.radeon.com/amdgpu-install/latest/ubuntu/jammy/amdgpu-install_6.4.60401-1_all.deb
sudo dpkg -i amdgpu-install_6.4.60401-1_all.deb

# MLライブラリ付きでROCmをインストール
sudo amdgpu-install --usecase=rocm,ml

# ユーザーをrenderとvideoグループに追加
sudo usermod -aG render,video $USER

# 再起動
sudo reboot

ステップ3：インストールの確認

# ROCmの動作確認
rocm-smi

# GPUが温度やメモリ情報とともに表示されるはず

LemonadeツールでGemma 4を実行

AMDのLemonadeツールは、AMDハードウェアでGemma 4を最も簡単に動かす方法です。モデルのダウンロード、量子化、サービングを1つのパッケージで処理します。

# Lemonadeのインストール
pip install lemonade-sdk

# 自動最適化でGemma 4を実行
lemonade serve --model gemma-4-12b-it --device rocm

# 小さいモデルの場合
lemonade serve --model gemma-4-1b-it --device rocm

LemonadeはGPUアーキテクチャを自動検出し、適切な最適化を適用します。より高度なセットアップに移行する前の良い出発点です。

ROCm対応vLLMの使用

本番推論には、ROCmサポートのvLLMが最高のスループットを提供します：

# ROCmサポート付きvLLMのインストール
pip install vllm-rocm

# サーバーの起動
python -m vllm.entrypoints.openai.api_server \
  --model google/gemma-4-12b-it \
  --tensor-parallel-size 1 \
  --dtype float16 \
  --max-model-len 8192

SGLangの代替案

SGLangもROCmをサポートしており、特定のワークロードではより高速な場合があります：

pip install sglang[rocm]

python -m sglang.launch_server \
  --model-path google/gemma-4-12b-it \
  --port 8000 \
  --device rocm

よくある問題と解決策

「Triton backend required for multimodal」

AMDでGemma 4のビジョンやオーディオ機能を使おうとする場合、ROCm用にコンパイルされたTritonバックエンドが必要です：

# ROCmサポート付きTritonのインストール
pip install triton-rocm

# バックエンドを明示的に設定
export TRITON_BACKEND=rocm

これがないと、テキストのみの推論は問題なく動作しますが、マルチモーダル入力はサイレントに失敗するか暗号的なエラーを出します。

アーキテクチャ文字列の不一致

最も多い問題です。hipErrorNoBinaryForGpuのようなエラーが出る場合、アーキテクチャ文字列が一致していません：

# ROCmが認識しているGPUを確認
rocminfo | grep gfx

# 必要に応じてオーバーライド（RX 7900 XTXの例）
export HSA_OVERRIDE_GFX_VERSION=11.0.0

メモリ不足エラー

AMD GPUはNVIDIAとは異なるVRAMレポートをします。実際の利用可能メモリを確認：

rocm-smi --showmeminfo vram

# メモリ不足の場合、より小さい量子化を試す
# 16GBカードにはQ4_K_Mが最適

期待より性能が低い

誤ってCPUで実行されていないか確認：

# GPUが使用されているか確認
watch -n 1 rocm-smi

# 推論中にGPU使用率が0%以上であるべき

パフォーマンスの目安

Gemma 4 12B Q4_K_Mでのトークン生成速度の目安：

GPU	VRAM	トークン/秒	備考
RX 7900 XTX	24GB	約35-45	最良のコンシューマー向けAMDオプション
RX 7800 XT	16GB	約25-30	ほとんどのタスクに十分
MI300X	192GB	約120以上	データセンター、フル精度で動作
MI250X	128GB	約80以上	前世代データセンター

WindowsとWSL2

どうしてもWindowsを使う必要がある場合、ROCmはWSL2で一部制限付きで動作します：

# WSL2 Ubuntu内で
sudo apt install rocm-hip-runtime
# HIPランタイムのみ — 完全なROCmスタックではない

Windowsでのより良い体験には、対応カードでAMD GPU検出を自動的に処理するOllamaの使用を検討してください。

次のステップ

問題がある場合は？ Gemma 4トラブルシューティングガイドで最も一般的な問題の解決策を確認
ハードウェアが十分かわからない？ ハードウェア要件ガイドで詳細なVRAMとRAMの推奨を確認
モデルを比較したい？ どのGemma 4モデルを選ぶべきか？でAMD GPUに最適なサイズを選択

AMD上でのGemma 4の実行は完全に可能です — NVIDIAより初期セットアップが少し多いだけです。ROCmが正しく設定されれば、パフォーマンスは競争力があり、AMDのDay 0サポートにより、NVIDIAユーザーと同時にアップデートを受け取れます。

gemma4 — interact

Stop reading. Start building.

~/gemma4 $ Get hands-on with the models discussed in this guide. No deployment, no friction, 100% free playground.

Launch Playground />