AMD GPUをお持ちでGemma 4をローカルで動かしたいなら、朗報です。AMDはROCmを通じてGemma 4のDay 0サポートを提供しています。ただし、NVIDIAのプラグアンドプレイCUDAエコシステムと比べると、すべてを動作させるにはもう少しセットアップが必要です。このガイドでは、GPU互換性の確認からvLLMでの推論実行まで、全プロセスを解説します。
あなたのAMD GPUはGemma 4に対応している?
すべてのAMD GPUがROCmで動作するわけではありません。対応アーキテクチャのカードが必要です。クイックリファレンス:
| GPUシリーズ | アーキテクチャ | ROCmサポート | 備考 |
|---|---|---|---|
| Radeon RX 7900 XTX/XT | RDNA 3 (gfx1100) | あり | 最良のコンシューマー向けオプション |
| Radeon RX 7800 XT | RDNA 3 (gfx1101) | あり | 良好なミドルレンジ |
| Radeon RX 7600 | RDNA 3 (gfx1102) | 部分的 | VRAM制限あり(8GB) |
| Instinct MI250X | CDNA 2 (gfx90a) | あり | データセンターGPU |
| Instinct MI300X | CDNA 3 (gfx942) | あり | 最高性能 |
| Radeon RX 6000シリーズ | RDNA 2 | 限定的 | コミュニティの回避策のみ |
重要: アーキテクチャ文字列は完全に一致する必要があります。ROCmが間違ったアーキテクチャを検出すると、サイレント障害やガベージ出力が発生します。以下で確認してください:
rocminfo | grep "Name:" | grep "gfx"LinuxへのROCmインストール
ROCmは本格的なMLワークロードにはLinux専用です。WSL2経由のWindowsサポートもありますが、限定的で本番環境には推奨されません。
ステップ1:カーネルとドライバーの確認
# カーネルバージョンの確認(5.15以上推奨)
uname -r
# amdgpuドライバーがロードされているか確認
lsmod | grep amdgpuステップ2:ROCmのインストール
Ubuntu 22.04/24.04の場合:
# AMDのパッケージリポジトリを追加
wget https://repo.radeon.com/amdgpu-install/latest/ubuntu/jammy/amdgpu-install_6.4.60401-1_all.deb
sudo dpkg -i amdgpu-install_6.4.60401-1_all.deb
# MLライブラリ付きでROCmをインストール
sudo amdgpu-install --usecase=rocm,ml
# ユーザーをrenderとvideoグループに追加
sudo usermod -aG render,video $USER
# 再起動
sudo rebootステップ3:インストールの確認
# ROCmの動作確認
rocm-smi
# GPUが温度やメモリ情報とともに表示されるはずLemonadeツールでGemma 4を実行
AMDのLemonadeツールは、AMDハードウェアでGemma 4を最も簡単に動かす方法です。モデルのダウンロード、量子化、サービングを1つのパッケージで処理します。
# Lemonadeのインストール
pip install lemonade-sdk
# 自動最適化でGemma 4を実行
lemonade serve --model gemma-4-12b-it --device rocm
# 小さいモデルの場合
lemonade serve --model gemma-4-1b-it --device rocmLemonadeはGPUアーキテクチャを自動検出し、適切な最適化を適用します。より高度なセットアップに移行する前の良い出発点です。
ROCm対応vLLMの使用
本番推論には、ROCmサポートのvLLMが最高のスループットを提供します:
# ROCmサポート付きvLLMのインストール
pip install vllm-rocm
# サーバーの起動
python -m vllm.entrypoints.openai.api_server \
--model google/gemma-4-12b-it \
--tensor-parallel-size 1 \
--dtype float16 \
--max-model-len 8192SGLangの代替案
SGLangもROCmをサポートしており、特定のワークロードではより高速な場合があります:
pip install sglang[rocm]
python -m sglang.launch_server \
--model-path google/gemma-4-12b-it \
--port 8000 \
--device rocmよくある問題と解決策
「Triton backend required for multimodal」
AMDでGemma 4のビジョンやオーディオ機能を使おうとする場合、ROCm用にコンパイルされたTritonバックエンドが必要です:
# ROCmサポート付きTritonのインストール
pip install triton-rocm
# バックエンドを明示的に設定
export TRITON_BACKEND=rocmこれがないと、テキストのみの推論は問題なく動作しますが、マルチモーダル入力はサイレントに失敗するか暗号的なエラーを出します。
アーキテクチャ文字列の不一致
最も多い問題です。hipErrorNoBinaryForGpuのようなエラーが出る場合、アーキテクチャ文字列が一致していません:
# ROCmが認識しているGPUを確認
rocminfo | grep gfx
# 必要に応じてオーバーライド(RX 7900 XTXの例)
export HSA_OVERRIDE_GFX_VERSION=11.0.0メモリ不足エラー
AMD GPUはNVIDIAとは異なるVRAMレポートをします。実際の利用可能メモリを確認:
rocm-smi --showmeminfo vram
# メモリ不足の場合、より小さい量子化を試す
# 16GBカードにはQ4_K_Mが最適期待より性能が低い
誤ってCPUで実行されていないか確認:
# GPUが使用されているか確認
watch -n 1 rocm-smi
# 推論中にGPU使用率が0%以上であるべきパフォーマンスの目安
Gemma 4 12B Q4_K_Mでのトークン生成速度の目安:
| GPU | VRAM | トークン/秒 | 備考 |
|---|---|---|---|
| RX 7900 XTX | 24GB | 約35-45 | 最良のコンシューマー向けAMDオプション |
| RX 7800 XT | 16GB | 約25-30 | ほとんどのタスクに十分 |
| MI300X | 192GB | 約120以上 | データセンター、フル精度で動作 |
| MI250X | 128GB | 約80以上 | 前世代データセンター |
WindowsとWSL2
どうしてもWindowsを使う必要がある場合、ROCmはWSL2で一部制限付きで動作します:
# WSL2 Ubuntu内で
sudo apt install rocm-hip-runtime
# HIPランタイムのみ — 完全なROCmスタックではないWindowsでのより良い体験には、対応カードでAMD GPU検出を自動的に処理するOllamaの使用を検討してください。
次のステップ
- 問題がある場合は? Gemma 4トラブルシューティングガイドで最も一般的な問題の解決策を確認
- ハードウェアが十分かわからない? ハードウェア要件ガイドで詳細なVRAMとRAMの推奨を確認
- モデルを比較したい? どのGemma 4モデルを選ぶべきか?でAMD GPUに最適なサイズを選択
AMD上でのGemma 4の実行は完全に可能です — NVIDIAより初期セットアップが少し多いだけです。ROCmが正しく設定されれば、パフォーマンスは競争力があり、AMDのDay 0サポートにより、NVIDIAユーザーと同時にアップデートを受け取れます。
Stop reading. Start building.
~/gemma4 $ Get hands-on with the models discussed in this guide. No deployment, no friction, 100% free playground.
Launch Playground />


