Xで流れてきた情報を参考にしてgemma.cppをMacBook Pro 2023で動かしてみた。
参考サイト
手順
- ターミナルを開く。
- githubからgemma.cppのコードを取得
- ディレクトリを移動し、ビルドする。
- モデルをkaggleからダウンロードし、展開する。
- 実行する。
gemma.cppのビルド
gemma.cppリポジトリのクローン
gitコマンドでgithubからgemma.cppのコードをクローンする。コマンドを実行するディレクトリは適当な場所でよい。
git clone https://github.com/google/gemma.cpp
gemma.cppのビルド
クローンしたコードのディレクトリへ移動し、cmakeコマンドでビルド用ディレクトリbuildの準備とビルドの実行。
cd gemma.cpp
cmake -B build
cmake --build --preset make -j 8
-j 8
は8スレッドでコンパイルすることを指示している。
モデルのダウンロードと展開
kagglにサインインし、モデルをダウンロードする。ここでは2b-it-sfp
をダウンロードフォルダにダウンロード(~/Downloads
)している。
ダウンロードされるモデルのファイル名はarchive.tar.gz
となる。
モデルの展開先を作成し、このファイルをtarコマンドでそのディレクトリへ展開する。
mkdir 2b-it-sfp
tar xzfv ~/Downloads/archive.tar.gz -C 2b-it-sfp
実行
./build/gemma \
--tokenizer ./2b-it-sfp/tokenizer.spm \
--compressed_weights ./2b-it-sfp/2b-it-sfp.sbs \
--model 2b-it \
--verbosity 1