Mac OSでllama.cpp (1) インストール

まずはwgetをインストールして、wget でバイナリーをダウンロードする

brew install wget
cd Download
wget https://github.com/ggml-org/llama.cpp/releases/download/b9537/llama-b9537-bin-macos-arm64.tar.gz
tar -xvf llama-b9357-bin-macos-arm64.tar.gz
cd  llama-b9357

モデルを保存するフォルダーを作って 

mkdir model
cd model

モデルをダウンロードgema4-e4bをダウンロード 

huggingfaceから量子化4bitのGGUFのものをダウンロード、リンクをコピーすると、最後に"?download=true"がついているのでこれを消してwgetでダウンロード

 wget https://huggingface.co/google/gemma-4-E4B-it-qat-q4_0-gguf/resolve/main/gemma-4-E4B_q4_0-it.gguf?download=true

 llama-b9357のままだとあれなので、llama_cppにディレクトリを変更

 

 ./llama_cpp/llama-server --host 0.0.0.0 --port 8080 --models-dir llama_cpp/models -ngl 99

で起動できる。がサービスにするのがまた手こずっている。

以下のページ参考にちょっと次を進めよう


コメント

このブログの人気の投稿

ImDisk Toolkitが開発終了していた。AIM Toolkitに乗り換え

Windows 10 デフォルトゲートウェイに0.0.0.0が追加される

iOS VLC でSMB共有できなかった点について