Mac OSでllama.cpp (1) インストール
まずはwgetをインストールして、wget でバイナリーをダウンロードする
brew install wget
cd Download
wget https://github.com/ggml-org/llama.cpp/releases/download/b9537/llama-b9537-bin-macos-arm64.tar.gz
tar -xvf llama-b9357-bin-macos-arm64.tar.gz
cd llama-b9357
モデルを保存するフォルダーを作って
mkdir model
cd model
モデルをダウンロードgema4-e4bをダウンロード
huggingfaceから量子化4bitのGGUFのものをダウンロード、リンクをコピーすると、最後に"?download=true"がついているのでこれを消してwgetでダウンロード
wget https://huggingface.co/google/gemma-4-E4B-it-qat-q4_0-gguf/resolve/main/gemma-4-E4B_q4_0-it.gguf
?download=true
llama-b9357のままだとあれなので、llama_cppにディレクトリを変更
./llama_cpp/llama-server --host 0.0.0.0 --port 8080 --models-dir llama_cpp/models -ngl 99
で起動できる。がサービスにするのがまた手こずっている。
以下のページ参考にちょっと次を進めよう
- https://ai.hack-le.com/mac-launchd/ Macで自動化する:launchdを使ってスクリプトを起動時に実行する方法
- https://zenn.dev/supertaro/articles/ea48ff146f42a9 Mac Mini M4 (16GB) をサーバー運用で初期化
- https://note.com/satoshi_hayasaki/n/neae2e74a2752 Mac mini M4をローカルAIエージェントサーバーに仕立てた全記録【Day 1】
コメント
コメントを投稿