Tag

#Ollama

5件の記事

技術解説2026-06-28

ローカルLLM（Ollama）の実力と限界——M4 MacでLlama 3・Gemmaを動かした結果

OllamaをM4 MacBookに入れてLlama 3 70B、Gemma 2 27B、Mistral 7Bを動かした実験レポート。処理速度・メモリ・回答品質をClaude Sonnetと比較しながら、プライバシー重視業務でのローカルLLM活用と現実的な限界を整理する。

技術解説2026-05-08

ChatGPTのAPIに頼らず、自分のPCでAIを動かしたい人へ。OllamaはMacでも数コマンドで使えるローカルLLMの入門として最適だ。プライバシー・コスト・オフライン利用——三つの問題を一気に解決する方法を実際の体験から書く。

技術解説2026-02-21

OllamaはREST APIでローカルLLMをプログラムから呼び出せます。PythonとNode.jsの両方でのチャット・ストリーミング・エンベディングの実装例と、Claude APIとの使い分け方を解説します。

技術解説2026-02-07

llama.cppはGPUなしでLLMを動かすことを可能にしたC++実装のオープンソースプロジェクト。そのアーキテクチャ、CUDAなしで高速推論できる理由、OllamaやLM Studioとの関係まで解説します。

技術解説2026-01-31

GGUFはローカル環境でLLMを動かすための量子化モデルフォーマットです。GGMLとの違い、Ollamaでの利用方法、Q4やQ8といった量子化レベルとメモリ要件の計算法まで分かりやすく解説します。