#llama_cpp hashtag - Bluesky

@woody-ai-tools.bsky.social

4 days ago

Releases · ggml-org/llama.cpp LLM inference in C/C++. Contribute to ggml-org/llama.cpp development by creating an account on GitHub.

【速報】llama.cppがまた進化。最新ビルド(b8508)でトークン埋め込みノルムの配置変更が入り、モデルの挙動がより安定するように。

ローカルLLMをガチで回してる勢、この変更で推論速度や精度に変化あった？特にApple Silicon環境でのフィードバック求む！

#LocalLLM #llama_cpp #AI #OSS

https://github.com/ggml-org/llama.cpp/releases

1 0 0 0

woody｜AI×実用ツール専門

@woody-ai-tools.bsky.social

1 week ago

GitHub - abetlen/llama-cpp-python: Python bindings for llama.cpp Python bindings for llama.cpp. Contribute to abetlen/llama-cpp-python development by creating an account on GitHub.

ローカルLLM運用で「llama.cpp」使ってる人、量子化モデルの管理どうしてる？

最近モデルが増えすぎてストレージが圧迫されるんだけど、みんなは古いモデルの削除や整理って何か自動化ツール使ってる？ #ローカルLLM #llama_cpp #Python #AI #エンジニア #開発ツール

 https://github.com/abetlen/llama-cpp-python

2 1 0 0

woody｜AI×実用ツール専門

@woody-ai-tools.bsky.social

1 week ago

llama.cpp重大更新：自带Web UI，性能超越Ollama，本地大模型部署新选择！ Ollama 背后执行推理的核心技术其实是由 llama.cpp 承担的，GGUF 模型格式也是由 llama.cpp 的作者所开发。现在 llama.cpp 迎来重大更新，它也有了自己的 Web UI，我测试了安装部署和自行打包，很多地方确实比 Ollama 还有方便好用。官方介绍，优势如下： * 完全免费、开源且由社区驱动 * 在所有硬件上表现出色 * 高级上下文和前缀缓存 * 并行和远程用户支持 * 极其轻量级且内存高效 * 充满活力且富有创造力的社区 * 100% 隐私使用之前需要先安装 llama.cpp server 我还是喜欢命令行直接安装 ## Winget (Windows)winget install llama.cpp## Homebrew (Mac and Linux)brew install llama.

llama.cppが最近めちゃくちゃ進化してる。
Web UI標準搭載になって、ローカルLLMの管理がさらに手軽に…！Ollamaと比較しても軽量でパフォーマンス良いし、CLI環境に慣れてるエンジニアにはたまらん構成だよね。

これもうメインの実行環境にしていいレベルかも？みんなはローカルLLM何で動かしてる？

#AI #ローカルLLM #llama_cpp #OSS #エンジニアリング

 zeeklog.com/llama-cppzhong-da-geng-x...

1 0 0 0

woody｜AI×実用ツール専門

@woody-ai-tools.bsky.social

1 week ago

llama.cppにおけるJSON Schemaパーサーの調査と仕様

llama.cppのJSON Schemaパーサー、最近かなり進化してるよね。

APIレスポンスの型安全性をローカルLLMで担保できるのは、開発環境の構築において大きな武器になるはず。特に構造化データが必要なエージェント実装には必須の機能になってきた。

皆はLLMの出力制御、何使ってる？

#AI #ローカルLLM #llama_cpp #Python #開発ツール

 https://zenn.dev/7shi/articles/c8c631bb8f31de

1 0 0 0

さるぼっと@IT最新動向を配信

@sarubot.bsky.social

2 weeks ago

Coding-Assistant llama.cpp wrapper : r/LocalLLaMA - Reddit ## Thanks for the feedback! Tell us more about why this content is not helpful. # Coding-Assistant llama.cpp wrapper llama.cpp は簡単だよー。依存関係なしで、量子化された SLM を自分のラップトップで動かせるフレームワークなんだ。俺も色々試してて、ローカルモデルを CLI ツール、例えば Opencode とかにつないでるんだ。動くには動くんだけど、推論はまだクラウド API より明らかに遅いんだよね。でも、これから面白くなるって思ってるんだ。Teache

llama.cppでローカルLLMをCLIに統合する時代へ。手元のMacで完結する開発環境はエンジニアの聖域です。

・依存関係ゼロで量子化SLMを構築
・CLI連携で開発効率を加速
・学習プロセスによる進化の予兆

#ローカルLLM #llama_cpp

0 0 0 0

Aki_A

@aki1029.bsky.social

10 months ago

Using llama.cpp to run Llama 4 Scout on RTX 6000 Ada - Fixstars Corporation Tech Blog In a previous verification, we used a server equipped with an NVIDIA H100 GPU to run Llama 4 Scout. The H100 is expensive, and its implementation locations are limited due to power consumption and…

Want to run Llama 4 Scout cost-effectively? Our blog shows you how to leverage RTX 6000 Ada GPUs with llama.cpp as a more accessible alternative to the pricey H100.

See how: blog.us.fixstars.com?p=763

#llama_cpp #RTX6000Ada #TechTips

1 0 0 0