专题:llama.cpp

按该标签聚合的大模型资讯列表(自动分类与标签提取)。3 篇文章。

社区Reddit r/LocalLLaMA2026/02/23 21:344850

llama.cpp 项目已成功集成 Aya-101 多语言模型,该模型量化至 Q8 精度后内存占用低于 13GB,为高效多语言推理提供了可能。文章展示了通过 `curl` 调用本地 llama.cpp 服务进行文本翻译的示例,并提供了详细的 JSON 输出结果。尽管 Aya-101 在长文本处理上表现不错,但在习语理解方面仍有待提高。此次集成也确认了 ll…

社区Hacker News2026/02/15 06:3981

Off Grid是一款开源手机应用,允许用户在离线环境下运行AI文本生成、图像生成、语音转录和视觉处理功能。其核心亮点在于不依赖云端服务,保障用户隐私,同时利用硬件加速提升性能。支持多种AI技术栈,包括llama.cpp、Stable Diffusion、Whisper和SmolVLM/Qwen3-VL,适用于无网络或隐私敏感的场景。

媒体Lobsters AI2026/01/30 21:2640

LispE是一个开源Lisp语言,通过集成llama.cpp、tiktoken、mlx和PyTorch等库,实现了对AI模型的高效加载与推理。其API简洁,性能优于Python,尤其在处理GGUF模型和MLX指令集时表现突出。LispE支持直接使用C++代码进行高性能计算,为开发者和研究人员提供了更灵活的AI开发工具。