媒体InfoQ 中文2026/04/03 22:405810
• 谷歌开源Gemma大模型系列
• 支持手机端离线Agent运行
谷歌开源Gemma系列大模型,主打手机端离线Agent支持与内存优化技术。通过动态内存分配和量化压缩,实现轻量化部署。对比Qwen等竞品,突出其在参数规模、推理效率及资源占用方面的优势,为移动端AI应用提供新方案。
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 4 篇文章。
谷歌开源Gemma系列大模型,主打手机端离线Agent支持与内存优化技术。通过动态内存分配和量化压缩,实现轻量化部署。对比Qwen等竞品,突出其在参数规模、推理效率及资源占用方面的优势,为移动端AI应用提供新方案。
本文深入解析AI代理的可观测性与评估方法,强调其与传统软件的不同。通过追踪代理的执行过程,开发者可以更有效地调试推理逻辑、验证工具调用和维护上下文。文章介绍了三种核心可观测性原语和三种评估粒度,并指出LangSmith等工具在代理开发中的重要性。
Sarathi AI 是一款开源 Chrome 扩展,采用纯 DOM 数据而非截图进行 AI 浏览器自动化。它为页面可见元素分配唯一 ID,提取标签、文本等元信息后发送给 LLM,LLM 返回点击、输入、导航等指令,由扩展执行。该方案省去视觉模型和后端服务,提升速度与确定性,已在约 90% 的普通网站上实现 Gmail 回复、表单填充、电商购物等功能,但在…
本文记录了在本地使用 OpenClaw、Claude 3.5 Sonnet 与 Telegram 搭建自主代理的完整实践,重点揭示了架构设计、Node v24 兼容、递归步数与 token 消耗、Webhook 配置误区以及文件系统沙箱的重要性,并给出工具权限、循环限制和成本控制的可操作建议,为开发者提供了一套实战级的部署与安全指南。