专题:large-language-model

按该标签聚合的大模型资讯列表(自动分类与标签提取)。18 篇文章。

媒体爱范儿2026/04/02 17:596520
豆包大模型日均 120 万亿 Token,成本 30‑50 亿元
AI 视频创作与智能体推动 Token 使用激增

火山引擎披露豆包大模型日均 120 万亿 Token 消耗,折算成本达 30‑50 亿元人民币,显示国内 AI 需求爆发。中国 Token 使用量已突破 140 万亿,全球占比 36%,智能体和视频生成是主要驱动。企业需关注模型质量、安全和 Skills,云厂商正因 Token 计费上涨价格。

社区Hacker News2026/02/22 20:345430

Stripe发布了Minions,一款创新的一次性、端到端AI编码助手。该工具旨在通过自动化代码编写任务,显著提升开发者的工作效率并节省时间。Minions的核心技术基于先进的大语言模型(LLM)和Transformer架构,使其能够精准理解用户需求,并根据简洁的指令生成高质量的代码片段或完整程序。其即插即用的特性极大地简化了开发流程,特别适用于需要快速迭…

社区Reddit r/LocalLLaMA2026/02/22 17:582570

本文系统评测了 GPT/Codex、Claude Sonnet/Opus 等 AI 编码助手在真实项目中的表现。结果显示,它们在 Python、JavaScript 等脚本语言上能加速小型原型开发,但在 Java、C++ 等强类型语言以及大型系统中仍需大量人工调试。资深开发者倾向于让 AI 负责重复性代码生成,而自行把控架构设计。文章还指出本地化模型检索不…

官方OpenAI News2026/02/20 22:304630

团队在“First Proof”数学挑战中首次提交了基于大语言模型的自动证明实验。通过微调 GPT‑4‑Turbo 并使用链式思考提示,模型在 10 条高阶定理中生成了 3 份形式化草稿,其中 1 份在 Coq 中通过基本检查。实验展示了模型在推理速度上的优势,但在逻辑严谨性和跨领域概念掌握上仍有显著不足,后续将引入交互式定理证明器进行闭环优化。

媒体量子位2026/02/20 09:258750

Google 于 2026 年 2 月推出 Gemini 3.1 Pro,基于 Gemini 3 Pro 进行大幅升级:推理能力提升约 2 倍,支持 1 M token 长上下文,增强多模态生成与代码推理,并在保持原有计费的前提下实现约 10 倍成本下降。该模型已在 Gemini 应用、API 与 NotebookLM 中开放,适用于复杂可视化、长文档推理…

社区Reddit r/LocalLLaMA2026/02/09 21:0340

Hugging Face Transformers 库迎来重要更新,新增了对 GLM-5 模型的全面支持。此次更新通过一个拉取请求(PR)详细披露了 GLM-5 的核心架构设计与关键参数配置,旨在促进该模型在开源社区的广泛应用与研究。用户现在可以通过 Transformers 框架便捷地访问和利用 GLM-5 模型,进一步推动大型语言模型技术的发展与创新。…

媒体Experimental History2025/08/06 04:064630
AI本质是词袋模型,依赖训练数据
AI无真正思维,仅模式匹配输出

文章将人工智能比喻为‘词袋’,强调其基于训练数据生成回答的机制。指出AI缺乏真正的思维,依赖模式匹配,存在逻辑偏差和信息缺失问题。同时提醒读者避免用人类标准衡量AI,有助于理解其运作原理和潜在风险。