专题:ai-model

按该标签聚合的大模型资讯列表(自动分类与标签提取)。13 篇文章。

官方Simon Willison2026/03/30 22:285730
基于19世纪文学训练的对话模型
本地部署成功,使用HuggingFace权重

Mr. Chatterbox是基于维多利亚时代英国文学训练的对话模型,完全使用19世纪文本,无现代数据。模型在文学语境下表现良好,但实用性不足,作者成功实现本地部署,并公开了训练方法。

媒体Latent Space2026/03/04 11:114740

近期AI/LLM领域动态频发,Anthropic凭借190亿美元年化收入展现强劲商业化能力,预示大模型市场竞争白热化。同时,Google的Gemini 3.1 Flash-Lite和OpenAI的GPT-5.3 Instant等轻量级、高效率模型加速迭代,推动AI应用向更低延迟、更广场景渗透。开源社区方面,Qwen团队成员的离职引发对开源项目稳定性和人才流…

媒体InfoQ 中文2026/02/20 17:196820

Google DeepMind推出Gemini 3.1 Pro,12项基准测试中全面超越Claude和GPT-4。核心亮点包括多模态能力增强、推理效率提升和开发者支持全面升级。该模型在代码生成、数学推理和创意写作等场景表现优异,标志着AI大模型性能的新高度,为开发者提供更强大的工具支持。

社区Reddit r/LocalLLaMA2026/02/15 15:183830

京东开源的JoyAI-LLM-Flash项目已在HuggingFace平台上线,旨在提供一个高效、易用的开源大语言模型解决方案。该项目名称中的“Flash”暗示其在推理速度、资源效率或特定优化技术方面可能具有优势。作为HuggingFace上的标准开源发布,它预计包含详细的模型架构、使用指南、安装依赖及性能基准测试。JoyAI-LLM-Flash为开发者和…

社区Reddit r/LocalLLaMA2026/02/15 09:094630

Incelgpt v1.2 是一款实验性微调的大型语言模型,其核心亮点在于其独特的训练数据来源。该模型在借鉴 GPT-4Chan 的基础上,进一步整合了 Charlie Kirk、Uncyclopedia、4Chan、Looksmaxxing 和 LinkedIn 等多元且常具争议性的文本数据,甚至包含了“地平说”的讨论。此次微调旨在探索融合不同领域数据对…

媒体Lobsters AI2026/02/07 01:246040

Waymo World Model是自动驾驶领域的一项前沿AI技术,旨在通过构建高保真度的世界模型,革新自动驾驶系统的模拟与训练方式。该模型能够预测复杂的环境动态和多智能体行为,为自动驾驶车辆提供更真实、更具挑战性的虚拟测试场景。其核心亮点在于利用生成式AI技术,大幅提升模拟效率和覆盖范围,有望加速自动驾驶技术的安全部署和商业化进程。