Claude大模型代码意外泄露,51万行源码包含架构与训练细节,引发对模型安全机制及技术透明度的讨论,为研究者提供分析商业大模型的参考。
专题:ai-model
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 13 篇文章。
Mr. Chatterbox是基于维多利亚时代英国文学训练的对话模型,完全使用19世纪文本,无现代数据。模型在文学语境下表现良好,但实用性不足,作者成功实现本地部署,并公开了训练方法。
GitHub更新Copilot数据使用政策,用户交互数据将用于模型训练,以提升代码建议的准确性与安全性。核心亮点包括数据来源透明、用户可选择退出、数据共享范围明确。
Cursor发布自研AI模型,性能超越Opus 4.6,具备成本优势和实际应用价值,适合开发者和企业使用。
近期AI/LLM领域动态频发,Anthropic凭借190亿美元年化收入展现强劲商业化能力,预示大模型市场竞争白热化。同时,Google的Gemini 3.1 Flash-Lite和OpenAI的GPT-5.3 Instant等轻量级、高效率模型加速迭代,推动AI应用向更低延迟、更广场景渗透。开源社区方面,Qwen团队成员的离职引发对开源项目稳定性和人才流…
Gemini 3.1 Flash Lite 登上 AI Gateway 平台,作为轻量级 AI 模型,便于部署与管理,提升开发效率,是 Google 在 AI 模型与平台整合上的重要进展。
Gemini 3.1 Pro模型正在接受测试,展现AI与计算机科学领域的性能优势,有望推动相关研究和应用发展。测试重点包括性能、稳定性和可靠性,为产品优化提供依据。
Google DeepMind推出Gemini 3.1 Pro,12项基准测试中全面超越Claude和GPT-4。核心亮点包括多模态能力增强、推理效率提升和开发者支持全面升级。该模型在代码生成、数学推理和创意写作等场景表现优异,标志着AI大模型性能的新高度,为开发者提供更强大的工具支持。
Claude 推出 Sonnet 4.6,全面升级编码、计算机使用和百万 token 上下文处理能力,价格保持不变,用户偏好度显著提升,凸显性价比优势。
京东开源的JoyAI-LLM-Flash项目已在HuggingFace平台上线,旨在提供一个高效、易用的开源大语言模型解决方案。该项目名称中的“Flash”暗示其在推理速度、资源效率或特定优化技术方面可能具有优势。作为HuggingFace上的标准开源发布,它预计包含详细的模型架构、使用指南、安装依赖及性能基准测试。JoyAI-LLM-Flash为开发者和…
Incelgpt v1.2 是一款实验性微调的大型语言模型,其核心亮点在于其独特的训练数据来源。该模型在借鉴 GPT-4Chan 的基础上,进一步整合了 Charlie Kirk、Uncyclopedia、4Chan、Looksmaxxing 和 LinkedIn 等多元且常具争议性的文本数据,甚至包含了“地平说”的讨论。此次微调旨在探索融合不同领域数据对…
Waymo World Model是自动驾驶领域的一项前沿AI技术,旨在通过构建高保真度的世界模型,革新自动驾驶系统的模拟与训练方式。该模型能够预测复杂的环境动态和多智能体行为,为自动驾驶车辆提供更真实、更具挑战性的虚拟测试场景。其核心亮点在于利用生成式AI技术,大幅提升模拟效率和覆盖范围,有望加速自动驾驶技术的安全部署和商业化进程。
谷歌发布Gemini 3,作为当前最强大的基础模型之一,其在编程和多模态任务中表现突出,同时引入Deepthink研究功能,推动AI搜索和应用升级。市场反应热烈,Alphabet股价与估值随之上涨。