专题：large-language-models

OpenAI推出针对开源项目的付费产品优惠计划，核心维护者可获六个月ChatGPT Pro免费试用资格。该方案要求提供GitHub星标、NPM下载量等量化指标，同时开放Codex的安全功能。相比Anthropic的Claude Max政策，OpenAI更侧重开发者生态扶持，为开源社区提供实际技术资源支持。

开源项目大语言模型生成式AI Codex CLI 开发者工具

AI浪潮下的技术与伦理：Qwen 3.5、代码生成及信息真实性挑战

原文

媒体Latent Space2026/03/03 16:015830

本文深入探讨了AI技术前沿与社会影响。技术方面，聚焦Qwen 3.5等LLM在代码生成、推理及基础设施上的进展。社会层面，分析AI如何影响信息真实性、社交媒体生态及历史认知，并探讨AI与政策法律的交织。旨在全面审视AI的机遇与挑战，呼吁负责任的创新。

人工智能大语言模型通义千问代码生成 AI 治理

海淀区重磅发布90亿资金与近30项政策，全面布局AI与科技创新生态

原文

媒体量子位2026/02/28 20:595330

北京市海淀区于2026年2月重磅发布近30项科创政策，并承诺投入不低于90亿元产业创新专项资金，旨在全面推动AI及科技产业高质量发展。这些政策覆盖科技成果转化、消费提振、产业园区及人才安居，并为人工智能领域提供算力、数据、模型补贴。海淀区构建了以AI为核心的“1+X+1”现代化产业体系，聚焦集成电路、医药健康、商业航天等“5+3”重点产业，并以科技服务业为…

人工智能大语言模型科技政策产业创新海淀区

OpenAI完成1100亿美元融资，创AI初创企业融资新纪录

原文

媒体AINews2026/02/27 13:448640

• OpenAI完成1100亿美元融资，创纪录

• 亚马逊、英伟达、软银为主要投资方

OpenAI完成1100亿美元融资，创历史新高。投资方包括软银、英伟达和亚马逊，凸显其在AI应用和基础设施领域的影响力。ChatGPT和Codex用户规模庞大，合作资源涵盖云服务和训练算力。

AI融资 AI基础设施 AI伦理大语言模型开发 AI监管

H100运行时Beta测试：诊断并优化3B-70B大模型微调中的OOM与内存碎片问题

原文

社区Reddit r/LocalLLaMA2026/02/23 22:502760

一项针对30亿至700亿参数大型语言模型内存行为的Beta实验正在进行中。该实验旨在解决模型在微调过程中频繁出现的内存溢出（OOM）、严重内存碎片化以及高负载下异常表现等问题。不同于合成基准测试，此项目将部署来自真实社区的模型在H100 GPU上进行测试，以帮助开发者诊断并找出问题的根源。这并非一个托管服务公告，而是对特定运行时环境的实际工作负载测试。项目…

NVIDIA H100 大语言模型内存优化模型微调内存溢出

微软重磅发布自研AI推理芯片，强化云端AI算力布局

原文

社区Reddit r/LocalLLaMA2026/02/22 18:226520

微软近日重磅发布了一款全新的自研AI推理芯片，旨在显著提升其Azure云平台在处理大型语言模型（LLM）及其他复杂AI推理任务时的性能与效率。此举是微软在AI硬件领域的重要战略布局，旨在减少对第三方GPU的依赖，并为客户提供更具成本效益和性能优势的AI算力。该芯片的核心亮点在于其针对AI推理工作负载的深度优化，包括高吞吐量、低延迟和卓越的能效比。它将与Az…

AI芯片推理加速微软 Azure 大语言模型硬件优化

AI 资本赛局：Anthropic 与 OpenAI 的竞争与增长教训

原文

媒体Latent Space2026/02/20 00:465540

本文剖析了 AI 领域资本的演进：从早期 VC 投入到后期增长资本形成的资本飞轮，推动大模型快速迭代。文章对比了前沿实验室与应用生态的竞争格局，指出人才争夺和定制硅片是关键瓶颈，并警示资本密集型研发可能导致行业寡头化。对投资者和创业者提供了风险评估与策略建议。

风险投资大语言模型定制硅片人才争夺 AI生态系统

百度用5亿元红包+OpenClaw接入，抢夺AI超级入口

原文

媒体量子位2026/02/19 18:156550

文章解析了百度在春节期间通过 5 亿元红包和 OpenClaw 接入，抢占 AI 超级入口的双重布局。通过把文心助手深度嵌入百度 App 与搜索场景，降低用户使用门槛，实现“问百度”即“问 AI”。同时，结合全栈技术（昆仑芯、智能云、文心大模型），百度在 AI 入口竞争中形成了技术与流量的双重优势。

AI 助手大语言模型 AI入口百度文心智能代理

Claude Sonnet 4.6：微软Foundry平台上的高效AI模型升级

原文

官方Microsoft Azure Blog2026/02/18 04:117850

Claude Sonnet 4.6在Microsoft Foundry发布，具备100万token上下文窗口、自适应思维和高效代码处理能力，适用于企业开发和自动化任务，提升生产力与效率。

AI模型大语言模型上下文窗口代码处理企业AI

Jeff Dean 深度访谈：一页备忘录催生 Gemini，Google AI 的技术反击与未来愿景

原文

媒体宝玉的分享2026/02/17 08:007850

Jeff Dean 在访谈中讲述了 Gemini 模型的诞生背景，强调其技术突破源于一页备忘录引发的团队合并。他讨论了长上下文处理、AI 硬件优化及每秒处理 10,000 Token 的能力，展示了 Google AI 在模型架构和计算效率上的战略布局。

Gemini 模型知识蒸馏 Token处理速度 AI计算硬件大语言模型

谷歌NotebookLM被指盗用电台主持人声音，AI语音合成伦理争议再起

原文

社区Hacker News2026/02/16 02:057630

谷歌NotebookLM被指控盗用电台主持人David Greene的声音，引发AI语音合成技术的伦理和法律争议。该工具利用语音识别与合成技术，可模仿特定人物声音生成内容，但未经授权使用声音可能侵犯版权和隐私。事件凸显AI语音合成在内容创作中的潜在风险，值得行业关注。

AI 语音合成语音识别版权问题伦理考量大语言模型

海淀AI大模型集群爆发：Seedance 2.0引领视频生成新浪潮，赋能全球视听产业

原文

媒体量子位2026/02/15 19:588620

海淀区正成为全球AI创新高地，以字节跳动Seedance 2.0为代表的AI大模型集群集中爆发。Seedance 2.0凭借多模态输入和音画同步能力，在视频生成领域引发轰动。同时，月之暗面Kimi K2.5、生数科技Vidu Q3、快手可灵AI 3.0及智谱GLM-5等模型也相继发布，展现出多智能体协作、声画一体生成、智能镜头调度及SOTA编程能力。海淀区…

视频生成多模态AI 大语言模型海淀AI AI产业生态

RTX 5090 + 3090：本地LLM驱动DND角色扮演与轻量3D生成，硬件配置与模型选择探讨

原文

社区Reddit r/LocalLLaMA2026/02/15 15:481640

一位技术爱好者正规划搭建一套基于RTX 5090与3090双显卡的本地AI系统，旨在实现DND角色扮演中的高级推理与创意生成，并兼顾轻量级3D模型生成。该系统需能运行量化模型，以提供快速、迭代的场景模拟，并展现出逻辑判断与创新思维。用户强调避免使用昂贵的API服务，寻求在本地硬件上运行高效模型。核心诉求是咨询在此高性能GPU配置下，哪些量化模型能同时满足文…

大语言模型本地推理 GPU 加速量化模型 3D生成

智谱AI发布新一代大模型GLM 5，加速AI竞赛

原文

社区Reddit r/LocalLLaMA2026/02/11 19:5150

中国AI公司智谱AI即将发布其新一代大语言模型GLM 5。此举预示着公司在AI技术上的重要进展，并可能在全球大模型竞赛中引发新的格局。GLM 5的推出旨在提供更强大的AI能力，以满足日益增长的市场需求。发布工作将于明日正式启动，标志着智谱AI在推动AI技术前沿发展方面迈出了新的一步。

GLM 5 智谱AI 大语言模型 AI模型