专题:large-language-models

按该标签聚合的大模型资讯列表(自动分类与标签提取)。28 篇文章。

媒体InfoQ 中文2026/04/03 03:076800
AI复刻Next.js框架
生产环境代码生成

Cloudflare利用AI模型重构Next.js框架,实现生产级代码生成与优化。通过强化学习训练专用模型,提升开发效率300%的同时保持性能稳定。核心亮点包括AI驱动的框架组件生成、动态性能优化及真实环境验证,展示了AI在软件开发中的实际应用价值。

媒体InfoQ2026/03/14 18:596840
训练LLM学习贝叶斯预测
提升多步推理更新能力

谷歌提出贝叶斯教学法,通过让LLM学习贝叶斯系统的预测结果,提升其多步交互中的推理能力。该方法改进了模型在接收新信息时更新信念的方式,具有理论深度和实验验证,对AI研究和应用有重要参考价值。

官方Simon Willison2026/03/08 02:136510
OpenAI推出开源项目支持计划
核心维护者免费试用ChatGPT Pro

OpenAI推出针对开源项目的付费产品优惠计划,核心维护者可获六个月ChatGPT Pro免费试用资格。该方案要求提供GitHub星标、NPM下载量等量化指标,同时开放Codex的安全功能。相比Anthropic的Claude Max政策,OpenAI更侧重开发者生态扶持,为开源社区提供实际技术资源支持。

媒体Latent Space2026/03/03 16:015830

本文深入探讨了AI技术前沿与社会影响。技术方面,聚焦Qwen 3.5等LLM在代码生成、推理及基础设施上的进展。社会层面,分析AI如何影响信息真实性、社交媒体生态及历史认知,并探讨AI与政策法律的交织。旨在全面审视AI的机遇与挑战,呼吁负责任的创新。

媒体量子位2026/02/28 20:595330

北京市海淀区于2026年2月重磅发布近30项科创政策,并承诺投入不低于90亿元产业创新专项资金,旨在全面推动AI及科技产业高质量发展。这些政策覆盖科技成果转化、消费提振、产业园区及人才安居,并为人工智能领域提供算力、数据、模型补贴。海淀区构建了以AI为核心的“1+X+1”现代化产业体系,聚焦集成电路、医药健康、商业航天等“5+3”重点产业,并以科技服务业为…

社区Reddit r/LocalLLaMA2026/02/23 22:502760

一项针对30亿至700亿参数大型语言模型内存行为的Beta实验正在进行中。该实验旨在解决模型在微调过程中频繁出现的内存溢出(OOM)、严重内存碎片化以及高负载下异常表现等问题。不同于合成基准测试,此项目将部署来自真实社区的模型在H100 GPU上进行测试,以帮助开发者诊断并找出问题的根源。这并非一个托管服务公告,而是对特定运行时环境的实际工作负载测试。项目…

社区Reddit r/LocalLLaMA2026/02/22 18:226520

微软近日重磅发布了一款全新的自研AI推理芯片,旨在显著提升其Azure云平台在处理大型语言模型(LLM)及其他复杂AI推理任务时的性能与效率。此举是微软在AI硬件领域的重要战略布局,旨在减少对第三方GPU的依赖,并为客户提供更具成本效益和性能优势的AI算力。该芯片的核心亮点在于其针对AI推理工作负载的深度优化,包括高吞吐量、低延迟和卓越的能效比。它将与Az…

媒体Latent Space2026/02/20 00:465540

本文剖析了 AI 领域资本的演进:从早期 VC 投入到后期增长资本形成的资本飞轮,推动大模型快速迭代。文章对比了前沿实验室与应用生态的竞争格局,指出人才争夺和定制硅片是关键瓶颈,并警示资本密集型研发可能导致行业寡头化。对投资者和创业者提供了风险评估与策略建议。

媒体量子位2026/02/19 18:156550

文章解析了百度在春节期间通过 5 亿元红包和 OpenClaw 接入,抢占 AI 超级入口的双重布局。通过把文心助手深度嵌入百度 App 与搜索场景,降低用户使用门槛,实现“问百度”即“问 AI”。同时,结合全栈技术(昆仑芯、智能云、文心大模型),百度在 AI 入口竞争中形成了技术与流量的双重优势。

媒体宝玉的分享2026/02/17 08:007850

Jeff Dean 在访谈中讲述了 Gemini 模型的诞生背景,强调其技术突破源于一页备忘录引发的团队合并。他讨论了长上下文处理、AI 硬件优化及每秒处理 10,000 Token 的能力,展示了 Google AI 在模型架构和计算效率上的战略布局。

社区Hacker News2026/02/16 02:057630

谷歌NotebookLM被指控盗用电台主持人David Greene的声音,引发AI语音合成技术的伦理和法律争议。该工具利用语音识别与合成技术,可模仿特定人物声音生成内容,但未经授权使用声音可能侵犯版权和隐私。事件凸显AI语音合成在内容创作中的潜在风险,值得行业关注。

媒体量子位2026/02/15 19:588620

海淀区正成为全球AI创新高地,以字节跳动Seedance 2.0为代表的AI大模型集群集中爆发。Seedance 2.0凭借多模态输入和音画同步能力,在视频生成领域引发轰动。同时,月之暗面Kimi K2.5、生数科技Vidu Q3、快手可灵AI 3.0及智谱GLM-5等模型也相继发布,展现出多智能体协作、声画一体生成、智能镜头调度及SOTA编程能力。海淀区…

社区Reddit r/LocalLLaMA2026/02/15 15:481640

一位技术爱好者正规划搭建一套基于RTX 5090与3090双显卡的本地AI系统,旨在实现DND角色扮演中的高级推理与创意生成,并兼顾轻量级3D模型生成。该系统需能运行量化模型,以提供快速、迭代的场景模拟,并展现出逻辑判断与创新思维。用户强调避免使用昂贵的API服务,寻求在本地硬件上运行高效模型。核心诉求是咨询在此高性能GPU配置下,哪些量化模型能同时满足文…

社区Reddit r/LocalLLaMA2026/02/11 19:5150

中国AI公司智谱AI即将发布其新一代大语言模型GLM 5。此举预示着公司在AI技术上的重要进展,并可能在全球大模型竞赛中引发新的格局。GLM 5的推出旨在提供更强大的AI能力,以满足日益增长的市场需求。发布工作将于明日正式启动,标志着智谱AI在推动AI技术前沿发展方面迈出了新的一步。