来源:
分类:
排序:
社区Hacker News2026/04/03 00:105520
Google 发布开源模型 Gemma 4
提供 2B‑7B 参数多规格版本

Google 发布了开源大语言模型 Gemma 4,提供 2B‑7B 参数多规格版本,基于 Transformer 架构并在指令遵循、代码生成和多语言理解上表现提升。官方同步开放模型权重、推理代码及安全评估报告,旨在帮助开发者快速落地并促进社区共建。

社区Hacker News2026/04/01 13:155530
Claude代码泄露事件曝光
NPM地图文件成泄密途径

Claude代码泄露事件引发技术社区关注,涉及NPM仓库地图文件泄露、虚假工具争议及正则表达式实现问题。事件暴露AI模型开发中的安全机制漏洞,可能影响代码保密性与系统安全性,相关技术分析为模型实现提供可视化参考。

社区Hacker News2026/04/01 05:016730
发布首个宣称商业可用的1-bit LLM
推理仅需位运算与加法,支持边缘部署

1-Bit Bonsai 是首个宣称具备商业可行性的 1-bit 大语言模型,采用极端量化技术将权重与激活压缩至 1 位,推理仅需位运算,支持边缘部署。尽管精度有所下降,但在特定任务中仍具实用性,项目已开源并用于内部原型系统。

社区Hacker News2026/03/27 20:115620
参数高效微调技术
13参数实现强推理

TinyLoRA是基于Transformer的轻量化模型架构,仅需13个参数即可实现高效推理。通过结构优化降低计算和存储需求,保持高性能,适用于嵌入式设备等资源受限场景。该技术突破传统参数微调范式,为边缘计算提供新思路,具有实际部署价值。

社区Hacker News2026/03/25 00:026840
利用NVMe实现张量流式传输
优化内存瓶颈问题

本文介绍在32GB内存Mac上运行1T参数AI模型的方法,通过NVMe流式传输张量数据,解决内存瓶颈问题。技术方案涵盖NVMe存储特性、张量处理机制及优化策略,对资源受限环境下的模型部署具有参考价值。

1 / 7