专题：llama-3-1

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 2 篇文章。

RTX 3090 独显实战：NVMe-to-GPU 技术赋能 70B Llama 3.1 模型，CPU/内存“靠边站”

社区Hacker News2026/02/22 04:575730

本文介绍了一项突破性的技术实验，成功在单块消费级 RTX 3090 显卡上运行了 700 亿参数的 Llama 3.1 模型。核心亮点在于采用了创新的“NVMe-to-GPU”技术，直接绕过 CPU 和系统内存，实现 GPU 与 NVMe SSD 的高速互联，大幅提升了大型模型在有限硬件上的运行效率。该实验为在消费级硬件上部署和运行大型语言模型提供了可行性…

Llama 3.1 NVMe-to-GPU NVIDIA RTX 3090 显卡大语言模型推理硬件优化

基于 TPM 硬件的 Llama 3.1 本地安全代理框架

原文

社区Reddit r/LocalLLaMA2026/02/20 21:175730

作者提出一种基于 TPM 2.0 的本地安全框架，将 Llama 3.1 绑定到硬件隔离区，实现只有在机器发出加密信号时才可执行的 AI 代理。通过自研的状态锁定协议（SLP）和 Resin DSL，实现对 Solana 主网的直接交互，并引入代谢机制限制无限循环。项目已申请专利，计划使用 512 GB RAM 完全本地化链状态，寻求社区在延迟与安全之间的…

Llama 3.1 TPM 硬件安全安全 AI 代理 Resin DSL Solana 区块链

专题：llama-3-1

RTX 3090 独显实战：NVMe-to-GPU 技术赋能 70B Llama 3.1 模型，CPU/内存“靠边站”

基于 TPM 硬件的 Llama 3.1 本地安全代理框架

基于 TPM 硬件的 Llama 3.1 本地安全代理框架