专题：tflite

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 2 篇文章。

LiteRT：面向设备端AI的下一代框架，性能提升与NPU支持

原文

官方Google Developers Blog2026/03/05 00:336830

LiteRT是TFLite的升级版，专注于设备端AI，提升GPU效率至1.4倍，支持NPU并优化GenAI模型部署。适用于边缘计算场景，增强AI在移动端和嵌入式设备的性能表现。

LiteRT TensorFlow Lite NPU 加速生成式AI 边缘计算

Hugging Face XLM-RoBERTa-Base 模型 INT8 量化实践与TFLite部署

原文

社区Reddit r/LocalLLaMA2026/02/09 20:3940

本帖提供了一套完整的Python脚本，详细演示了Hugging Face XLM-RoBERTa-Base模型INT8量化过程，旨在解决内存限制。通过将`joeddav/xlm-roberta-large-xnli`模型转换为TensorFlow Lite格式并应用INT8量化，成功将模型大小从约560MB压缩至35MB。内容涵盖TFLite模型生成、验证…

XLM-RoBERTa模型 INT8量化 TensorFlow Lite Flutter框架模型部署