使用 LM Studio 将扫描的 PDF 转换为结构化输出的效率问题
Reddit r/LocalLLaMA2026/02/09 23:18机翻/自动摘要/自动分类
6 阅读
摘要
用户在使用 LM Studio 将扫描的 PDF 文件转换为结构化输出时,遇到了处理速度缓慢的问题。当前流程是将 PDF 转为 JPG 图片,再加入提示词。即使在高性能设备上,效率依然低下。用户分享了相关的 Python 代码,并寻求关于优化此流程的建议,包括 LM Studio 本身或 MLX 等其他工具。
正文
一位用户在使用 LM Studio 处理扫描的 PDF 文件时遇到了效率瓶颈。该用户将约 30 页的 PDF 文件转换为 JPG 图片,然后将这些图片添加到提示(prompt)中以生成结构化输出。尽管使用了 M3 Ultra 96GB 内存的设备,处理速度仍然非常缓慢。用户分享了使用 Python 和 pdf2image 库将 PDF 页面转换为图像,并利用 requests 库将图像编码为 Base64 发送给 LM Studio API 进行分析的代码。用户寻求关于如何优化此流程的建议,无论是通过 LM Studio 本身还是借助 MLX 或其他工具。