截图OCR-极速翻译 - by 仲夏·Aun - 动作信息

仲夏·Aun

复制Ta的推荐码

适用于

通用 OCR 文字识别

分类(旧)

查询搜索文本处理翻译

关键词

截图OCR;

点赞鼓励一下

简介

此动作全程GPT-5.5开发

当前正在用的是 PP-OCRv5 ONNX 快速模型，本地运行，不走云端。

具体逻辑：

当前模式：fast
使用引擎：OnnxPaddleOcrEngine
依赖包：onnxocr-ppocrv5
作用：截图后快速 OCR，目标是 1 秒左右响应

如果你在设置里切到“高精度”，会改用 PaddleOCR，并指定：

检测模型：PP-OCRv5_mobile_det
识别模型：PP-OCRv5_mobile_rec

所以现在默认就是：PP-OCRv5 ONNX 极速 OCR + PaddleOCR 高精度备用。DeepSeek 不做 OCR，只做翻译；MiMo 只做 AI 排版。

3. 第一次使用前配置

打开识别结果窗口后，点击 设置：

翻译模型：保持 deepseek。
排版模型：建议使用 mimo。
DeepSeek Key：填写 DeepSeek API Key，用于 翻译。
MiMo Key：填写小米 MiMo API Key，用于 AI排版。
OCR 模式：日常建议使用快速模式；如果极少数图片识别不准，再切高精度模式。

当前设计是：DeepSeek 只负责翻译，MiMo 负责 AI 排版，OCR 本身使用本地引擎。

4. 日常使用流程

点击 Quicker 里的 截图OCR-极速翻译。
用鼠标框选屏幕上的文字区域。
松开鼠标后等待结果窗口弹出。
在窗口里检查识别结果，必要时手动编辑。
根据需要点击：

按钮	作用
`复制`	复制当前文本
`翻译`	调用 DeepSeek 深度翻译
`AI排版`	调用 MiMo 进行排版整理
`搜索`	搜索当前文本
`历史`	打开最近识别结果
`设置`	配置 OCR、DeepSeek、MiMo 和窗口参数

结果窗口保持前置显示。窗口已打开时，新截图会复用同一个窗口，不会不断弹出新窗口。

5. AI 排版预设

AI排版 左侧有预设菜单：

预设	适合内容
`通用整理`	普通段落、公告、文章、聊天记录
`Markdown`	需要标题、列表、引用等 Markdown 结构
`表格恢复`	截图里有表格、对齐列、数据项
`代码块`	截图里有代码、命令、配置片段
`技术文档`	API、说明文档、参数说明、错误日志

即使不调用 AI，本地也会先做基础结构增强，例如识别出简单表格和代码块。

6. 速度说明

为了做到尽量快，截图识别阶段默认只做本地 OCR：

不调用 DeepSeek。
不调用 MiMo。
不做截图后的自动翻译。
不做截图后的自动 AI 排版。

第一次启动服务会有模型加载时间，可能明显慢一些。服务启动完成后，再次截图通常会快很多。小范围清晰文字通常可以接近 1 秒内完成；大图、低清晰度图片、多列复杂排版会更慢。

如果你感觉变慢，优先检查：

框选区域是否过大。
是否正在首次启动服务。
是否误开了高精度 OCR 模式。
是否点击了 翻译 或 AI排版，这两个会走云端模型，速度取决于网络和模型响应。

7. 快捷操作

Esc：关闭结果窗口。
再次截图：复用已有结果窗口并刷新内容。
历史：查看最近识别记录。
结果窗口底部会显示 OCR 耗时，便于判断慢在 OCR 还是后续操作。

8. 隐私说明

截图 OCR 阶段在本机完成。
只有点击 翻译 时，当前文本才会发送给 DeepSeek。
只有点击 AI排版 时，当前文本才会发送给 MiMo。
历史记录保存在本机配置目录，不会主动上传。

分享时间	20小时11分钟前
最后更新	20小时11分钟前
修订版本	0
用户许可	可自己使用或修改，不可再分享
Quicker版本	1.45.5
动作大小	9.5 KB

截图OCR-极速翻译公开已发布

适用于

分类(旧)

关键词

更多信息

简介

3. 第一次使用前配置

4. 日常使用流程

5. AI 排版预设

6. 速度说明

7. 快捷操作

8. 隐私说明

最近更新

最近讨论

截图OCR-极速翻译 公开 已发布

适用于

分类(旧)

关键词

更多信息

简介

3. 第一次使用前配置

4. 日常使用流程

5. AI 排版预设

6. 速度说明

7. 快捷操作

8. 隐私说明

最近更新

最近讨论

截图OCR-极速翻译公开已发布