| 分享时间 | 20小时11分钟前 |
| 最后更新 | 20小时11分钟前 |
| 修订版本 | 0 |
| 用户许可 | 可自己使用或修改,不可再分享 |
| Quicker版本 | 1.45.5 |
| 动作大小 | 9.5 KB |
此动作全程GPT-5.5开发
当前正在用的是 PP-OCRv5 ONNX 快速模型,本地运行,不走云端。
具体逻辑:
fastOnnxPaddleOcrEngineonnxocr-ppocrv5如果你在设置里切到“高精度”,会改用 PaddleOCR,并指定:
PP-OCRv5_mobile_detPP-OCRv5_mobile_rec所以现在默认就是:PP-OCRv5 ONNX 极速 OCR + PaddleOCR 高精度备用。DeepSeek 不做 OCR,只做翻译;MiMo 只做 AI 排版。
打开识别结果窗口后,点击 设置:
翻译模型:保持 deepseek。排版模型:建议使用 mimo。DeepSeek Key:填写 DeepSeek API Key,用于 翻译。MiMo Key:填写小米 MiMo API Key,用于 AI排版。OCR 模式:日常建议使用快速模式;如果极少数图片识别不准,再切高精度模式。当前设计是:DeepSeek 只负责翻译,MiMo 负责 AI 排版,OCR 本身使用本地引擎。
截图OCR-极速翻译。| 按钮 | 作用 |
|---|---|
复制 | 复制当前文本 |
翻译 | 调用 DeepSeek 深度翻译 |
AI排版 | 调用 MiMo 进行排版整理 |
搜索 | 搜索当前文本 |
历史 | 打开最近识别结果 |
设置 | 配置 OCR、DeepSeek、MiMo 和窗口参数 |
结果窗口保持前置显示。窗口已打开时,新截图会复用同一个窗口,不会不断弹出新窗口。
AI排版 左侧有预设菜单:
| 预设 | 适合内容 |
|---|---|
通用整理 | 普通段落、公告、文章、聊天记录 |
Markdown | 需要标题、列表、引用等 Markdown 结构 |
表格恢复 | 截图里有表格、对齐列、数据项 |
代码块 | 截图里有代码、命令、配置片段 |
技术文档 | API、说明文档、参数说明、错误日志 |
即使不调用 AI,本地也会先做基础结构增强,例如识别出简单表格和代码块。
为了做到尽量快,截图识别阶段默认只做本地 OCR:
第一次启动服务会有模型加载时间,可能明显慢一些。服务启动完成后,再次截图通常会快很多。小范围清晰文字通常可以接近 1 秒内完成;大图、低清晰度图片、多列复杂排版会更慢。
如果你感觉变慢,优先检查:
翻译 或 AI排版,这两个会走云端模型,速度取决于网络和模型响应。Esc:关闭结果窗口。历史:查看最近识别记录。翻译 时,当前文本才会发送给 DeepSeek。AI排版 时,当前文本才会发送给 MiMo。| 修订版本 | 更新时间 | 更新说明 |
|---|---|---|
| 0 | 20小时11分钟前 |