截图OCR-极速翻译

截图OCR-极速翻译 公开 已发布

仲夏·Aun 分享于 20小时11分钟前 | 0 | 3
如何安装动作?

适用于
分类(旧)
查询搜索 文本处理 翻译
关键词



更多信息
分享时间 20小时11分钟前
最后更新 20小时11分钟前
修订版本 0
用户许可 可自己使用或修改,不可再分享
Quicker版本 1.45.5
动作大小 9.5 KB

分享到

「框选屏幕区域,本地 PP-OCRv5 ONNX 极速识别;DeepSeek 用于翻译,MiMo ,DeepSeek可用于 AI 排版。」

简介

此动作全程GPT-5.5开发

当前正在用的是 PP-OCRv5 ONNX 快速模型,本地运行,不走云端。

具体逻辑:

  • 当前模式:fast
  • 使用引擎:OnnxPaddleOcrEngine
  • 依赖包:onnxocr-ppocrv5
  • 作用:截图后快速 OCR,目标是 1 秒左右响应

如果你在设置里切到“高精度”,会改用 PaddleOCR,并指定:

  • 检测模型:PP-OCRv5_mobile_det
  • 识别模型:PP-OCRv5_mobile_rec

所以现在默认就是:PP-OCRv5 ONNX 极速 OCR + PaddleOCR 高精度备用。DeepSeek 不做 OCR,只做翻译;MiMo 只做 AI 排版。

3. 第一次使用前配置

打开识别结果窗口后,点击 设置

  • 翻译模型:保持 deepseek
  • 排版模型:建议使用 mimo
  • DeepSeek Key:填写 DeepSeek API Key,用于 翻译
  • MiMo Key:填写小米 MiMo API Key,用于 AI排版
  • OCR 模式:日常建议使用快速模式;如果极少数图片识别不准,再切高精度模式。

当前设计是:DeepSeek 只负责翻译,MiMo 负责 AI 排版,OCR 本身使用本地引擎。

4. 日常使用流程

  1. 点击 Quicker 里的 截图OCR-极速翻译
  2. 用鼠标框选屏幕上的文字区域。
  3. 松开鼠标后等待结果窗口弹出。
  4. 在窗口里检查识别结果,必要时手动编辑。
  5. 根据需要点击:
按钮作用
复制复制当前文本
翻译调用 DeepSeek 深度翻译
AI排版调用 MiMo 进行排版整理
搜索搜索当前文本
历史打开最近识别结果
设置配置 OCR、DeepSeek、MiMo 和窗口参数

结果窗口保持前置显示。窗口已打开时,新截图会复用同一个窗口,不会不断弹出新窗口。

5. AI 排版预设

AI排版 左侧有预设菜单:

预设适合内容
通用整理普通段落、公告、文章、聊天记录
Markdown需要标题、列表、引用等 Markdown 结构
表格恢复截图里有表格、对齐列、数据项
代码块截图里有代码、命令、配置片段
技术文档API、说明文档、参数说明、错误日志

即使不调用 AI,本地也会先做基础结构增强,例如识别出简单表格和代码块。

6. 速度说明

为了做到尽量快,截图识别阶段默认只做本地 OCR:

  • 不调用 DeepSeek。
  • 不调用 MiMo。
  • 不做截图后的自动翻译。
  • 不做截图后的自动 AI 排版。

第一次启动服务会有模型加载时间,可能明显慢一些。服务启动完成后,再次截图通常会快很多。小范围清晰文字通常可以接近 1 秒内完成;大图、低清晰度图片、多列复杂排版会更慢。

如果你感觉变慢,优先检查:

  1. 框选区域是否过大。
  2. 是否正在首次启动服务。
  3. 是否误开了高精度 OCR 模式。
  4. 是否点击了 翻译AI排版,这两个会走云端模型,速度取决于网络和模型响应。

7. 快捷操作

  • Esc:关闭结果窗口。
  • 再次截图:复用已有结果窗口并刷新内容。
  • 历史:查看最近识别记录。
  • 结果窗口底部会显示 OCR 耗时,便于判断慢在 OCR 还是后续操作。

8. 隐私说明

  • 截图 OCR 阶段在本机完成。
  • 只有点击 翻译 时,当前文本才会发送给 DeepSeek。
  • 只有点击 AI排版 时,当前文本才会发送给 MiMo。
  • 历史记录保存在本机配置目录,不会主动上传。

最近更新

修订版本 更新时间 更新说明
0 20小时11分钟前

最近讨论

暂无讨论