OCR工作台

OCR工作台 公开 已发布(自动)

Cea 更新于 1小时42分钟前 | 0 | 2
如何安装动作?
复制Ta的推荐码
剪贴板动作交流群:824753837

适用于
分类(旧)
其他



更多信息
分享时间 2小时30分钟前
最后更新 1小时42分钟前
修订版本 3
用户许可 -未设置-
Quicker版本 1.45.5
动作大小 18 KB

分享到

「截图 OCR 识别工作台:框选/全屏截图,多引擎文字识别,结果编辑与复制。」

简介

OCR 工作台

截图 → 识别 → 编辑 → 复制,一站完成。基于 WebView2 + React 的现代 OCR 工作台,集成 Quicker 内置截图与多路 OCR 引擎;支持文字、表格、公式、Markdown/视觉 LLM等任务,以及工作台内翻译与独立翻译小窗。

界面概览

  • 顶栏:截图(框选 / 全屏)、任务类型切换、OCR 引擎选择、识别与复制等快捷操作
  • 工作区:左侧图片预览与选区,右侧按任务展示原文、表格、公式或 Markdown 结果
  • 翻译:文字任务下可打开翻译面板;也可通过配套动作「截图翻译」使用独立翻译小窗
  • 历史:识别会话本地保存,便于切换对比(数据存于本机)

主要功能

文字识别

  • Quicker OCR:复用 Quicker 内置 OCR 步骤(推荐,需从 Quicker 动作启动)
  • 百度(Quicker):通过 Quicker 内置通道调用百度 OCR
  • Windows OCR:本地 Windows.Media.Ocr,无需 Quicker 上下文

表格识别

  • Quicker 表格:识别表格结构并导出 HTML / 可复制内容
  • 视觉 LLM:需自行配置 API(设置面板)

公式识别

  • 支持 Mathpix、视觉 LLM 等引擎,输出 LaTeX 并带 KaTeX 预览

Markdown / 视觉 LLM

  • 将截图转为结构化 Markdown(标题、列表、代码块等),适合文档、笔记类图片

截图方式

  • 框选截图:拖拽选择屏幕区域(默认:从 Quicker 启动时自动进入框选)
  • 全屏截图:捕获当前整屏
  • 也可先打开工作台再手动截图,或通过子程序参数跳过自动截图(见下文)

快速上手

  1. 在 Quicker 面板触发本动作;首次运行会自动下载依赖包 cea.ocr-studio
  2. 按提示框选屏幕区域(或在工作台内点击截图按钮)
  3. 选择任务类型与 OCR 引擎,点击识别
  4. 在结果区编辑文字,一键复制到剪贴板

当前依赖包版本 1.0.8.0(以动作运行时下载为准)。

高级:子程序参数

本动作调用公共子程序 OcrStudio。若你在自己的动作中复用该子程序,可通过输入变量 cmd 控制启动行为:

cmd 行为
(空) / workbench 打开 OCR 工作台;在 Quicker 内默认先框选截图
none 打开工作台,不自动截图
capture / captureSelect 框选截图后进入工作台
fullScreen / captureFullScreen 全屏截图后进入工作台
translateFloat 打开独立翻译小窗(见配套动作「截图翻译」)
exit / stop 退出 OCR 工作台进程

launch_mode 已弃用,请统一使用 cmd

环境要求

  • Windows 10 及以上
  • .NET Framework 4.7.2 或更高
  • Microsoft Edge WebView2 Runtime(Win10/11 通常已预装)
  • Quicker 1.39.0 及以上(建议 1.45.0+)
  • 使用 Quicker OCR / 百度(Quicker) / 表格(Quicker) 等引擎时,须从 Quicker 动作启动(需要动作上下文)

常见问题

  • 提示需要 IActionContext?
    部分引擎(如 Quicker 内置 OCR)必须在 Quicker 进程内通过动作/子程序调用,不要直接运行 Debug exe 并期望相同行为。
  • 首次打开较慢?
    依赖包 cea.ocr-studio 约 1.5 MB,首次需下载解压;之后会走本地缓存。
  • 表格 / 公式识别不可用?
    确认 Quicker 账号已登录(在线 OCR 需要 Bearer);视觉 LLM 类引擎需在设置中填写 API Key。
  • 想只做截图翻译、不要完整工作台?
    可使用配套动作「截图翻译」(子程序 cmd=translateFloat),打开轻量翻译小窗。
  • 识别结果乱码或漏行?
    尝试切换 OCR 引擎,或换用「文字 / 表格 / 公式」中更匹配的任务类型。

相关链接

作者所声明的动作特征:
  • 含有上传数据到网络的功能

最近更新

修订版本 更新时间 更新说明
3 1小时42分钟前 ## v1.0.8 (2026-6-20)

- 重构工作台界面:主标签页布局更清晰,顶栏与工作区操作更集中
- 增加工作台内翻译面板,支持识别结果一键翻译
- 增加独立翻译小窗(`translateFloat`),可配合「截图翻译」动作快速使用
- 优化从 Quicker 启动时的体验:默认先框选截图再进入工作台
- 优化 OCR 段落合并与选区识别稳定性
- 修复翻译小窗在部分场景下的显示与交互问题
2 2小时17分钟前 清空 Note 简介字段
1 2小时18分钟前 清空重复的 Note 简介

最近讨论

暂无讨论