大佬,现在一些前沿的模型可以让OCR出来的结果更加易用,虽然gpt-4的比较贵,但是借助Kimi可以免费用着。这部分代码我在 Kimi动作 进行了分享,大佬有需要的话可以整合进去。
这结合了老大新更新的AI模块,以下是智核中的示例,首先把Quicker版本升级到 1.42.21 以上
参数配置中使用GPT-4-vision-preview模型,或者点击白嫖Kimi模型,然后在操作台选择 AI 工具中的第二个:“使用AI进行OCR”,
然后随便截了一张图:
得到结果: