空格缺失

使用问题 · 8 次浏览
山林君子 创建于 8小时15分钟前

识别英文PDF论文后,发现很多空格缺失。比如标点符号后没有空格,以及部分单词直接连接到一起形成一个超长的字符串。应该是MinerU识别的问题。

既然这样,那么是否可以支持更换模型版本(MinerU官方是:pipeline(默认)/ vlm(推荐) / MinerU-HTML),这样用户选择性更大。(甚至还可以识别本地HTML文件)。

感谢作者~~


Snow-In-Twil... 6小时1分钟前 :

您好,是有这个功能的,您在动作上右键→设置,把是否启动ocr功能勾选上即可~😊

回复内容
暂无回复
回复主贴