大佬,有空帮忙看下,智谱GLM OCR是免费的不,为啥会提示余额不足?

使用问题 · 46 次浏览
CHL~ 创建于 2天14小时前

 

                             

 


CHL~ 2天12小时前 :

如果想用glm-ocr,这么填写可以么?问的ai,端点url填的智谱平台


九牧 回复 CHL~ 2天2小时前 :


glm-ocr的话,直接选这个,填KEY

回复内容
九牧 2天2小时前
#1


也是要付费吧。


我一般都是识别公式或不规则排版的图文时才用AI OCR

我常用的话现在是有道、百度。
AI接口是硅基流动的zai-org/GLM-4.5V

CHL~ 回复 九牧 1天16小时前 :

谢谢回复,请教下哈,如果不是用的硅基流动平台,而是智谱平台,那调用方式也是选的Base URL吗,端点URL怎么填呢?



CHL~ 回复 九牧 1天15小时前 :

尝试这样子填写,提示OCR结果空白,应该是填写错了


九牧 回复 CHL~ 1天14小时前 :

智谱平台应该要选HTTP模式。

HTTP默认内置的就是智谱平台的


九牧 最后更新于 1天13小时前
CHL~ 回复 九牧 1天13小时前 :

1、大佬,这个动作很方便,但是我感觉ai-ocr接口,应该是要优化下,调用方式选Base URLhttp模式都一样很慢,相同的模型,ocr识别耗时比其他动作慢很多。

2、调试运行,在ai调用或者http请求这两个步骤耗时耗时:7461ms、耗时:61047ms

3、例如跟这款万能识别动作相比,相同的ai模型,就慢很多https://getquicker.net/Sharedaction?code=9062589a-dba2-425f-860c-08dcf8c7ad5e


CHL~ 最后更新于 1天13小时前
CHL~ 回复 CHL~ 1天13小时前 :

其他的接口速度正常

九牧 回复 CHL~ 1天13小时前 :

这个动作内置的模型是

智谱的 GLM-4V-Flash

通义千问的 qwen-vl-max-latest

腾讯混元的 hunyuan-turbos-vision

九牧 最后更新于 1天13小时前
CHL~ 回复 九牧 1天13小时前 :

对,两个动作我都用的智谱的 GLM-4V-Flash

九牧 回复 CHL~ 1天13小时前 :

应该不至于会这样,我看两边的HTTP写法都差不多。

我刚试了截图同一张差不多大小尺寸的区域去让两个动作分别识别,用时差不多。

尺寸大跟尺寸小,用时是会不一样。


你也可以按照他的写法(多了一些参数),改一下请求体再试试看


九牧 最后更新于 1天13小时前
回复主贴