希望对html提取时加入html解码的选项

使用问题 · 435 次浏览
blanka 创建于 2024-01-28 04:59

【浏览器控制】模块【获取元素信息】功能使用css选择器定位元素并提取信息,但这个过程可能会提取出html编码的内容,导致一些属性无法正确读取而提取失败:

例如这里想要提取src属性的值会提示失败:

将【元素信息类型】改为【内部html】后,发现提取到的信息具有未解码的内容:

(上面是提取到的信息中的src属性,下面是从浏览器开发者助手复制的,划出来这里有个amp;)

猜测可能是未解码信息干扰了对属性的识别

ps 只是一个猜测,可能并不是这个原因😂,所以读取的完整内部html信息奉上:<img class="tc-bg-img unselectable" id="slideBg" aria-hidden="true" src="https://t.captcha.qq.com/hycdn?index=1&image=937162424774118912?aid=2046626881&sess=s06T4sqGMb4DXsum73Wk3P-SURXzf3KAkV78MO2aTZS66bUUZQu-jjAKIrPjSveTLpW5OHe5cwxm5c0H_YBvXHPED-7uklvWW_3UiWkpNAQPyC9bfwTdBq4k34QhQ9haQnb5rKbt0FzIcH_Rz-8r3QKEogYj4ChOfRiU2d5PF9_VCBWCvhIDMqwxZNhgkWgISfMS4y3hycLXnv1XtYpSijNQkKRVv-BETojykBWda2oqiAFH_54anpHFBBKd2uhbIKw3UGhOJLJn6-_lBotDLCHqYI9Y35XNK1Lk_-80td-qQ*&sid=7157110909971070976&img_index=1&subsid=7">

blanka 最后更新于 2024/1/28

回复内容
CL 2024-01-28 07:46
#1

可能上面的选择器不是这个img元素的,所以取不到src,而不是因为编码问题。

blanka 回复 CL 2024-01-28 13:24 :

应该不是这个问题,因为对同一个选择器把对src属性读取改为内部html读取,是可以读取到的,等回去我发一个调试记录吧

CL 回复 blanka 2024-01-28 14:51 :

内部html能获取到更说明选择器不对,在浏览器里重新对img元素取选择器,而不是它的父级元素。

blanka 回复 CL 2024-01-29 02:02 :

确实是这样,之前是用的quicker工具选的,和直接从元素上复制的不一样

这选择器对不上


blanka 回复 乐昂岚【接定制】 2024-01-29 13:24 :

是的,一开始是用quicker的css工具框的,可能有重叠了

回复主贴