使用过程:
使用【提取HTML内容】模块提取文章内容,使用微信链接的时候发生错误,我以为是微信的问题,但我尝试使用http://www.htmlnest.com/htmltotext.aspx 填入HTML提取文本是没问题的。我又尝试在参数【源HTML】中填入原始HTML内容,这次提取成功。
总结:
参数【源HTML】放入微信链接会报错。
链接地址:
https://mp.weixin.qq.com/s?__biz=MzAwODUwMTMyNg==&mid=2651893318&idx=2&sn=793e8971404279b951817da49b987d56&scene=0
可以试试先用http请求得到内容后再解析,有可能返回的http响应不是很标准。