尝试通过HTTP请求来提取html的完整代码,用来截取其中的部分数据
可是在输出的代码内容,只有head内容,整个body的内容总是缺失
请问这是为什么?
1. 该网是公司内网,但我是在公司内网环境下操作的,是否有影响?
2. 网站需要登录,但是我已经登录了;再通过获取文本工具将网址放入变量url中,再通过url变量操作http请求,是否有影响?
3. 使用baidu做过测试,输出的html内容是完整的
请大佬帮忙指点……
有的网页时通过js动态生成或从后台加载的。http模块不会执行js。
对此,我们有什么可用的办法不。
可以试试使用浏览器插件+浏览器控制模块读取网页内容。
yeah,现在我就是这么做。缺点就是耗时长。