网页好像是进行了实时渲染,当网页下拉的时候,原先展示的信息会消失,审查元素中的信息跟着消失,出现新的下拉的展示内容。页面上拉同理。
对于这样的网页内容提取有没有好的解决方案?
可以看下http请求,一般这样的请求是带page参数,也就是页码参数,还有的会带size,每页加载的数据条数