首先声明,工作生活中我使用爬虫很少,但确实对这个比较感兴趣,为爬虫去学python相关的操作没有必要,可能还涉及到HTML的知识,我这个文化程度也不够看,好在有Quicker,简单便捷,能满足不太复杂场景的需求就行了。作者的动作,包括友情链接的2个动作我都试用过,下面我说说使用感受……
作者的【智能采集表格】,就取得表格数据而言,作者的动作无疑是最棒的,快速精准,简单易用,几乎没有学习成本。但对于非表格数据采集就不是很友好,比如我要爬取单列的相似元素就卡在【共1页。任务进度:1】,当然大多数都是用来批量抓取数据,抓取单列的场景并不多见。测试中发现某2个网页首页中【fysongs.com】【http://5sing.kugou.com/index.html】多列表单也无法抓取,不清楚是不是我个人的问题。还有,如果选择完毕后可以预览抓取结果,并编辑列(删除不需要的列),使用体验会不会更佳呢
HDG的【可视化爬虫】则和作者的刚好相反,单列多列任相宜,不过CSS选择器对小白来说有一定的学习成本,优点是更加精确,可以剔除不需要的部分。该动作的缺点也显而易见,无法一次采集多列,需要一列一列的手动添加,有时候选择了却忘记了点击“添加”(这是我个人的问题),且目前还无法翻页。
【简易爬虫】界面友好,直观简便,但目前使用是有Bug的,且只能爬取5列,现在还不成熟,期待后续的优化……
畅想一下,如果这3个动作能优势互补,或者整合成一个动作,那是特别完美的事情啦
简单说下我的动作:
关于【无法一次采集多列】这个也是没办法的事,毕竟只需一次就能保证多列的数据都精准几乎无法实现(拿提取表格做演示主要是数据方便对比,实际上数据参差不齐的情况比比皆是,本动作主要是用于这类场景,表格方面这位大佬做的就相当好了,再说了就算实现了一次多列,使用门槛也会相应的提高很多)
关于另一个【翻页】的问题,我目前还在考虑,因为总觉得获取“下一页”按钮的选择器来通过点击来实现翻页的效果不是很理想(起码我个人不太喜欢😂,目前正在学习一些“瀑布流”的脚本,尝试找到解决方案,如果急需的话,我也可以先加上)
补充下:关于【忘记点击“添加”】,可以直接按快捷键“C”来添加,我实际使用中也不会去按按钮😂
【可视化爬虫】的缺点是相对于【智能采集表格】而言的,对于普通用户来说,自然是希望既可以表格采集也可以单列采集,是由软件来自动判断的。如果需求复杂,可以用影刀的批量数据抓取或者直接上Python。EC10010本次更新的动作联动是非常非常棒的创意,融合了不同场景,我现在是将【可视化爬虫】作为【智能采集表格】运行失败后执行的动作。我一白piao的,提这些建议只是想大佬们的动作越来越易用,大家能取长补短,木有别的意思哈