提取邮箱地址

提取邮箱地址 公开

Marcus 更新于 2019-06-13 17:29 | 4 | 116 |
80/89
如何使用分享的动作?

适用于
分类
查询搜索 文本处理 文件处理
aaaasda JasonYe Alexi CL 4 人赞了这个动作


更多信息
分享时间 2019-06-05 20:03
最后更新 2019-06-13 17:29
修订版本 5
限制再分享
Quicker版本 0.11.9.0
动作大小 16.6 KB

分享到

网页爬虫采集或根据选中的文本提取邮箱地址

演示动画

最近更新

更新时间 修订版本 更新说明
2019-06-13 17:29 5 多个网页采集时,实时保存结果,如遇到失败时可定位到采集位置。
2019-06-08 10:16 4 增加自动添加 http:// 功能,导出txt修改为保存到同一个文件。
2019-06-06 15:38 3 缓存文件改名
  • rxnwin 2019-07-14 10:36

    写入临时文件出错d:,我的电脑没有d盘

  • Hsu 2019-10-21 13:41
    在谷歌搜索页面会失败呢 能修复这个问题么 老大
  • Marcus 2019-10-21 14:05
    回复 @Hsu
    在谷歌搜索页面会失败呢 能修复这个问题么 老大

    网址发出来测试下

  • Hsu 2019-10-21 18:17
    回复 @Marcus

    网址发出来测试下

    随便搜索一个东西然后加上@gmail.com, 搜索出来的结果几乎每一条都是包含邮箱地址的,但是会无法抓取。以下是我尝试的链接:

    https://www.google.com/search?sxsrf=ACYBGNTpzQZ5tW1s0_PLSw2gooPXhEbKoA%3A1571652869283&source=hp&ei=BYWtXaDfDpC-9QOzt7ngBQ&q=air+filter+%40gmail.com&oq=air+filter+%40gmail.com&gs_l=psy-ab.3...5962.14142..14360...0.0..0.221.3111.0j21j1......0....1..gws-wiz.....10..35i362i39j35i39j0j0i12j0i10j0i203j0i30j0i12i10i30j0i12i30j0i10i30j0i8i10i30j33i160.DK7amftllvg&ved=0ahUKEwjg9eyXj63lAhUQX30KHbNbDlwQ4dUDCAY&uact=5

  • Marcus 2019-10-21 20:34
    回复 @Hsu

    随便搜索一个东西然后加上@gmail.com, 搜索出来的结果几乎每一条都是包含邮箱地址的,但是会无法抓取。以下是我尝试的链接:

    https://www.google.com/search?sxsrf=ACYBGNTpzQZ5tW1s0_PLSw2gooPXhEbKoA%3A1571652869283&source=hp&ei=BYWtXaDfDpC-9QOzt7ngBQ&q=air+filter+%40gmail.com&oq=air+filter+%40gmail.com&gs_l=psy-ab.3...5962.14142..14360...0.0..0.221.3111.0j21j1......0....1..gws-wiz.....10..35i362i39j35i39j0j0i12j0i10j0i203j0i30j0i12i10i30j0i12i30j0i10i30j0i8i10i30j33i160.DK7amftllvg&ved=0ahUKEwjg9eyXj63lAhUQX30KHbNbDlwQ4dUDCAY&uact=5

    由于搜索页面是动态的,http get不到源码,可以使用临时页面提取方式,或者加入循环,自动去搜索并提取。

    advance@advanceinternational.info

    advanceinternationalltd@gmail.com

    arjunenterprises.aug@gmail.com

    filters@arjunenterprises.co.in

    papsindustrial@gmail.com

    GOODFILTERS@GMAIL.COM

    shraddha.filter@gmail.com

    REIMERS.AGPARTS@GMAIL.COM

    abhinavfilters@gmail.com

    gambhir.gkgambhir@gmail.com

    info@asianexfilters.com

    rpaghera1642@gmail.com

    info@filtrene.com

    filtrenepte@gmail.com

    dedunufiltrene@gmail.com

修订版本 更新时间 更新说明
5 2019-06-13 17:29 多个网页采集时,实时保存结果,如遇到失败时可定位到采集位置。
4 2019-06-08 10:16 增加自动添加 http:// 功能,导出txt修改为保存到同一个文件。
3 2019-06-06 15:38 缓存文件改名
2 2019-06-05 21:31 添加删除缓存文件步骤。
1 2019-06-05 20:58 支持多个网页爬虫提取。