2016年10月19日星期三

抓取豆瓣害羞组姑娘自拍的脚本

豆瓣有个「请不要害羞」小组,里面每天有很多人自拍,估计很多朋友都是看过的,有时候尺度还是蛮大的。

这个脚本可以按照分页,去下载这些 MM 们分享的图片。但是缺点还是有的,没办法区分是男是女,所以,有收藏爱好的朋友,需要自己去归类了。

有 Python 环境的(3.x)可以直接保存脚本,如 download.sh,然后执行「./download (Linux 和 Mac)」。如果有其他需求,可以稍微改一改,去抓取别的。如果豆瓣有限制的话,更可以增加模拟 cookie 的功能,等你玩(脚本在最后面)。

分享一些之前抓取到的一些图片。









































【这里】查看 Python 脚本,有 Python3 环境的可以尝试一下,有兴趣学习的也可以去玩玩,绝对不会损害您的电脑。



本文转自 [T66Y]。神父未测试代码,后果自负。

14 条评论:

  1. 可可可可可可耻的硬了

    回复删除
  2. 这你也能硬,口味变差了啊

    回复删除
  3. 默认 GBK 编码打开乱码,切换编码会 403,什么鬼

    回复删除
  4. 果然很会找资源哦。。。

    回复删除
  5. 神父好人啊,这杠杠滴福利

    回复删除
  6. 耍独立博客的一般不屑这个,大家都在玩 1024

    回复删除
  7. 我也不知道啊,代码放在 notepad++ 里存为的 txt。我用了自动给英文添加空格,不能在正文里直接放代码,会瞎加空格。

    回复删除
  8. 这就厉害了,一口气发了这么多图

    回复删除
  9. 我真心喜欢第一张,其它都是辣鸡!

    回复删除
  10. 那个爬虫改改爬 1024

    回复删除
  11. 运行下脚本,一大波妹纸供你选择。

    回复删除
  12. 来~ 去写个 PHP 的采集~ 开撸 1024

    回复删除

注意:只有此博客的成员才能发布评论。