加入CODE CHINA

· 不限速    · 不限空间    · 不限人数    · 私仓免费

免费加入
README.md

##QQSpider1:##
详情请见博客: 《QQ空间爬虫分享(一天可抓取 400 万条数据) 》 如果出现报错:

Traceback (most recent call last):
  File ".\init.py", line 20, in <module>
    my_messages.backups() # 备份爬虫信息
NameError: name 'my_messages' is not defined

多半的原因是 BitVector 模块用不了,可自行调试。
如果确定是BitVector用不了的话可以用 "BitVector模块报错解决" 里面的两个文件替换掉原有文件,不使用BitVector判重,改用python的list判重(数据量不大的话效果是一样的)。

-------------------------------------------------------   分界线   -------------------------------------------------------

##**QQSpider2:**## 更新后的版本,详情请见博客: 《QQ空间爬虫分享(2016年11月18日更新)》
有同学反映,爬QQ空间的很多都是学生想爬一些数据做统计研究的,本不是计算机专业,爬起来比较困难,希望有现成的数据出售。但是因为工作变动,其实今年3月份 程序开发完后我就没有跑过了,所以手上也没有数据。不过接下来我会开一两台机器跑这个爬虫,如果需要数据可以邮件联系我(bone_ace@163.com)。

遇到什么问题请尽量留言,方便后来遇到同样问题的同学查看。也可加一下QQ交流群:QSpider



项目简介

🚀 Github 镜像仓库 🚀

源项目地址

https://github.com/liuxingming/qqspider

发行版本

当前项目没有发行版本

贡献者 2

开发语言

  • Python 100.0 %