人生,即使在最困难的时期,也不能放弃学习, 不能与时代脱节 ---- 勉励处于困难时期的自己.
Tag: 爬虫预览模式: 普通 | 列表

爬取某pygame技术博客

听说lxml 性能比 beautsoup 强,所以测试下, 玩玩这个东西怎么样
需要用到的包: https://pypi.python.org/pypi/lxml, 这里下载适合自己的版本, 然后跑下面的测试代码

查看更多...

Tags: python 爬虫

分类:Python/Django | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 441

python 下载 爬虫

用python 写爬虫,一般基于两种形式:
1. 为了爬取 页面内容。2. 下载文件,有很多下载站,提供下载链接。
这两种爬虫,都有可能遇到需要登录后才能下载。所以涉及到用python 登陆网站后,再去别的页面爬取内容或下载文件。
基础知识,可以参考:
http://www.yihaomen.com/article/python/210.htm

查看更多...

Tags: python 爬虫

分类:Python/Django | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 3229
csdn上偶尔还是有那么一两篇好文章的,如果遇到这样的好文章,你想直接把它弄到自己的网站里面,或者保存到本地处理,一般来说,两种方法:

1. copy and paste,这个不用多介绍,会用电脑的人都会。
2.自己写个爬虫,根据页面地址,自动爬出想要的内容。在这里采用python写爬虫。

查看更多...

Tags: python 爬虫 403 Forbidden

分类:Python/Django | 固定链接 | 评论: 2 | 引用: 0 | 查看次数: 7890