好好做一个有节操的码农,比我有能力的人,都还在学习,我没有理由不继续学习.
出售一个自己用python,django写的blog,cms程序, 适合初学者参考, 淘宝链接:django cms应用程序出售
Tag: 爬虫预览模式: 普通 | 列表

爬取某pygame技术博客

听说lxml 性能比 beautsoup 强,所以测试下, 玩玩这个东西怎么样
需要用到的包: https://pypi.python.org/pypi/lxml, 这里下载适合自己的版本, 然后跑下面的测试代码

查看更多...

Tags: python 爬虫

分类:Python/Django | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 295

python 下载 爬虫

用python 写爬虫,一般基于两种形式:
1. 为了爬取 页面内容。2. 下载文件,有很多下载站,提供下载链接。
这两种爬虫,都有可能遇到需要登录后才能下载。所以涉及到用python 登陆网站后,再去别的页面爬取内容或下载文件。
基础知识,可以参考:
http://www.yihaomen.com/article/python/210.htm

查看更多...

Tags: python 爬虫

分类:Python/Django | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 2800
csdn上偶尔还是有那么一两篇好文章的,如果遇到这样的好文章,你想直接把它弄到自己的网站里面,或者保存到本地处理,一般来说,两种方法:

1. copy and paste,这个不用多介绍,会用电脑的人都会。
2.自己写个爬虫,根据页面地址,自动爬出想要的内容。在这里采用python写爬虫。

查看更多...

Tags: python 爬虫 403 Forbidden

分类:Python/Django | 固定链接 | 评论: 2 | 引用: 0 | 查看次数: 6670