-
python 下载 爬虫
用python 写爬虫,一般基于两种形式:1. 为了爬取 页面内容。2. 下载文件,有很多下载站,提供下载链接。这两种爬虫,都有可能遇到需要登录后才能下载。所以涉及到用python 登陆网站后,再去别的页面爬取内容或下载文件。基础知识,可以参考:http://www.yihaomen.com/article/python/210.htm
Date: 2012-07-30 View: 7880
-
用python实现 百度 站内搜索
用PYTHON 实现baidu站内搜索, 有很多网站,为了搜索省事,或者是为了利用baidu ,google 搜索推广等。直接在页面调用了,google或者baidu 的站内搜索功能,只搜索与本站相关的内容。如何用python 自己写程序调用这些搜索引擎的借口,直接得到结果,显示在自己的页面中呢.经过测试是可以,以百度为例,代码如下:import re
Date: 2012-07-27 View: 4013
-
用python 写爬虫,去爬csdn的内容,完美解决 403 Forbidden
csdn上偶尔还是有那么一两篇好文章的,如果遇到这样的好文章,你想直接把它弄到自己的网站里面,或者保存到本地处理,一般来说,两种方法:1. copy and paste,这个不用多介绍,会用电脑的人都会。2.自己写个爬虫,根据页面地址,自动爬出想要的内容。在这里采用python写爬虫。
Date: 2012-07-23 View: 24395
-
Django filter中用contains 在mysql中的问题
用PYTHON ,DJANGO 做站,在通常的情况下,需要用到 orM 的查询方法,比如object.filter(tag__contains='keywords')....在这种情况下,如果你跟踪 sql 语句,你会发现,SQL 语句会生成 select .... like bianry '%keywords%', 如果是这样的语句,在某些情况是下是会出问题的,也就是说查询出来的数据可能会比你预计的少。如果你用 raw sql 查总数 select count(*) from table where like '%keywords%' 得到数量可能比你用ORM 采用上面的方式得到的数据多,问题就在于生成的条件问题。
Date: 2012-07-13 View: 9656
-
VPS CENTOS 上配置python,mysql,nginx,uwsgi,django全过程
昨天试用了VPS,花了一天部署了一个简单应用。在下面的过程中省去了用django 创建project的一步,忘记了你自己一用startporject 创建。下面是原来边操作,边记录的东西,我习惯文本编辑。可能格式不好看。现在搬到博客中来。=====================================================
Date: 2012-04-25 View: 7045
-
apache2,Django,Python,wsgi,环境配置
前几天测试了在apache2 与django 1.3 集成。总结如下。首先需要在apache2的配置文件中增加 LoadModule wsgi_module modules/mod_wsgi-win32-ap22py27-3.3.so当然 mod_wsgi-win32-ap22py27-3.3.so 有可能需要下载,然后拷贝到apache2 的module目录中。
Date: 2012-04-24 View: 2833
-
python 做成windows service 不完全版
前面有提到过python 在ubuntu 配置为启动服务,只需要在rc.local 中配置就好。在WINDOWS中呢,需要借助于PYWIN32扩展模块,py2exe,来完成。1.先写服务类 iNetServerService.py代码片段, 请查看文章详情 ...
Date: 2012-04-06 View: 3390
-
将python 脚本作为服务在ubuntu 11.10 中启动。
写了一个python 服务程序,但每次都在控制台下启动,感觉很不好,始终有个console界面,所以就想把他加入到系统自动启动中。在ubuntu 11.10 中,进入 /etc 目录代码片段, 请查看文章详情 ...
Date: 2012-03-27 View: 5111
-
曾经在python 2.4 下写过的而一个发送邮件的类
在python 2.4 下写过的一个发邮件的类代码片段, 请查看文章详情 ...
Date: 2012-03-04 View: 3129
-
转载一个python基类,多态的文章
很早以前见到过“python的类、基类、多态、取消基类的代码",现在很想找到那个例子,可惜,又找不到了!算了,把已经知道的收集一下,以后看到了再补充!__bases__是一个元组(可能是None或独元), 包括其基类, 以基类列表中它们的排列次序出现---------http://www.ixpub.net/redirect.php?tid=641482&goto=lastpost
Date: 2012-02-24 View: 2665
-
django 模板中无法实现计算,收集的方案。
用django的divisibleby标签实现,如下:代码片段, 请查看文章详情 ...
Date: 2012-02-23 View: 5863
-
python实现反射功能
在java中用classfor 很容易实现反射,比如SPRING,就大量用这个东西实现。现在用python做服务端,也想用类似的方式。在搜索了大量的网站后,找到一个classloader方案,源代码,例子如下。代码片段, 请查看文章详情 ...
Date: 2012-02-16 View: 2827
-
python 中的 XML_RPC 例子
最近看PYTHON RPC, 看了下帮助文档,把代码总结如下:服务端代码片段, 请查看文章详情 ...
Date: 2012-02-09 View: 2798
-
django ERROR:'utf8' codec can't decode byte 0xe9 i
用DJANGO 做一个测试,出现了一个错误。'utf8' codec can't decode byte 0xe9 in position 303: invalid continuation byte检查了半天,才发现错误是由模版引起的,自己粗心引起的。
Date: 2012-02-06 View: 3181
-
python2.7 json 转换日期的处理
python2.7中 集成了json的处理(simplejson),但在实际应用中,从mysql查询出来的数据,通常有日期格式,这时候,会报一个错:TypeError: datetime.datetime(2007, 7, 23, 12, 24, 25) is not JSON serializable说明日期转换出问题,后来再网上找到了解决办法。
Date: 2012-02-03 View: 6315