用python实现 百度 站内搜索
By:Roy.LiuLast updated:2012-07-27
用PYTHON 实现baidu站内搜索, 有很多网站,为了搜索省事,或者是为了利用baidu ,google 搜索推广等。直接在页面调用了,google或者baidu 的站内搜索功能,只搜索与本站相关的内容。如何用python 自己写程序调用这些搜索引擎的借口,直接得到结果,显示在自己的页面中呢.
经过测试是可以,以百度为例,代码如下:
import re
import urllib
import urllib2
def baiduInnerSearch(keyword):
print keyword
website='www.yihaomen.com'
values = {
"word":keyword.encode('gbk','ignore')
}
data=urllib.urlencode(values)
search_url='http://www.baidu.com/baidu?tn=bds&cl=3&ct=2097152&si='+website+'&s=on&'+data
print search_url
resp = urllib2.urlopen(search_url)
content = resp.read()
content=content.decode('gbk','ignore')
#打印出baidu搜索出来的内容
print content
#在此结果的基础上,用正则表达式,可以得到自己想要部分的信息
if __name__=='__main__':
baiduInnerSearch('python')
运行之后,接可以看到打印出来的搜索内容,配置正则表达式,就可以分析出内容,标题等,然后再自己的页面显示,有时间写个正则表达式解析的文章。
经过测试是可以,以百度为例,代码如下:
import re
import urllib
import urllib2
def baiduInnerSearch(keyword):
print keyword
website='www.yihaomen.com'
values = {
"word":keyword.encode('gbk','ignore')
}
data=urllib.urlencode(values)
search_url='http://www.baidu.com/baidu?tn=bds&cl=3&ct=2097152&si='+website+'&s=on&'+data
print search_url
resp = urllib2.urlopen(search_url)
content = resp.read()
content=content.decode('gbk','ignore')
#打印出baidu搜索出来的内容
print content
#在此结果的基础上,用正则表达式,可以得到自己想要部分的信息
if __name__=='__main__':
baiduInnerSearch('python')
运行之后,接可以看到打印出来的搜索内容,配置正则表达式,就可以分析出内容,标题等,然后再自己的页面显示,有时间写个正则表达式解析的文章。
From:一号门
Next:伦敦2012奥运会开幕式,让我失望
COMMENTS