# -*- coding: utf-8 -*-
import re
import urllib
import urllib2
import cookielib
#获取CSDN博客标题和正文
url = "http://blog.csdn.net/[username]/archive/2010/07/05/5712850.aspx"
sock = urllib.urlopen(url)
html = sock.read()
sock.close()
content = re.findall('(?<=blogstory">).*(?=
上一篇: 用python爬虫抓站的一些技巧总结
下一篇: Python 登录网站
0 Responses so far.