因为你的html不是合法的xml格式,标签没有成对出现,只能用html解析器
from bs4 import BeautifulSoup
s = “””
714659079qqcom 2014/09/10 10:14
“””
soup = BeautifulSoup(s, “html.parser”)
print soup
print soup.get_text()
如果你想用正则的话,只要把标签匹配掉就可以了
import re
s = “””
714659079qqcom 2014/09/10 10:14
“””
dr = re.compile(r’]+>’, re.S)
dd = dr.sub(”, s)
print dd