我正在尝试使用html
从以下BeautifulSoup
获取一些文字:
test = '''<p class="author"><a href="./viewtopic.php?p=1829610"></a>by <strong>FinancialDave</a></strong> Thu Oct 17, 2013 12:52 am </p>'''
testsoup = BeautifulSoup(test)
testsoup.text
这会给我这样的结果:u'by FinancialDave Thu Oct 17, 2013 12:52 am
但我想要的只是Thu Oct 17, 2013 12:52 am
。有没有办法做到这一点?
提前致谢。
答案 0 :(得分:0)
您需要使用正则表达式提取日期字符串。 BeautifulSoup在这里不会帮到你。