我正在使用beautifulsoup在各种不同的域中提取事件的开始日期和结束日期,这些域都具有不同的html标记,开始日期和结束日期位于其中。因此,最初,我一直在为每个不同的域手动执行此操作,但这将永远花费。
所以我想知道是否可以根据日期时间结构搜索字符串,例如:
find_string = soup.body.findAll('%B %d, %Y')
显然这是行不通的。但是我想知道是否可以使用任何代码来查找例如2018年2月14日的代码。
示例: https://www.marketfairmall.com/event/Athleta-Semi-Annual-Sale/2145510733/
如何通过搜索%m /%d /%y来提取7/30/18