我有一个包含大量日期的文本文件。日期为格式(2012年3月4日或2012年3月)。如果假设这些日期之间我的话很少,我想算一下这个词。同样明智的是,我想在每两个日期之间计算相同的单词,并在exel文件中生成带有日期和计数的输出。有人可以帮助我吗?
我已经提供了示例文本文件。
textfile.txt
征集的背景 在公司2011年和2012年的股东年会上,Biglari先前曾提名个人参加董事会选举。以下是与2013年年度会议相关的代理请求的事件年表: * 2012年11月30日,Biglari Holdings Inc.和Biglari Capital的董事长兼首席执行官Sardar Biglari举行了电话会议。 Sandra B. Cochran,本公司总裁兼首席执行官;以及公司董事会主席James W. Bradford。 Cochran女士和Bradford先生向Biglari先生转达了公司有兴趣回购Biglari及其附属公司所拥有的所有股份。 Biglari先生随后回复说,Biglari对于没有向所有其他Cracker Barrel股东提供的股票回购不感兴趣。 * 2013年2月13日,在Biglari先生,Cochran女士和Bradford先生的电话会议上,Cracker Barrel代表重申了公司愿意探索回购Biglari及其附属公司所拥有的所有股份。 Biglari先生重申了他对此事的立场,并敦促公司投标20%的已发行股份或向所有股东发行一次性特别股息。同一天晚些时候,Biglari收到了公司授权的书面要约,要求以市场价格回购Biglari及其附属公司拥有的所有4,737,794股股份(根据适用的田纳西州可能要求的任何调整)法)。 * 2013年2月14日,Biglari先生致函Cracker Barrel董事会,表示他对所有其他Cracker Barrel股东未提供的股票回购不感兴趣。信中继续说,由于Cracker Barrel有能力购买Biglari近20%的股权,然后价值超过3亿美元,Biglari先生向董事会提出了两项建议:(1)招标公司已发行股份的20%或(2) )发行3亿美元的一次性特别股息。 Biglari先生认为,股东应该有一个合理的资本配置策略,一个让所有人按比例受益的策略。 Biglari先生表示,由于他对公司的投资,他希望管理层取得成功。 Biglari先生总结说,他和Cooley博士随时准备提供服务,与董事会一起富有成效地工作,并讨论增加股东价值的方法。 * 2013年3月6日,Biglari控股公司董事会副主席Biglari先生和Philip L. Cooley先生与Bradford先生和Cochran女士召开电话会议,Biglari先生提议Cracker Barrel支付一个向本公司全体股东派发每股15.00美元的特别股息。 Biglari先生提供了董事会调整资本结构的理由,以便向Cracker Barrel的股东返还大量现金。 * 2013年3月25日,Biglari先生收到布拉德福德先生的语音留言,布拉德福德先生指出他将向董事会提出Biglari先生每股15.00美元的特别股息提案。 * 2013年5月16日,Biglari和Cooley先生与Bradford先生和Cochran女士举行了电话会议。 Biglari先生询问董事会对拟议特别股息的审查情况。布拉德福德先生回答说董事会没有开会讨论此事。 Biglari先生敦促公司迅速解决此事,以造福所有股东。比格拉里先生断言,在没有特别股息决定的情况下,他会用一切手段推进特别股息的概念
答案 0 :(得分:0)
使用正则表达式查找日期。
import re
regex = '\s(\w+)\s(\d+\,)\s(\d+)' # this will match the form "str int, int"
with open('textfile.txt', 'r') as f:
text = f.read()
all_dates = [' '.join(date) for date in re.findall(regex, text)]
这将创建文件中所有日期的列表,称为all_dates
。