我想删除文本文件(no_war_sc_r.txt)中的模式。 .txt文件包含具有我要删除的单词模式的多个文章。
我导入了“ re”软件包,发现它对此有所帮助。
这是代码:
import re
rgx_list = ['Read More',
'Read',
'And follow us on Twitter to keep up with the latest news and and acute and primary Care.', …]
new_text = open('/Users/sofia/Documents/src/fakenews1/data/news-data/no_war_pc_r_sophia.txt')
for rgx_match in rgx_list:
new_text = re.sub(rgx_match, '', new_text)
print(new_text)