我是新的python,我想在txt文件中做一些搜索字符串。 我一直在使用TwitterSearch API Twitter抓取一些推文,然后将其导出到txt文件中。 在我的txt文件中,它有一些句子,如:
1|@tephen_ian|@mypreviana ya yg tabrakan maut itu lo... Antara KA 225 sama 220 thn 1987 itu... Yg bintaro 2 itu td pagi|None
2|@adibnurazis|Warga Jakarta korban tabrakan Bintaro ditanggung Pemprov DKI http://t.co/joKjmTKc0S http://t.co/8ebRc8AjzK|None
3|@randhika1991|Turut brduka cita utk Tabrakan KRL vs Truk LPG di Bintaro. Smg Amal Ibadah Korban yg mninggal ditrima oleh Tuhan YME, Aamiin... :( @KAI121|None
4|@ErhamORI|#Bagas Korban KRL vs Truk BBM: Tewas 5 Orang, Luka Berat 9, Luka Ringan 82: Kecelakaan tabrakan KRL dengan tru... http://t.co/a0lmnWQ0TQ|None
5|@appsari|@rararararatri iya. Ada tabrakan KRL jurusan serpong-tanah abang, nabrak truk solar, trs kebakar. Bnyk korban jiwanya..|None
从那个txt文件中,我想搜索一些包含几个单词/查询的句子,如'tabrakan','di','antara','tewas','luka','selamat'然后打印句子包含那些词。
到目前为止,我已经这样做了:
#!/usr/bin/python
data = open("dataset.txt", "r")
for line in data:
line_split = line.rstrip("\n").split("|")
if line_split[2] == 'tabrakan' 'di' 'antara' 'tewas' 'luka' 'selamat':
print(line_split[0])
并没有任何结果。
我做错了吗? 希望任何人都可以提供帮助,因为我尝试使用飞快移动或任何文本分类器:( 如果我在抓取数据集中使用印尼语,我很抱歉。
答案 0 :(得分:1)
Search a list of strings for any sub-string from another list
keywords = ['tabrakan', 'di' ,'antara', 'tewas', 'luka', 'selamat']
for line in data:
if any(k in line for k in keywords):
print line