我知道它被问了很多,我尝试了一些东西,但我无法做到:
我有一个这样的文本文件:
From: VENCA <email@infoclientes.venca.es>
Subject: =?ISO-8859-1?Q?=BFMaxi,_midi_o_mini=3F_=A1No_pases_d?=
=?ISO-8859-1?Q?e_largo_porque_esto_te_interesa!?=
Subject: =?UTF-8?Q?Lo_mejor_de_Gmail_est=C3=A9s_donde_est=C3=A9s?=
From: Equipo de Gmail <mail-noreply@google.com>
Subject: =?UTF-8?Q?Tres_consejos_para_sacarle_el_m=C3=A1ximo_partido_a_Gmai?=
From: Equipo de Gmail <mail-noreply@google.com>
Subject: =?UTF-8?Q?Organ=C3=ADzate_mejor_con_la_bandeja_de_entrada_de_Gmail?=
From: Equipo de Gmail <mail-noreply@google.com>
From: VENCA <email@infoclientes.venca.es>
Subject: =?UTF-8?Q?MARINA,_comprueba_que_tus_datos_se?=
=?UTF-8?Q?an_correctos_y_=C2=A1bienvenid@_a_Venca!?=
Subject: =?UTF-8?Q?Nuevo_inicio_de_sesi=C3=B3n_en_Chrome_con_Windows?=
From: Google <no-reply@accounts.google.com>
[...]
我想要提取的每对From / Subject或Subject / From的格式为:
From: VENCA <email@infoclientes.venca.es> - Subject: ¿Maxi, midi o mini? ¡No pases de largo porque esto te interesa!
[...]
所以我必须提取每一对(考虑到一些主题是2,3 ...行长)给出了我想要的格式并从utf-8编码主题,iso ...无论如何制作它们明白的
非常感谢!
答案 0 :(得分:0)
with open('infile.txt') as infile:
try:
while True:
line1 = next(infile).rstrip()
line2 = next(infile).rstrip()
if line2.startswith('From:'):
line1, line2 = line2, line1
print line1, '-', line2
except StopIteration:
pass