我正在阅读邮件并将其转换为普通数据使用' html2text'。 最后我的输出如下......
Reservation Confirmation #184146
Last Modified On: 03/12/2014 03:24 PM
Pick-up Date:
03/18/2014 - Tuesday
Pick-up Time:
11:20 PM
Service Type:
From Airport
Passenger:
MR.Ramesh
Phone Number:
(000) 000-0000
No. of Pass:
4
Vehicle Type:
suv
Primary/Billing Contact:
some name
Booking Contact:
MR.Ramesh
Payment Method:
CC 0000
i am planing to dump this data to my DB(SQLite3).
如何在python,django中执行此操作 以上数据应如下: ReservationConfirmation = 184146 Pick-upDate = 03/18/2014 - 星期二 接送时间=晚上11:20 等...
So, that i can dump in to corresponding fields in database.
答案 0 :(得分:0)
假设HTML只是一个巨大的<p>
块,这意味着没有任何HTML标签可以帮助您的程序理解数据,您最好的选择可能是将电子邮件解析为字符串并使用几个分裂。
首先将split()翻过“\ n \ n”(如email = email.split("\n\n")
)。这应该产生一个列表,每个键/值对作为字符串,如['Pick-up Date:\n03/18/2014 - Tuesday', 'Pick-up Time:\n11:20 PM']
。
然后split()over“:”(如email = [entry.split(":") for entry in email]
)。这应该会产生一个键/值列表列表,例如[['Pick-up Date', '\n03/18/2014 - Tuesday'], ['Pick-up Time', '\n11:20 PM']]
最后,parsed_email = {entry[0].strip():entry[1].strip() for entry in email}
应该为您提供一个数据字典,然后您可以将其加载到SQLite中,删除任何额外的空格,例如我们示例中的\n
。