我是python的新手。我正在尝试使用VCARD 2.1
python包解析vobject 0.9.2
文件。
我正在尝试解析这个VCARD文件:
BEGIN:VCARD
VERSION:2.1
N;ENCODING=QUOTED-PRINTABLE;CHARSET=UTF-8:I;AM;DUMMY;;
TEL;CELL:123456789
END:VCARD
这些是我使用的python命令:
import vobject
f=open('sample.vcf','r')
vcf=vobject.readOne(f)
然后我收到以下错误:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Program Files\Anaconda3\lib\site-packages\vobject\base.py", line 1129, in readOne
allowQP))
File "C:\Program Files\Anaconda3\lib\site-packages\vobject\base.py", line 1073, in readComponents
vline = textLineToContentLine(line, n)
File "C:\Program Files\Anaconda3\lib\site-packages\vobject\base.py", line 912, in textLineToContentLine
'lineNumber' : n})
File "C:\Program Files\Anaconda3\lib\site-packages\vobject\base.py", line 336, in __init__
self.value = self.value.decode('quoted-printable')
AttributeError: 'str' object has no attribute 'decode'
错误日志https://paste.fedoraproject.org/391670/46866724/ 的链接
Python显示str
对象没有属性decode
。
以下是vobject包源代码中发生错误的代码片段:
if 'ENCODING' in self.params:
if 'QUOTED-PRINTABLE' in self.params['ENCODING']:
qp = True
self.params['ENCODING'].remove('QUOTED-PRINTABLE')
if 0==len(self.params['ENCODING']):
del self.params['ENCODING']
if 'QUOTED-PRINTABLE' in self.singletonparams:
qp = True
self.singletonparams.remove('QUOTED-PRINTABLE')
if qp:
self.value = self.value.decode('quoted-printable')
通过读取stackoverflow中的类似问题我理解vobject包正在尝试解码已解码的字符串。所以我甚至尝试将vcf文件转换为二进制字符串并将其作为vobject.readOne
的输入。
binstr = f.read('sample.vcf','r').encode('utf-8')
x=vobject.readOne(binstr)
但它不起作用。
成功解析VCARD
文件需要做些什么?
请有人帮助我......
编辑:
现在我明白这个错误是由于vobject
与python 3的不兼容造成的。我可以做任何小的黑客来克服这个错误吗?
答案 0 :(得分:1)
您的问题有三个问题。
首先:在N领域你错过了“:”
第二:vobject似乎需要FN,尽管你的vcard版本是2.1,严格来说并不需要它。
第三:我建议您使用vobject.readComponents
而不是readOne在任何情况下,如果您不想使用readComponents,您的代码:
f=open(vcardfile,'r')
vcf=vobject.readOne(f)
使用以下文件:
BEGIN:VCARD
VERSION:2.1
N:;ENCODING=QUOTED-PRINTABLE;CHARSET=UTF-8:I;AM;DUMMY;;
FN:;;;;
TEL;TYPE=CELL:123456789
END:VCARD
以下代码也适用于上述文件:
#!/usr/bin/env python3
import vobject
vcardfile='/Users/foo/bar/abovefile.vcf'
with open(vcardfile) as source_file:
vcardlist = vobject.readComponents(source_file)
for vcard in vcardlist:
print vcard
print vcard.serialize()
print vcard.prettyPrint
你应该得到输出:
<VCARD| [<VERSION{}2.1>, <FN{};;;;>, <N{}AM ENCODING=QUOTED-PRINTABLE CHARSET=UTF-8:I DUMMY>, <TEL{'TYPE': ['CELL']}123456789>]>
BEGIN:VCARD
VERSION:2.1
FN:\;\;\;\;
N:;ENCODING=QUOTED-PRINTABLE;CHARSET=UTF-8:I;AM;DUMMY
TEL;TYPE=CELL:123456789
END:VCARD
VCARD
VERSION: 2.1
TEL: 123456789
params for TEL:
TYPE ['CELL']
FN: ;;;;
N: AM ENCODING=QUOTED-PRINTABLE CHARSET=UTF-8:I DUMMY