sample = ",,"
values = shlex.shlex(sample, posix=True)
values.quotes = '"'
values.whitespace = ','
values.whitespace_split = True
received_output = list(values)
在上面的代码示例中,我希望将["", "", ""]
作为received_output
的值,但received_output
只是一个空列表[]
。似乎没有关于如何接收这种预期行为的任何信息。
这适用于sample.split(',')
,但我更喜欢使用shlex,因为我有令牌的复杂句子,如果是组的一部分(例如以下示例中的纬度,经度),则不应该拆分。 / p>
另一个例子:
sample = '9267,BELMONT,KEELER,,62.4,35.2,10/01/2012,Weekday,"(41.93897000, -87.73212000)"'
expected_output = ['9267', 'BELMONT', 'KEELER', '', '62.4', '35.2', '10/01/2012', 'Weekday', '(41.93897000, -87.73212000)']
retrieved_output = ['9267', 'BELMONT', 'KEELER', '62.4', '35.2', '10/01/2012', 'Weekday', '(41.93897000, -87.73212000)']
答案 0 :(得分:2)
- 即使引用,也无法解析空字符串。
如果要在输出中包含空字符串,则shlex库是该作业的错误工具。
正如@PadraicCunningham在评论中指出的那样,csv
(逗号分隔值)库应该可以正常工作:
>>> list(csv.reader(['9267,BELMONT,KEELER,,62.4,35.2,10/01/2012,Weekday,"(41.93897000, -87.73212000)"']))[0]
['9267', 'BELMONT', 'KEELER', '', '62.4', '35.2', '10/01/2012', 'Weekday', '(41.93897000, -87.73212000)']
>>> list(csv.reader([',,']))[0]
['', '', '']
答案 1 :(得分:0)
因此,我最初赞成其他答案,但事实证明这是错误的。文档中的引文来自非Posix行为部分,但默认情况下使用Posix行为。通过Posix行为,您可以得到一个空字符串,如下所示:
shlex.split('x ""')
# ['x', '']
请注意,在Posix模式下,引号不会分隔单词,所以会发生这种情况:
shlex.split('x""')
# ['x']
这有点令人困惑,但是您仍然可以使用shlex获得空字符串。
在您的特定情况下,由于您似乎仍然在解析类似CSV的输入,因此使用CSV模块很有意义。