Python - 如何读取/解析csv之类的行?

时间:2013-02-21 10:10:14

标签: python parsing csv line

我已经做了一些搜索,但大多数答案是关于阅读一个完整的csv文件,这些都不是我面临的问题。

我正在尝试使用urllib2从网络中读取文件:

request = urllib2.Request('http://.../tv.txt')
response = urllib2.urlopen(request)
lines = response.readlines()
for line in lines:
    ...

“line”格式如下所示:

"ABC", "XYZ,MNO", "KLM"
"ABC", "MN"
"ABC", "123", "10", "OPPA GANGNAM STYLE", "LADY"

如上所示,这些线实际上不是CSV线。列数不断变化。

有没有办法将每一行拆分成一个列表?欲望的结果应该是:

["ABC", "XYZ,MNO", "KLM"]
["ABC", "MN"]
["ABC", "123", "10", "OPPA GANGNAM STYLE", "LADY"]

我尝试过使用line.split(“,”),但由于每对双引号内都有逗号,因此无法正确拆分。

如果你知道怎么做,请帮助我。非常感谢你。

干杯,

PHP-Python的Java的MySQL的-新手。

2 个答案:

答案 0 :(得分:8)

使用csv模块,它可以满足您的需求。

yourstring= '"ABC", "XYZ,MNO", "KLM"\n"ABC", "MN"\n"ABC", "123", "10", "OPPA GANGNAM STYLE", "LADY"'

import csv
import io

class MyDialect(csv.Dialect):
    strict = True
    skipinitialspace = True
    quoting = csv.QUOTE_ALL
    delimiter = ','
    quotechar = '"'
    lineterminator = '\n'


b = io.StringIO(yourstring)
r = csv.reader(b, MyDialect())

for i in r:
    print len(i), ':',' @ '.join(i)

答案 1 :(得分:0)

import csv
import io

input='''"ABC", "XYZ,MNO", "KLM"
"ABC", "MN"
"ABC", "123", "10", "OPPA GANGNAM STYLE", "LADY"'''

resader = csv.reader(
    io.StringIO(input), 
    delimiter = ',', 
    quotechar = '"', 
    skipinitialspace = True,
)
for row in resader:
    print(row)

将作为

['ABC', 'XYZ,MNO', 'KLM']
['ABC', 'MN']
['ABC', '123', '10', 'OPPA GANGNAM STYLE', 'LADY']