我尝试使用Pandas读取一些日志文件,其中列由空格分隔,而一些列由带有空格的单引号字符串组成(例如UIControlEvent
)。我很难用Selector
阅读这些文件。例如(使用一些虚拟数据):
'string '
对于第一行,这会产生列read_csv
,import pandas as pd
from io import StringIO
data = StringIO("""\
1 2 'asdf ' 3
4 5 'asdfg ' 4
""")
columns = ['a','b','c','d']
df = pd.read_csv(data, delim_whitespace=True, names=columns)
,1
,2
,'asdf
,我希望将其作为列'
,3
,1
,2
。这种行为完全有道理,但我无法找到一种方法让asdf
解析这些文件"正确" (因为我想要它)。
这一切都可能吗?
答案 0 :(得分:3)
从quotechar
read_csv
参数
df = pd.read_csv(filename, quotechar = "'", delim_whitespace=True, names=columns)
虽然这会导致列c
有额外的空格。你可以摆脱那些使用
df.c = df.c.str.strip()