我在一栏中有以下数据:
Company Name
Company Name\Cortana Place\rBaton Rouge, LA 70815
Some Product Company\r1Highway 21\rMadis
df = pd.read_csv(csv_cropped_tabula, encoding = "ISO-8859-1")
当我致电df['Company Name'][0]
或df['Company Name'][1]
我只回来追踪数据
rBaton Rouge, LA 70815
r1Highway 21\rMadis
我不明白为什么它会带回部分数据而不是全线
Company Name\Cortana Place\rBaton Rouge, LA 70815
答案 0 :(得分:0)
它将嵌入的逗号解析为分隔符,看起来您只有一个列,因此您可以告诉它只加载该列并传递lineterminator='\n'
:
In[86]:
t="""Company Name
Company Name\Cortana Place\rBaton Rouge, LA 70815 Some Product
Company\r1Highway 21\rMadi"""
df = pd.read_csv(io.StringIO(t), usecols=[0], lineterminator='\n')
df
Out[85]:
Company Name
0 Company Name\Cortana Place\rBaton Rouge, LA 70...
1 Company\r1Highway 21\rMadi
我告诉pandas
只加载第一列usecols=[0]
,另外它会在回车时读取\r
,所以我们可以覆盖它并告诉它具体看for \n
作为行终止符
如果我们现在看第一行,我们可以看到它的全部:
In[87]:
df['Company Name'].iloc[0]
Out[87]: 'Company Name\\Cortana Place\rBaton Rouge'