用熊猫读取CSV并忽略逗号

时间:2017-09-06 17:40:12

标签: python python-3.x pandas csv

我有一个带有一列和一堆引号的csv。我想把它读成一个pandas系列,以便csv中的每一行都是一个条目。但是,似乎当我使用pd.read_csv时,读者会在找到逗号时切断该行。

如何忽略逗号并将excel中的整个单元格读入系列中的对象?

数据如下:一列和很多行。连续进入的一个条目是:“赫克托尔去了洗手间。他很紧张,因为他以前从未去过那里”所以我的节目因为下面的逗号而在'紧张'时切断了句子。

1 个答案:

答案 0 :(得分:3)

您有一个文本文件,每行一个条目。因此,您可以通过设置delimiter='\n'来加载文件,并为您的单个列命名:

import pandas as pd

data = pd.read_csv('input.txt', delimiter='\n', names=['text'])
print(data['text'][0])

会给:

Hector went to the bathroom. He was nervous, as he'd never been there before