我有一个带有一列和一堆引号的csv。我想把它读成一个pandas系列,以便csv中的每一行都是一个条目。但是,似乎当我使用pd.read_csv
时,读者会在找到逗号时切断该行。
如何忽略逗号并将excel中的整个单元格读入系列中的对象?
数据如下:一列和很多行。连续进入的一个条目是:“赫克托尔去了洗手间。他很紧张,因为他以前从未去过那里”所以我的节目因为下面的逗号而在'紧张'时切断了句子。
答案 0 :(得分:3)
您有一个文本文件,每行一个条目。因此,您可以通过设置delimiter='\n'
来加载文件,并为您的单个列命名:
import pandas as pd
data = pd.read_csv('input.txt', delimiter='\n', names=['text'])
print(data['text'][0])
会给:
Hector went to the bathroom. He was nervous, as he'd never been there before