我正在尝试将CSV放入数据框中,以便我可以更轻松地处理它,但是由于某些原因,即使指定10、500、100000等(csv,该框架也仅包含csv的前50行是2GB,很长)
df = pd.read_csv('all_reverse_key_passages.csv')
只使用了前50个,所以我添加了一个length参数:
df = pd.read_csv('all_reverse_key_passages.csv', nrows = 100)
这仍然只返回50的长度,如果nrows小于50,则它会适当减小。
在变量浏览器中,我可以看到数据帧的长度为50,并且len(df)也返回50。
答案 0 :(得分:0)
import pandas as pd
import csv
df = pd.read_csv('all_reverse_key_passages.csv', quoting=csv.QUOTE_NONE, error_bad_lines=False)
尝试运行这些。造成您问题的一个可能原因是第51行上存在一些不良数据,导致熊猫停止读取功能。