我正在尝试将csv文件(大小约为190MB)读入pandas数据帧,但我收到此错误。我正在从JetBrains运行Pycharm IDE
Process finished with exit code -1073741819 (0xC0000005)
我正在尝试运行的代码如下:
from pandas import DataFrame as df
if __name__ == '__main__':
frame = df()
frame.from_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', header=True)
ab = list(frame.columns.values)
print(ab)
以下是CSV中的实例:
createdat text coordinates entities id_str in_reply_to_user_id_str
Tue Feb 10 18:56:42 +0000 2015
"RT @RubieDubes: official list of deluded XXXXX:
Spurs Fans
Kanye West
Louis van Gaal"
{'trends': [], 'urls': [], 'user_mentions': [{'id': 65174814, 'name': 'Ruby ?', 'screen_name': 'RubieDubes', 'indices': [3, 14], 'id_str': '65174814'}], 'symbols': [], 'hashtags': []}
5.65223E+17
编辑:我尝试使用python控制台运行它并导致错误:python.exe [11640]中发生了未处理的win32异常。
答案 0 :(得分:2)
我弄清楚问题是什么。 CSV中的值与解析器未正确读取的值相同。我改变了代码
frame.from_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', header=True)
到
data = pandas.read_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', encoding='latin-1', engine='python')
猜猜utf-8中的编码导致了这个问题。代码运行时我将其更改为' latin-1。谢谢你的帮助。
编辑:我认为这是由于数据中存在表情符号引起的。