Python使用退出代码-1073741819终止进程

时间:2015-02-11 06:03:36

标签: python pandas csv utf

我正在尝试将csv文件(大小约为190MB)读入pandas数据帧,但我收到此错误。我正在从JetBrains运行Pycharm IDE

Process finished with exit code -1073741819 (0xC0000005)

我正在尝试运行的代码如下:

from pandas import DataFrame as df


if __name__ == '__main__':
    frame = df()
    frame.from_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', header=True)
    ab = list(frame.columns.values)
    print(ab)

以下是CSV中的实例:

createdat   text    coordinates entities    id_str  in_reply_to_user_id_str
Tue Feb 10 18:56:42 +0000 2015  

"RT @RubieDubes: official list of deluded XXXXX: 
Spurs Fans
Kanye West 
Louis van Gaal"     

{'trends': [], 'urls': [], 'user_mentions': [{'id': 65174814, 'name': 'Ruby ?', 'screen_name': 'RubieDubes', 'indices': [3, 14], 'id_str': '65174814'}], 'symbols': [], 'hashtags': []} 

5.65223E+17 

编辑:我尝试使用python控制台运行它并导致错误:python.exe [11640]中发生了未处理的win32异常。

1 个答案:

答案 0 :(得分:2)

我弄清楚问题是什么。 CSV中的值与解析器未正确读取的值相同。我改变了代码

frame.from_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', header=True)

data = pandas.read_csv('c:/Nitin/692/Python/CSV/21LIVvTOT_user_geo_Reply.csv', encoding='latin-1', engine='python')

猜猜utf-8中的编码导致了这个问题。代码运行时我将其更改为' latin-1。谢谢你的帮助。

编辑:我认为这是由于数据中存在表情符号引起的。