读取json文件时出现溢出错误

时间:2018-07-05 21:45:23

标签: python json python-3.x twitter tweets

我正在尝试读取包含许多推文的json,但是出现以下错误。

OverflowError:int太大,无法转换

该脚本过滤多个json文件以获取特定的tweet,并且在到达特定的json时崩溃。

造成错误的那一行是这个:

df_temp = pd.read_json(path_or_buf=json_path, lines=True)

Here is the error in the cmd

1 个答案:

答案 0 :(得分:0)

只需将用户ID存储为字符串,然后将其视为一个字符串即可(实际上,这是处理此类ID时应该执行的操作)。如果您无法更改json输入格式,则始终可以像解析字符串一样将其像json对象一样解析,然后将引号添加到id代码中,例如使用正则表达式:Regex in python

我不知道您使用哪个库解析json,但是也许隐式强制转换也可以工作:要么尝试对数字使用“ getString”方法,而不是“ getInt”方法,要么强制python处理对象像字符串,类似x = "" + json.getId()

Python在键入方面相当宽松,可能会让您这么做。