我正在尝试读取包含许多推文的json,但是出现以下错误。
OverflowError:int太大,无法转换
该脚本过滤多个json文件以获取特定的tweet,并且在到达特定的json时崩溃。
造成错误的那一行是这个:
df_temp = pd.read_json(path_or_buf=json_path, lines=True)
答案 0 :(得分:0)
只需将用户ID存储为字符串,然后将其视为一个字符串即可(实际上,这是处理此类ID时应该执行的操作)。如果您无法更改json输入格式,则始终可以像解析字符串一样将其像json对象一样解析,然后将引号添加到id代码中,例如使用正则表达式:Regex in python。
我不知道您使用哪个库解析json,但是也许隐式强制转换也可以工作:要么尝试对数字使用“ getString”方法,而不是“ getInt”方法,要么强制python处理对象像字符串,类似x = "" + json.getId()
Python在键入方面相当宽松,可能会让您这么做。