我有一个pandas.Series
对象docs
,其标量值为字符串。
当我尝试遍历docs.values
(例如make list(docs)
)时,某些标量条目将被丢弃,或者变成NoneType
。
例如,给定target_index
是有问题的索引,当我检查docs[target_index]
时,它返回一个字符串数据。但是,当我执行list(docs)[target_index]
时,它返回None。
自pandas.Series.values
将数据转换为numpy.ndarray
以来,我想这个问题与numpy数据类型有关,但我无法弄清楚到底出了什么问题。
这是数据框的错误json文件
https://gist.github.com/goodcheer/f9c990171a57ff053b4b0539396f63f6
docs
是profile
列系列