Bokeh:ValueError:超出范围的浮点值不符合JSON

时间:2016-08-08 04:05:04

标签: python bokeh

我遇到了这个讨论(从一年前开始):https://github.com/bokeh/bokeh/issues/2392

我也看到了没有任何错误的白色屏幕..然后我尝试采用2列的一小部分并尝试以下内容:

由于pandas在那里只获得了一堆空数据的行,我尝试了dropna ..这导致根本没有数据。所以我只是指定了应该进入df的行(因此是df = df.head(n=19)行)

import pandas as pd
from bokeh.plotting import figure, output_file, show

df = pd.read_excel(path,sheetname,parse_cols="A:B")
df = df.head(n=19)
print(df)
rtngs = ['iAAA','iAA+','iAA','iAA-','iA+','iA','iA-','iBBB+','iBBB','iBBB-','iBB+','iBB','iBB-','iB+','iB','iB-','NR','iCCC+']
x= df['Score']
output_file("line.html")

p = figure(plot_width=400, plot_height=400, x_range=(0,100),y_range=rtngs)

# add a circle renderer with a size, color, and alpha
p.circle(df['Score'], df['Rating'], size=20, color="navy", alpha=0.5)

# show the results
#output_notebook()
show(p)

DF:

   Rating  Score
0    iAAA   64.0
1    iAA+   33.0
2     iAA    7.0
3    iAA-   28.0
4     iA+   36.0
5      iA   62.0
6     iA-   99.0
7   iBBB+   10.0
8    iBBB   93.0
9   iBBB-   91.0
10   iBB+   79.0
11    iBB   19.0
12   iBB-   95.0
13    iB+   26.0
14     iB    9.0
15    iB-   26.0
16     NR   49.0
17  iCCC+   51.0
18   iAAA   18.0

以上显示笔记本中的输出,但仍然会抛出:ValueError: Out of range float values are not JSON compliant

它也不会(因此?)产生输出文件。如何摆脱这个小子集的这个错误?它与NaN值有关吗?那还可以解决较大数据集的“白屏死机”问题吗?

感谢vm看一看!

如果您想查看整个错误:

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-12-4fa6b88aa415> in <module>()
     16 # show the results
     17 #output_notebook()
---> 18 show(p)

C:\Users\x\AppData\Local\Continuum\Anaconda3\lib\site-packages\bokeh\io.py in show(obj, browser, new)
    300     if obj not in _state.document.roots:
    301         _state.document.add_root(obj)
--> 302     return _show_with_state(obj, _state, browser, new)
    303 
    304 

C:\Users\x\AppData\Local\Continuum\Anaconda3\lib\site-packages\bokeh\io.py in _show_with_state(obj, state, browser, new)
    310 
    311     if state.notebook:
--> 312         comms_handle = _show_notebook_with_state(obj, state)
    313         shown = True
    314 

C:\Users\x\AppData\Local\Continuum\Anaconda3\lib\site-packages\bokeh\io.py in _show_notebook_with_state(obj, state)
    334         comms_target = make_id()
    335         publish_display_data({'text/html': notebook_div(obj, comms_target)})
--> 336         handle = _CommsHandle(get_comms(comms_target), state.document, state.document.to_json())
    337         state.last_comms_handle = handle
    338         return handle

C:\Users\x\AppData\Local\Continuum\Anaconda3\lib\site-packages\bokeh\document.py in to_json(self)
    792         # this is a total hack to go via a string, needed because
    793         # our BokehJSONEncoder goes straight to a string.
--> 794         doc_json = self.to_json_string()
    795         return loads(doc_json)
    796 

C:\Users\x\AppData\Local\Continuum\Anaconda3\lib\site-packages\bokeh\document.py in to_json_string(self, indent)
    785         }
    786 
--> 787         return serialize_json(json, indent=indent)
    788 
    789     def to_json(self):

C:\Users\x\AppData\Local\Continuum\Anaconda3\lib\site-packages\bokeh\core\json_encoder.py in serialize_json(obj, encoder, indent, **kwargs)
     97         indent = 2
     98 
---> 99     return json.dumps(obj, cls=encoder, allow_nan=False, indent=indent, separators=separators, sort_keys=True, **kwargs)

C:\Users\x\AppData\Local\Continuum\Anaconda3\lib\json\__init__.py in dumps(obj, skipkeys, ensure_ascii, check_circular, allow_nan, cls, indent, separators, default, sort_keys, **kw)
    235         check_circular=check_circular, allow_nan=allow_nan, indent=indent,
    236         separators=separators, default=default, sort_keys=sort_keys,
--> 237         **kw).encode(obj)
    238 
    239 

C:\Users\x\AppData\Local\Continuum\Anaconda3\lib\json\encoder.py in encode(self, o)
    197         # exceptions aren't as detailed.  The list call should be roughly
    198         # equivalent to the PySequence_Fast that ''.join() would do.
--> 199         chunks = self.iterencode(o, _one_shot=True)
    200         if not isinstance(chunks, (list, tuple)):
    201             chunks = list(chunks)

C:\Users\x\AppData\Local\Continuum\Anaconda3\lib\json\encoder.py in iterencode(self, o, _one_shot)
    255                 self.key_separator, self.item_separator, self.sort_keys,
    256                 self.skipkeys, _one_shot)
--> 257         return _iterencode(o, 0)
    258 
    259 def _make_iterencode(markers, _default, _encoder, _indent, _floatstr,

ValueError: Out of range float values are not JSON compliant

7 个答案:

答案 0 :(得分:6)

我遇到了同样的错误,我调试了问题:我在绘制的数据集中有NaN个值,而bokeh的{​​{1}}函数(在serialize_json()中)没有允许/core/json_encoder.py值(我不知道为什么......)。在此函数的NaN部分中,return中存在allow_nan=False参数:((问题仅在生成输出文件时在散景过程的json.dumps()部分发生) (它调用上面的io函数。)

因此,您必须替换数据框中的serialize_json()值,例如:

NaN

美好的一天! :)

答案 1 :(得分:4)

合并this Pull Request添加二进制数组序列化选项时,将更好地支持

NaN支持。这应该在2017年1月的Bokeh 0.12.4中提供.Bokeh在python allow_nan编码器中不使用JSON,因为这不是标准的 - nan和{{1}不是官方JSON规范的一部分(一个令人震惊的监督IMO,但不受我们的控制)

答案 2 :(得分:1)

嗯,这不是你的问题的答案,这更像是我在散景中工作一周的经历。在我的情况下试图从散景中制作一个类似德克萨斯州的例子......在经历了很多挫折之后我发现散景或者json或其他任何遇到列表的第一个值(myList)被绘制为NaN它拒绝给出消息的情节

ValueError: Out of range float values are not JSON compliant

如果我将列表的第一个值(myList [0])更改为float,即使它包含NaN到其他位置,它也能正常工作。考虑到这一点,了解这些事情如何运作的人将提出答案。我的目的是重建你的数据,使第一个值不是一个南极。

答案 3 :(得分:1)

我在此行中遇到此错误:

ksns() { kubectl config set-context --current --namespace="$1" }

我工作时使用此存储库作为基准:https://github.com/ShuaiW/twitter-analysis/blob/master/topic_tweets.pymine

而且,我用这段代码解决了这个问题(希望对其他人有用):

ksns default

关键是:

save(plot_lda, 'tsne_lda_viz_{}_{}_{}_{}_{}_{}_{}.html'.format(
    num_qualified_tweet, n_topics, threshold, n_iter, num_example, n_top_words, end_date))

答案 4 :(得分:0)

删除NAN值后,可能会有无限值, 跟踪整个数据集它可能有一些无限值,inf删除那些无限值,然后它应该工作。

df['column'].describe()

然后,如果您发现任何inf值,请使用

删除这些行
df = df[~df.isin([np.nan, np.inf, -np.inf]).any(1)]

参考:solution here

答案 5 :(得分:0)

我碰到了这个问题,我意识到这是因为我的数据框的一列只填充了NaN。

您可以改用其他值,例如:

df['column'] = np.zeros(len(df))

答案 6 :(得分:0)

我遇到了这个问题,并通过清理我的数据集

解决了

检查您的数据集,并更改记录值。