应用错误收集

我尝试使用Python代替R进行数据分析，并且遇到了一些麻烦。所以我一直在阅读scikit-learn的文档，并尝试自己运行他们的kmeans示例，但收到此错误消息：

使用稀疏矢量图从训练数据集中提取要素   回溯（最近一次调用最后一次）：

文件＆＃34; kmeans.py＆＃34;，第104行，in       X = vectorizer.fit_transform（dataset.data）

File＆＃34; /Library/Python/2.7/site-packages/scikit_learn-0.15_git-py2.7-macosx-10.9-intel.egg/sklearn/feature_extraction/text.py" ;,第1238行，在fit_transform中       return self._tfidf.transform（X，copy = False）

File＆＃34; /Library/Python/2.7/site-packages/scikit_learn-0.15_git-py2.7-macosx-10.9-intel.egg/sklearn/feature_extraction/text.py" ;,第1010行，在变换中       X = normalize（X，norm = self.norm，copy = False）

File＆＃34; /Library/Python/2.7/site-packages/scikit_learn-0.15_git-py2.7-macosx-10.9-intel.egg/sklearn/preprocessing/data.py" ;,第542行，在规范化       inplace_csr_row_normalize_l2（X）

文件＆＃34; sparsefuncs.pyx＆＃34;，第146行，在sklearn.utils.sparsefuncs.inplace_csr_row_normalize_l2（sklearn / utils / sparsefuncs.c：2714）

ValueError：缓冲区dtype不匹配，预期＆＃39; int＆＃39;但是得到了很长的＆＃39;

供参考，代码如下：http://scikit-learn.org/stable/auto_examples/document_clustering.html

我花了一些小小的东西来获得整个scipy堆栈，但我确定我现在已经拥有它，只是想知道为什么复制粘贴他们的代码然后运行它会产生错误（我＆＃39; m确定他们不会在他们的网站上放置带有错误的代码）。关于修复是什么/发生了什么的任何想法？

kmeans scikit-学习教程

2 个答案: