在python中附加矩阵时出错

时间:2016-06-02 15:51:38

标签: python numpy scipy scikit-learn

我有6个不同周的一组功能和标签,分别存储在变量public async Task<Coordinates> GeoCode(string address) { HttpClient client= new HttpClient(); var baseUrl = "http://maps.google.com/maps/api/geocode/json?address="; var addressEncoded = WebUtility.UrlEncode(address); var response= await client.GetAsync(baseUrl + addressEncoded); if(response.IsSuccessStatusCode) { //read location ... } } FEATURES_DATA中。

我想要做的是培养关于增长功能和标签的决策树。那么,第二周的第一周数据和测试培训,然后是前两周的培训和第三周的测试等等......

了解我的数据集:

TARGET

输出:

print np.asarray(FEATURES_DATA).shape
print np.asarray(FEATURES_DATA[0][0]).shape
print ""
print FEATURES_DATA[0]

这是主要代码:

(6L, 1L)
(463511L, 40L)

[ array([[3, 3, 3, ..., 7, 7, 7],
         [3, 3, 3, ..., 7, 7, 7],
         [3, 3, 3, ..., 7, 7, 7],
         ..., 
         [2, 2, 2, ..., 6, 6, 6],
         [2, 2, 2, ..., 6, 6, 6],
         [2, 2, 2, ..., 6, 6, 6]], dtype=uint8)]

我在from sklearn import tree from sklearn.tree import DecisionTreeClassifier features = np.asarray(FEATURES_DATA) labels = np.asarray(TARGET) for i in xrange(5): Xtrain = np.concatenate(features[:i][0]) print Xtrain.shape Ytrain = np.concatenate(labels[:i][0]) Xtest = FEATURES_DATA[i+1][0] Ytest = TARGET[i+1][0] clf_DT = DecisionTreeClassifier(criterion='gini', splitter='best', max_depth=None, min_samples_split=5000) clf_DT.fit(Xtrain, Ytrain) 连接行上收到以下错误:

Xtrain

有任何帮助吗?感谢

2 个答案:

答案 0 :(得分:1)

我得到了解决问题的方法。初始化空矩阵将解决问题。

Xtrain=np.empty(shape=[0, 40])
for i in xrange(5):
    Xtrain=np.concatenate((Xtrain,FEATURES_DATA[i][0]))
    print Xtrain.shape

给出输出

(463511L, 40L)
(955280L, 40L)
(1502984L, 40L)
(1969719L, 40L)
(2569141L, 40L)

答案 1 :(得分:0)

考虑第7行的第一次迭代,i = 0。

您的下一个语句提取的功能[:0]为空:[]

因此,没有元素[0]来完成表达式特征[:i] [0] ......这就是你得到下标错误的地方。

也许尝试1.5的范围?