我有6个不同周的一组功能和标签,分别存储在变量public async Task<Coordinates> GeoCode(string address)
{
HttpClient client= new HttpClient();
var baseUrl = "http://maps.google.com/maps/api/geocode/json?address=";
var addressEncoded = WebUtility.UrlEncode(address);
var response= await client.GetAsync(baseUrl + addressEncoded);
if(response.IsSuccessStatusCode)
{
//read location ...
}
}
和FEATURES_DATA
中。
我想要做的是培养关于增长功能和标签的决策树。那么,第二周的第一周数据和测试培训,然后是前两周的培训和第三周的测试等等......
了解我的数据集:
TARGET
输出:
print np.asarray(FEATURES_DATA).shape
print np.asarray(FEATURES_DATA[0][0]).shape
print ""
print FEATURES_DATA[0]
这是主要代码:
(6L, 1L)
(463511L, 40L)
[ array([[3, 3, 3, ..., 7, 7, 7],
[3, 3, 3, ..., 7, 7, 7],
[3, 3, 3, ..., 7, 7, 7],
...,
[2, 2, 2, ..., 6, 6, 6],
[2, 2, 2, ..., 6, 6, 6],
[2, 2, 2, ..., 6, 6, 6]], dtype=uint8)]
我在from sklearn import tree
from sklearn.tree import DecisionTreeClassifier
features = np.asarray(FEATURES_DATA)
labels = np.asarray(TARGET)
for i in xrange(5):
Xtrain = np.concatenate(features[:i][0])
print Xtrain.shape
Ytrain = np.concatenate(labels[:i][0])
Xtest = FEATURES_DATA[i+1][0]
Ytest = TARGET[i+1][0]
clf_DT = DecisionTreeClassifier(criterion='gini', splitter='best', max_depth=None, min_samples_split=5000)
clf_DT.fit(Xtrain, Ytrain)
连接行上收到以下错误:
Xtrain
有任何帮助吗?感谢
答案 0 :(得分:1)
我得到了解决问题的方法。初始化空矩阵将解决问题。
Xtrain=np.empty(shape=[0, 40])
for i in xrange(5):
Xtrain=np.concatenate((Xtrain,FEATURES_DATA[i][0]))
print Xtrain.shape
给出输出
(463511L, 40L)
(955280L, 40L)
(1502984L, 40L)
(1969719L, 40L)
(2569141L, 40L)
答案 1 :(得分:0)
考虑第7行的第一次迭代,i = 0。
您的下一个语句提取的功能[:0]为空:[]
因此,没有元素[0]来完成表达式特征[:i] [0] ......这就是你得到下标错误的地方。
也许尝试1.5的范围?