我正在使用gstat包进行普通克里金法并使用walker湖数据(数据大小= 470)。我在每个试验中从该数据中随机抽取20个,并计算从50-450数据集中随机选择的训练数据集的rmse。然后我计算了每个数据集的平均值。结果如下 -
apply plugin: 'com.android.application'
android {
compileSdkVersion 23
buildToolsVersion "23.0.1"
defaultConfig {
applicationId "com.example.subinasharma.myapplication2"
minSdkVersion 15
targetSdkVersion 23
versionCode 1
versionName "1.0"
}
buildTypes {
release {
minifyEnabled false
proguardFiles getDefaultProguardFile('proguard-android.txt'), 'proguard-rules.pro'
}
}
}
dependencies {
compile fileTree(dir: 'libs', include: ['*.jar'])
testCompile 'junit:junit:4.12'
compile 'com.android.support:appcompat-v7:23.1.1'
}
我的问题是:
1)为什么RMSE是波浪状的。为什么在增加培训数据的同时总是会减少?
2)这是否意味着,我们不需要大型数据集进行克里金法,因为当训练数据集为200时,RMSE最低。
等待回复。