我的论文主题是支持向量回归的房价预测。
首先,我想选择功能。
所以我使用包caret
来进行特征选择。
但我有一个问题,我的数据框有经纬度。
我如何将纬度和经度作为输入?
这是我的零件数据框:
estate_Lat estate_Lon estate_TotolPrice
[1, ] 25.02862 121.5059 124117
[2, ] 25.03377 121.5089 2568347
[3, ] 25.04346 121.512 73000000
[4, ] 25.04348 121.512 5600000
[5, ] 25.04346 121.512 99300000
here中的完整档案。
这是我的代码:
#set.seed(7)
ibrary(mlbench)
library(caret)
mydata <- read.csv("D:/SupportVectorRegression/Origin/TestDatasetR_1000.csv", header=TRUE)
#location <- data.matrix(mydata[, c("estate_Lng", "estate_Lat")])
#location <- as.factor(paste(mydata[, c("estate_Lng", "estate_Lat")]))
#test <- as.factor(paste(mydata$estate_Lng, mydata$estate_Lat))
mydata$meuse.xy <- data.frame(mydata[, c("estate_Lng", "estate_Lat")])
estate_TotalPrice <- mydata$estate_TotalPrice
rfectrl <- rfeControl(functions=lmFuncs, method="cv", number=10, repeats=3,verbose=TRUE,returnResamp = "final")
results <- rfe(mydata$meuse.xy, estate_TotalPrice,sizes=c(1:2),rfeControl=rfectrl,method = "svmRadial",metric = "Rsquared")
print(results)
predictors(results)
plot(results, type=c("g", "o"))
我想显示结果:
> predictors(results)
[1] "estate_HouseArea" "estate_LandArea" "estate_Price" "estate_ParkingLot" "estate_ZoneUse"
[6] "estate_TransFloor" "estate_Land" "estate_HouseRoom_1" "estate_TotalFloor" "estate_HouseRoom_4"
[11] "estate_ParkingType" "River_Distance" "estate_ParkingPrice" "estate_House" "THSR_StationDistance"
[16] "estate_TransType" "Lib_Distance" "estate_HouseMaterials" ***"estate_Lat" "estate_Lng"***
[21] "ParkS_Distance" "Hosp_Distance" "estate_HouseRoom_3" "Post_Distance" "Hyper_Distance"
[26] "estate_HouseType" "estate_HouseDate" "estate_HouseUse"
然而,纬度和经度是分开的。我希望他们可以合并经度和经度,然后称为位置。 我该怎么办?感谢。
答案 0 :(得分:0)
纬度和经度是球体上提供“位置”位置的坐标。通过快速查看其中包含“距离”一词的其他属性,您需要使用一个了解纬度,经度和距离的R库,以便在运行其他功能之前预先计算所需的功能。