数据归一化后,变量的值更改为N / As

时间:2019-07-02 05:52:26

标签: r normalization na minmax

对于多项式回归,我应该对我的数据集进行归一化(来自世界银行数据的巴西1960-2017年国内生产总值)

使用:

x= x - min(x)
x= x/max(T)           

通过将“ x”更改为我们的自变量。

我尝试不带任何联系地联系讲师,还尝试了不同的数据集,但这是唯一不起作用的数据集。

##Task 3.1##
##Load Data ##
GDP_Brazil <- read_excel("GDP Brazil.xlsx") 

View(GDP_Brazil)

##Plotting the original Data

G=GDP_Brazil[,3]
Time=GDP_Brazil[,2]

##3.2
##Normalization of data

Time= Time - min(Time)
Time= Time/max(Time)

运行此代码后,该变量的数据为N / A

运行代码后,可变时间的结果从[1960,2017]更改为N / A,而应在[0,1]之间。

2 个答案:

答案 0 :(得分:0)

这是信息。数据集不包含N / As。该值是每年给出的,这实际上就是我选择此数据集的原因。

dput(head(GDP_Brazil)
structure(list(`Series Name` = c("GDP (current US$ in billion)", 
"GDP (current US$ in billion)", "GDP (current US$ in billion)", 
"GDP (current US$ in billion)", "GDP (current US$ in billion)", 
"GDP (current US$ in billion)"), Time = c(1960, 1961, 1962, 1963, 
1964, 1965), Brazil = c(15.1655699125199, 15.236854859469, 19.9262938390163, 
23.0214772922093, 21.2118922599904, 21.79003511719)), row.names = c(NA, 
-6L), class = c("tbl_df", "tbl", "data.frame"))

答案 1 :(得分:0)

它是tibble。因此,我们需要[[$进行子集设置,否则,它仍将是具有单个列的tibble。当我们进行一些需要vector

的计算时,这会产生影响
G <- GDP_Brazil[[3]]
Time <- GDP_Brazil[[2]]