R如何从表中的数字中减去百万(单词)

时间:2019-03-22 23:42:10

标签: r statistics

我正尝试通过减去减去其他地区的净预算  https://en.wikipedia.org/wiki/List_of_Marvel_Cinematic_Universe_films#Critical_response 票房表现

如果我不是初学者,我宁愿不要使用图书馆

有问题。其他地区的毛额和预算列中的“ $”。 预算中甚至有“百万”。

我试图用gsub摆脱单词“ million”和“ $” 并使其成为数字。

BoxOffice是“票房表现”表


w=gsub("\\s","",BoxOffice$Budget)
w1=gsub("million",",000,000",w)
w2=gsub("([.])(?:\\d{1})","",w1)

我有 [1]“ $ 109,000,000” [2]“ $ 162,000,000”
[3]“ $ 365,000,000” [3]“ $ 316–400,000,000”

BoxOffice $ OtherTerritoryGross [1] $ 519,311,965“ [2]” $ 622,674,139“
[3]“ $ 1,405,403,694” [3]“ $ 2,048,359,754”

看起来不错,但是当我尝试减去它时


as.numeric(BoxOffice$OtherTerritoryGross) - as.numeric(w2)

我知道了 “二进制运算符的非数字参数”

我用gsub都删除了'$'

我想得到的是 [1]“ $ 410,311,965” [2]“ ~~” [3]“ ~~” [4]“ 1,648,359,754-1,732,359,754”或1,690,359,754

对于第[4]行,我不知道哪个更好。但是我需要对它们进行绘图。所以我认为我最好要求平均值。

0 个答案:

没有答案