我正尝试通过减去减去其他地区的净预算 https://en.wikipedia.org/wiki/List_of_Marvel_Cinematic_Universe_films#Critical_response 票房表现
如果我不是初学者,我宁愿不要使用图书馆
有问题。其他地区的毛额和预算列中的“ $”。 预算中甚至有“百万”。
我试图用gsub摆脱单词“ million”和“ $” 并使其成为数字。
BoxOffice是“票房表现”表
w=gsub("\\s","",BoxOffice$Budget)
w1=gsub("million",",000,000",w)
w2=gsub("([.])(?:\\d{1})","",w1)
我有
[1]“ $ 109,000,000” [2]“ $ 162,000,000”
[3]“ $ 365,000,000” [3]“ $ 316–400,000,000”
BoxOffice $ OtherTerritoryGross
[1] $ 519,311,965“ [2]” $ 622,674,139“
[3]“ $ 1,405,403,694” [3]“ $ 2,048,359,754”
看起来不错,但是当我尝试减去它时
as.numeric(BoxOffice$OtherTerritoryGross) - as.numeric(w2)
我知道了 “二进制运算符的非数字参数”
我用gsub都删除了'$'
我想得到的是 [1]“ $ 410,311,965” [2]“ ~~” [3]“ ~~” [4]“ 1,648,359,754-1,732,359,754”或1,690,359,754
对于第[4]行,我不知道哪个更好。但是我需要对它们进行绘图。所以我认为我最好要求平均值。