为文本中的数字创建分档

时间:2017-08-15 20:10:06

标签: r categories

我正在尝试为某些错误消息创建关联规则。但是因为许多错误在文本中都有数字测量,所以它们读入64k唯一错误,实际上它有大约200个独特的错误消息。我想将数值放入类别(10到15个bin)中,以使数据更易于管理。但我不想只编辑数字的错误的文本部分。

示例错误:

1:错误。伏特0.025,系统故障支持22%

2:错误。伏特0.0015,辅助系统故障支持53%

3:系统监视器。 bal 882单位。交叉是-1.8

期望的输出( 1:错误。伏特1,系统故障支持50%

2:错误。伏特1,辅助系统故障支持50%

3:系统监视器。 bal 1000单位。交叉是-1

我试图使用gsub,但遇到了创建垃圾箱的问题,还有一个很多的gsubs。     y< - gsub(" \ d \。\ d \ d"," 1",数据)

关于如何仅为错误消息的数字部分创建垃圾箱而不影响文本的任何想法?我对垃圾箱的数量不是很挑剔。

1 个答案:

答案 0 :(得分:0)

我在理解这方面有点麻烦,但这就是我的想法。

使用分配给字符的变量,可以很容易地使用粘贴将数字放在错误消息中的文本旁边。

提示:如果你库(tcltk)你也可以向屏幕发送错误弹出窗口,。

这是基本想法......

library(tcltk)
library(tcltk2)

errornumber=4

tkmessageBox(message=(paste("Error:",errornumber, 
sep=' ')),icon="warning") 

这允许您在弹出警告时将任何数字和字符放在一起。

适用于你......

library(tcltk)
library(tcltk2)

if(volt>0 & volt<1){

error=1

tkmessageBox(message=(paste("Error:",error, 
sep=' ')),icon="warning") 

} else if (volt>1.1 & volt<5.5){

error=5.5

tkmessageBox(message=(paste("Error:",error, 
sep=' ')),icon="warning") 
}

希望这在某种程度上有所帮助,再次不完全确定你的追求是什么? 您可以在粘贴部分添加任何数字或字符串。

编辑: 我为您重新创建了错误消息#1,您需要根据您的程序和条件分配正确的变量

library(tcltk)
library(tcltk2)

#"Variables"
voltread=0.025
percentread=22

tkmessageBox(message=(paste("error. volt",voltread,"system failure sup"
,percentread,"percent",sep=' ')),icon="error")