用字符串将文本转换成表格格式

时间:2019-05-23 02:39:34

标签: r string stringi

我正在尝试将从某些图像中提取的文本转换为R中的表格格式。

我一直在尝试使用stringi包将文本分成几部分,但是我在确定正确的模式时遇到了麻烦。文本将空格与数字和文本结合在一起,以使分隔符不一致。

 >data$V1[c(15,16,17,19)]
[1] "FECHA SUCURSAL DESCRIPCION N|| DCTO CHEQUES Y OTROS DEPOSITOS Y OTROS SALDO"
[2] "CARGOS ABONOS"  
[3] "02/05 Agustinas Egreso por Compra de Divisas 4.841 143.340"                  
[4] "03/05 Agustinas Traspaso Internet desde LCr®dit0 5.000"                      

我已经处理过这样的表情

stri_split(data$V1[18], regex ="\\s++")

我正在寻找的结果在data.frame中是这样的:

|------|---------|--------------|------|---------------|-----------------|-------|
|FECHA |SUCURSAL |DESCRIPCION   |N DCTO|CHEQUES Y OTROS|DEPOSITOS Y OTROS|SALDO|
|------|---------|--------------|------|---------------|-----------------|-------|

|------|---------|--------------|------|CARGOS         |ABONOS-----------|-------|
|------|---------|--------------|------|---------------|-----------------|-------|

|02/05 |Agustinas| Egreso por...|------|4.841----------|-----------------|143.340|
|------|---------|--------------|------|---------------|-----------------|-------|
|03/05 |Agustinas|Traspaso .....|------|---------------|5.000------------|-------|
|------|---------|--------------|------|---------------|-----------------|-------|

0 个答案:

没有答案