使用R读取发票日志文件

时间:2015-03-07 20:45:32

标签: regex r

我对R来说相对很新,我正在尝试处理文本文件并从中提取一些信息。该文件已在下面的链接中上传。

https://onedrive.live.com/redir?resid=6CB94B1103A17EF6!105&authkey=!ADcPJYpyUXRQPzA&ithint=folder%2ctxt

Sample.txt是我正在处理的实际文件,它有一些测试发票详细信息(2张发票)。为了更好地理解文件,我创建了sample1.txt,它通过使用üü分隔符进行分离来解释文件的实际内容。

我想要提取的是描述,费率,数量和金额等信息以及商店ID。商店ID在文件中看起来像这样 - HAR0000000202。商店ID几乎在每条记录的末尾。我试图将这些细节提取到数据框中。

我期待的示例输出如下所示:

STOREID           Description                    Rate      Qty      Amount
HAR0000000202     LITTLE CHEF FROZEN SPRING ROLL 325.00   2.000    650.00
.
.
DEL0000000047     DETTOL ORIGIN                  60.00    1.000     60.00

我在R中使用grep,sub选项尝试了各种各样的事情,并认为我需要一些帮助。关于如何进行的任何输入都受到高度赞赏。

谢谢, Manjunath

0 个答案:

没有答案