我对R来说相对很新,我正在尝试处理文本文件并从中提取一些信息。该文件已在下面的链接中上传。
Sample.txt是我正在处理的实际文件,它有一些测试发票详细信息(2张发票)。为了更好地理解文件,我创建了sample1.txt,它通过使用üü分隔符进行分离来解释文件的实际内容。
我想要提取的是描述,费率,数量和金额等信息以及商店ID。商店ID在文件中看起来像这样 - HAR0000000202。商店ID几乎在每条记录的末尾。我试图将这些细节提取到数据框中。
我期待的示例输出如下所示:
STOREID Description Rate Qty Amount
HAR0000000202 LITTLE CHEF FROZEN SPRING ROLL 325.00 2.000 650.00
.
.
DEL0000000047 DETTOL ORIGIN 60.00 1.000 60.00
我在R中使用grep,sub选项尝试了各种各样的事情,并认为我需要一些帮助。关于如何进行的任何输入都受到高度赞赏。
谢谢, Manjunath