我需要从pentaho读取.vcf.gz文件。 我可以从“内容”选项卡设置“压缩”到“GZ”中的“文本文件输入”中读取它。
- 首先,我需要跳过标题(基本上每行#开头)。
-Second我需要插入一个新列,在每行插入文件名。
E.g。
我的档案是:
#header
#header
#header
# chr pos ref alt
chr1 3 A A
我想要的是:
chr1 3 A A id_001 (Taken readeing file name)
我怎样才能做到这一点?