用c ++读取ped文件。

时间:2013-07-12 16:55:32

标签: c++ libraries readfile

是否有任何C ++库可以读取ped文件(http://pngu.mgh.harvard.edu/~purcell/plink/data.shtml#ped)?

2 个答案:

答案 0 :(得分:3)

从PED转换为BED文件

To convert myPlinkTextData.ped and myPlinkTextData.map in Plink binary format, use Plink as follows:
plink --file myPlinkTextData --make-bed --out myPlinkBinaryData 

来源:http://www.shapeit.fr/pages/m02_formats/pedmap.html

用于阅读BED文件的库

https://github.com/fadern/libplinkio(来自vinash85评论)

阅读PED文件似乎在路线图(1.0)上,但我找不到关于何时或是否会达到1.0的任何信息。

编写自己的PED文件库

plink命令行工具的源代码可用:

http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml

因此,如果您需要一个可以完成所有操作的单个库,您可以将其中的一部分和libplinkio的部分内容合并,然后将它们合并。

答案 1 :(得分:0)

可以通过https://github.com/fadern/libplinkio读取ped文件。但它以二进制格式读取了ped文件。当文件转换为转置二进制格式时也是如此。通常以ped格式,基因型被编码为A,G,C,T或1,2,3,4。这表示原始序列。 libplinkio库对主要/次要/缺失等位基因使用0/1 / NA编码。这可以通过使用plink http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml来实现。 plink --make-bed ...