是否有任何C ++库可以读取ped文件(http://pngu.mgh.harvard.edu/~purcell/plink/data.shtml#ped)?
答案 0 :(得分:3)
To convert myPlinkTextData.ped and myPlinkTextData.map in Plink binary format, use Plink as follows:
plink --file myPlinkTextData --make-bed --out myPlinkBinaryData
来源:http://www.shapeit.fr/pages/m02_formats/pedmap.html
https://github.com/fadern/libplinkio(来自vinash85评论)
阅读PED文件似乎在路线图(1.0)上,但我找不到关于何时或是否会达到1.0的任何信息。
plink
命令行工具的源代码可用:
http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml
因此,如果您需要一个可以完成所有操作的单个库,您可以将其中的一部分和libplinkio
的部分内容合并,然后将它们合并。
答案 1 :(得分:0)
可以通过https://github.com/fadern/libplinkio读取ped文件。但它以二进制格式读取了ped文件。当文件转换为转置二进制格式时也是如此。通常以ped格式,基因型被编码为A,G,C,T或1,2,3,4。这表示原始序列。 libplinkio库对主要/次要/缺失等位基因使用0/1 / NA编码。这可以通过使用plink http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml来实现。 plink --make-bed ...