¿如何在R中创建Debian控制文件或描述文件,特别是在BSgenome中伪造基因组软件包的种子文件?

时间:2019-09-09 13:22:10

标签: r

我试图在R中使用函数“ forgeBSgenomeDataPkg”在Bsgenome中创建基因组程序包,因此我需要先创建一个种子文件,该文件是Debian Control File或R中的描述格式。 / p>

我只需要针对个人项目这样做。

我所做的是获取BSgenom的exdata上可用的种子文件,并手动更改数据。

............ SEED.NCBI1种子:

包装:BSgenome.Lmajor.NCBI.NCBI1

标题:全基因组序列菌株Friedlin

描述:L.major的完整基因组序列。

版本:NC_007287.2

有机体:利什曼原虫病专业

常用名:利什曼原虫

提供者:NCBI

provider_version:NCBI1

发布日期:2017年6月

release_name:Friedline基因组版本

source_url:https://www.ncbi.nlm.nih.gov

organism_biocview:大利什曼原虫

BSgenomeObjname:Lmajor

seqnames:paste(“ Chr”,c(1:36),sep =“”)

SrcDataFiles:https://www.ncbi.nlm.nih.gov/genome/?term=Leishmania+major

Pkg示例:基因组$ Chr1#与基因组[[“” Chr1“]]

seqs_srcdir:C:/用户/ LENOVO /文档

  

forgeBSgenomeDataPkg(“ C:/Users/LENOVO/Documents/SEED.NCBI1-seed”)

forgeBSgenomeDataPkg(“ C:/Users/LENOVO/Documents/SEED.NCBI1-seed”)中的错误:   种子文件中缺少'seqs_srcdir'参数,并且'seqs_srcdir'字段丢失 另外:警告消息: 在readLines(infile,n = 25000L)中:   在“ C:/Users/LENOVO/Documents/SEED.NCBI1-seed”上找到不完整的最后一行

我不为什么,但是当我只更改seqs_srcdir值时,该函数运行良好。但是,当我更改所有信息时,如上所示,它不起作用。

我是一位生物学家,在使用R进行生物信息学方面的技能真的很差。实际上,我不得不花很多时间来了解那些无法弄清问题原因的小插曲。

  

forgeBSgenomeDataPkg(“ C:/Users/LENOVO/Documents/SEED.NCBI1-seed”)

这是正确的结果,当我使用Bsgenome存储库中预先可用的种子文件并更改seqs_srcdir值时,我得到了它

包装:BSgenome.Pcruentum.TAIR.TAIR9 发言题目:卟啉卟啉菌(TAIR9)的全基因组序列 说明:TAIR(TAIR9基因组发布)提供并存储在Biostrings对象中的十字花卟啉菌的完整基因组序列。注意,TAIR10是基于与TAIR9相同的基因组组装的“注释发行版”。 版本:1.4.2 生物:卟啉卟啉 common_name:紫菜 提供者:TAIR provider_version:TAIR9 发布日期:2009年6月9日 release_name:TAIR9基因组版本 source_url:http://cyanophora.rutgers.edu/porphyridium/Porphyridium_genome.fasta/ organ_biocview:卟啉卟啉 BSgenome对象名称:Pcruentum seqnames:paste(“ Chr”,c(1:3),sep =“”) SrcDataFiles:http://cyanophora.rutgers.edu/porphyridium/Porphyridium_genome.fasta/TAIR9_chr_all.fas PkgExamples:基因组$ Chr1#与基因组相同[[“ Chr1”]] seqs_srcdir:C:/ Users / LENOVO / Documents

  

forgeBSgenomeDataPkg(“ C:/Users/LENOVO/Documents/SEED.TAIR9-seed”)   在./BSgenome.Pcruentum.TAIR.TAIR9中创建包   从FASTA文件'C:/Users/LENOVO/Documents/Chr1.fa'加载'Chr1'序列...完成   从FASTA文件'C:/Users/LENOVO/Documents/Chr2.fa'中加载'Chr2'序列...完成   从FASTA文件'C:/Users/LENOVO/Documents/Chr3.fa'中加载'Chr3'序列...完成   将所有序列写入'./BSgenome.Pcruentum.TAIR.TAIR9/inst/extdata/single_sequences.2bit'...完成   build(pkg =“ BSgenome.Pcruentum.TAIR.TAIR9”)   警告:Rtools是构建R软件包所必需的,但当前尚未安装。

请从http://cran.r-project.org/bin/windows/Rtools/下载并安装Rtools 3.5。 √检查文件'C:\ Users \ LENOVO \ Documents \ BSgenome.Pcruentum.TAIR.TAIR9 / DESCRIPTION'(45.5s) -准备“ BSgenome.Pcruentum.TAIR.TAIR9” :( 8.8秒) √检查说明元信息(2.1s) -检查源文件中的LF行尾以及制作文件和Shell脚本(1.3s) -检查空目录或不需要的目录(878ms) -建立“ BSgenome.Pcruentum.TAIR.TAIR9_1.4.2.tar.gz”(1.1秒)

[1]“ C:/Users/LENOVO/Documents/BSgenome.Pcruentum.TAIR.TAIR9_1.4.2.tar.gz”

  

check(pkg =“ BSgenome.Pcruentum.TAIR.TAIR9”)   -建筑物----------------------------------- BSgenome.Pcruentum.TAIR.TAIR9-   设置环境变量:   * CFLAGS:-墙-学究   * CXXFLAGS:-Wall -pedantic

     

* CXX11FLAGS:-Wall -pedantic

警告:Rtools是构建R软件包所必需的,但当前尚未安装。

请从http://cran.r-project.org/bin/windows/Rtools/下载并安装Rtools 3.5。 √检查文件'C:\ Users \ LENOVO \ Documents \ BSgenome.Pcruentum.TAIR.TAIR9 / DESCRIPTION'(3.2s) -准备'BSgenome.Pcruentum.TAIR.TAIR9':(2.1s) √检查说明元信息(2.1s) -检查源文件中的LF行尾以及制作文件和Shell脚本(2.1s) -检查空目录或不需要的目录(1.7s) -建立“ BSgenome.Pcruentum.TAIR.TAIR9_1.4.2.tar.gz”(1.4秒)

-检查----------------------------------- BSgenome.Pcruentum.TAIR.TAIR9- 设置环境变量: * _R_CHECK_CRAN_INCOMING_REMOTE_:否 * _R_CHECK_CRAN_INCOMING_:否 * _R_CHECK_FORCE_SUGGESTS_:否 -R CMD检查--------------------------------------------- ------------------------ -使用日志目录'C:/Users/LENOVO/AppData/Local/Temp/RtmpaQrJUQ/BSgenome.Pcruentum.TAIR.TAIR9.Rcheck'(3.8s) -使用R版本3.6.1(2019-07-05)(1.2s) -使用平台:x86_64-w64-mingw32(64位)(943毫秒) -使用会话字符集:ISO8859-1(821毫秒) -使用选项'--no-manual --as-cran'(1.6s) √检查文件'BSgenome.Pcruentum.TAIR.TAIR9 / DESCRIPTION'(2.1s) -这是软件包'BSgenome.Pcruentum.TAIR.TAIR9'版本'1.4.2'(1.3s) √检查包名称空间信息(1.8s) √检查包依赖关系(2.5s) √检查这是否是源码包(1.8秒) √检查是否有名称空间(1.3s) √检查.dll和.exe文件(595ms) √检查隐藏的文件和目录(875毫秒) √检查可移植文件名(733ms) √检查序列化版本(650ms) |检查是否可以安装软件包“ BSgenome.Pcruentum.TAIR.TAIR9” ...

0 个答案:

没有答案