我试图在R中使用函数“ forgeBSgenomeDataPkg”在Bsgenome中创建基因组程序包,因此我需要先创建一个种子文件,该文件是Debian Control File或R中的描述格式。 / p>
我只需要针对个人项目这样做。
我所做的是获取BSgenom的exdata上可用的种子文件,并手动更改数据。
............ SEED.NCBI1种子:
包装:BSgenome.Lmajor.NCBI.NCBI1
标题:全基因组序列菌株Friedlin
描述:L.major的完整基因组序列。
版本:NC_007287.2
有机体:利什曼原虫病专业
常用名:利什曼原虫
提供者:NCBI
provider_version:NCBI1
发布日期:2017年6月
release_name:Friedline基因组版本
source_url:https://www.ncbi.nlm.nih.gov
organism_biocview:大利什曼原虫
BSgenomeObjname:Lmajor
seqnames:paste(“ Chr”,c(1:36),sep =“”)
SrcDataFiles:https://www.ncbi.nlm.nih.gov/genome/?term=Leishmania+major
Pkg示例:基因组$ Chr1#与基因组[[“” Chr1“]]
seqs_srcdir:C:/用户/ LENOVO /文档
forgeBSgenomeDataPkg(“ C:/Users/LENOVO/Documents/SEED.NCBI1-seed”)
forgeBSgenomeDataPkg(“ C:/Users/LENOVO/Documents/SEED.NCBI1-seed”)中的错误: 种子文件中缺少'seqs_srcdir'参数,并且'seqs_srcdir'字段丢失 另外:警告消息: 在readLines(infile,n = 25000L)中: 在“ C:/Users/LENOVO/Documents/SEED.NCBI1-seed”上找到不完整的最后一行
我不为什么,但是当我只更改seqs_srcdir值时,该函数运行良好。但是,当我更改所有信息时,如上所示,它不起作用。
我是一位生物学家,在使用R进行生物信息学方面的技能真的很差。实际上,我不得不花很多时间来了解那些无法弄清问题原因的小插曲。
forgeBSgenomeDataPkg(“ C:/Users/LENOVO/Documents/SEED.NCBI1-seed”)
这是正确的结果,当我使用Bsgenome存储库中预先可用的种子文件并更改seqs_srcdir值时,我得到了它
包装:BSgenome.Pcruentum.TAIR.TAIR9 发言题目:卟啉卟啉菌(TAIR9)的全基因组序列 说明:TAIR(TAIR9基因组发布)提供并存储在Biostrings对象中的十字花卟啉菌的完整基因组序列。注意,TAIR10是基于与TAIR9相同的基因组组装的“注释发行版”。 版本:1.4.2 生物:卟啉卟啉 common_name:紫菜 提供者:TAIR provider_version:TAIR9 发布日期:2009年6月9日 release_name:TAIR9基因组版本 source_url:http://cyanophora.rutgers.edu/porphyridium/Porphyridium_genome.fasta/ organ_biocview:卟啉卟啉 BSgenome对象名称:Pcruentum seqnames:paste(“ Chr”,c(1:3),sep =“”) SrcDataFiles:http://cyanophora.rutgers.edu/porphyridium/Porphyridium_genome.fasta/TAIR9_chr_all.fas PkgExamples:基因组$ Chr1#与基因组相同[[“ Chr1”]] seqs_srcdir:C:/ Users / LENOVO / Documents
forgeBSgenomeDataPkg(“ C:/Users/LENOVO/Documents/SEED.TAIR9-seed”) 在./BSgenome.Pcruentum.TAIR.TAIR9中创建包 从FASTA文件'C:/Users/LENOVO/Documents/Chr1.fa'加载'Chr1'序列...完成 从FASTA文件'C:/Users/LENOVO/Documents/Chr2.fa'中加载'Chr2'序列...完成 从FASTA文件'C:/Users/LENOVO/Documents/Chr3.fa'中加载'Chr3'序列...完成 将所有序列写入'./BSgenome.Pcruentum.TAIR.TAIR9/inst/extdata/single_sequences.2bit'...完成 build(pkg =“ BSgenome.Pcruentum.TAIR.TAIR9”) 警告:Rtools是构建R软件包所必需的,但当前尚未安装。
请从http://cran.r-project.org/bin/windows/Rtools/下载并安装Rtools 3.5。 √检查文件'C:\ Users \ LENOVO \ Documents \ BSgenome.Pcruentum.TAIR.TAIR9 / DESCRIPTION'(45.5s) -准备“ BSgenome.Pcruentum.TAIR.TAIR9” :( 8.8秒) √检查说明元信息(2.1s) -检查源文件中的LF行尾以及制作文件和Shell脚本(1.3s) -检查空目录或不需要的目录(878ms) -建立“ BSgenome.Pcruentum.TAIR.TAIR9_1.4.2.tar.gz”(1.1秒)
[1]“ C:/Users/LENOVO/Documents/BSgenome.Pcruentum.TAIR.TAIR9_1.4.2.tar.gz”
check(pkg =“ BSgenome.Pcruentum.TAIR.TAIR9”) -建筑物----------------------------------- BSgenome.Pcruentum.TAIR.TAIR9- 设置环境变量: * CFLAGS:-墙-学究 * CXXFLAGS:-Wall -pedantic
* CXX11FLAGS:-Wall -pedantic
警告:Rtools是构建R软件包所必需的,但当前尚未安装。
请从http://cran.r-project.org/bin/windows/Rtools/下载并安装Rtools 3.5。 √检查文件'C:\ Users \ LENOVO \ Documents \ BSgenome.Pcruentum.TAIR.TAIR9 / DESCRIPTION'(3.2s) -准备'BSgenome.Pcruentum.TAIR.TAIR9':(2.1s) √检查说明元信息(2.1s) -检查源文件中的LF行尾以及制作文件和Shell脚本(2.1s) -检查空目录或不需要的目录(1.7s) -建立“ BSgenome.Pcruentum.TAIR.TAIR9_1.4.2.tar.gz”(1.4秒)
-检查----------------------------------- BSgenome.Pcruentum.TAIR.TAIR9- 设置环境变量: * _R_CHECK_CRAN_INCOMING_REMOTE_:否 * _R_CHECK_CRAN_INCOMING_:否 * _R_CHECK_FORCE_SUGGESTS_:否 -R CMD检查--------------------------------------------- ------------------------ -使用日志目录'C:/Users/LENOVO/AppData/Local/Temp/RtmpaQrJUQ/BSgenome.Pcruentum.TAIR.TAIR9.Rcheck'(3.8s) -使用R版本3.6.1(2019-07-05)(1.2s) -使用平台:x86_64-w64-mingw32(64位)(943毫秒) -使用会话字符集:ISO8859-1(821毫秒) -使用选项'--no-manual --as-cran'(1.6s) √检查文件'BSgenome.Pcruentum.TAIR.TAIR9 / DESCRIPTION'(2.1s) -这是软件包'BSgenome.Pcruentum.TAIR.TAIR9'版本'1.4.2'(1.3s) √检查包名称空间信息(1.8s) √检查包依赖关系(2.5s) √检查这是否是源码包(1.8秒) √检查是否有名称空间(1.3s) √检查.dll和.exe文件(595ms) √检查隐藏的文件和目录(875毫秒) √检查可移植文件名(733ms) √检查序列化版本(650ms) |检查是否可以安装软件包“ BSgenome.Pcruentum.TAIR.TAIR9” ...