有人可以帮我创建一个包含这类数据的“字符数组”: ftp://ftp.ncbi.nih.gov/genomes/Bacteria/Escherichia_coli_ATCC_8739_uid58783/NC_010468.gff
我们的合作者的指示:
可以通过输入gff = {}将gff文件复制并粘贴到字符数组中,然后复制并“粘贴Excel数据”
但我可以以某种方式将其保存为单元格数组,因此下游脚本无法正常运行。
其他信息 我需要在.m脚本(我从别人那里得到)中使用.gff文件来解析我的序列。 以下是我认为与我的问题相关的脚本部分:
genelist=gff(:,3);
starts=gff(:,4);
ends=gff(:,5);
names=gff(:,9);
genelogical=strncmp('gene',genelist,4);
因此我希望9列包含以下信息: 1. seqID; 来源; 3.类型; 4和5。开始和结束; 6.得分; 7. strand; 8.阶段 9.属性
此外,当我将单元格数组保存为“单元格”时,并尝试通过键入
将其转换为字符数组char(cell)
我收到此错误消息: 单元格元素必须是字符数组 所以猜猜这不起作用......
编辑
任何人都有任何想法?
谢谢, 乔伊斯
答案 0 :(得分:0)
您给出的说明是指可从“变量”编辑器访问的以下上下文菜单项:
首先,在命令行gff={};
运行以生成一个空的cell
数组。然后双击“工作区”选项卡中的gff
变量以获取上述编辑器窗口。单击表格左上角的方形regino选择所有单元格,然后右键单击以显示所显示的菜单,并粘贴数据。如果粘贴工作正常(实际上可能需要几分钟 - 检查CPU使用率),您应该得到以下结果:
然后你发布的命令工作。 strncmp
明确表示需要单元格数组。