使用gff文件创建一个字符数组

时间:2013-11-09 15:09:47

标签: arrays matlab

有人可以帮我创建一个包含这类数据的“字符数组”: ftp://ftp.ncbi.nih.gov/genomes/Bacteria/Escherichia_coli_ATCC_8739_uid58783/NC_010468.gff

我们的合作者的指示:

可以通过输入gff = {}将gff文件复制并粘贴到字符数组中,然后复制并“粘贴Excel数据”

但我可以以某种方式将其保存为单元格数组,因此下游脚本无法正常运行。

其他信息 我需要在.m脚本(我从别人那里得到)中使用.gff文件来解析我的序列。 以下是我认为与我的问题相关的脚本部分:

genelist=gff(:,3);
starts=gff(:,4);
ends=gff(:,5);
names=gff(:,9);
genelogical=strncmp('gene',genelist,4);

因此我希望9列包含以下信息: 1. seqID; 来源; 3.类型; 4和5。开始和结束; 6.得分; 7. strand; 8.阶段 9.属性

此外,当我将单元格数组保存为“单元格”时,并尝试通过键入

将其转换为字符数组
char(cell)

我收到此错误消息: 单元格元素必须是字符数组 所以猜猜这​​不起作用......

编辑

任何人都有任何想法?

谢谢, 乔伊斯

1 个答案:

答案 0 :(得分:0)

您给出的说明是指可从“变量”编辑器访问的以下上下文菜单项:

enter image description here

首先,在命令行gff={};运行以生成一个空的cell数组。然后双击“工作区”选项卡中的gff变量以获取上述编辑器窗口。单击表格左上角的方形regino选择所有单元格,然后右键单击以显示所显示的菜单,并粘贴数据。如果粘贴工作正常(实际上可能需要几分钟 - 检查CPU使用率),您应该得到以下结果:

enter image description here

然后你发布的命令工作。 strncmp明确表示需要单元格数组。