void printEncodingCodonSequences (
char aminoAcid1,
char aminoAcid2,
char aminoAcid3,
char aminoAcid4,
char aminoAcid5
);
鉴于由5个氨基酸符号组成的蛋白质片段作为输入,打印出(在屏幕上)所有 不同的密码子序列(每行一个序列)转化为该蛋白质片段。输入可以在 任何情况下,如果任何输入无效,该函数应在一行中打印“?”。
这是一个例子: 蛋白质片段MWQWH可以通过这四个密码子序列翻译,因此输入:'M','W','Q','W','H'(或'm','W','q' ,'W','H'),该函数应打印以下内容:
ATGTGGCAATGGCAT
ATGTGGCAGTGGCAT
ATGTGGCAATGGCAC
ATGTGGCAGTGGCAC
我不希望你回答这一切,只是提示如何做到这一点。对于此任务,不允许任何字符串或任何容器类!我被告知必须使用带数组的嵌套循环。
在这个项目中,蛋白质片段由5个氨基酸组成(输入作为它们的符号),如果氨基酸含有超过1个密码子,它将以新的方式打印。
答案 0 :(得分:1)
鉴于您应该使用循环来实现这一点:这可以使用五个嵌套循环进行编程。在每个循环中,您将通过一个氨基酸符号的所有可能的翻译密码子三联体。这是基本的想法。
以下伪代码可以作为开头:
for each translating codon triplet codon1 for aminoAcid1:
for each translating codon triplet codon2 for aminoAcid2:
for each translating codon triplet codon3 for aminoAcid3:
for each translating codon triplet codon4 for aminoAcid4:
for each translating codon triplet codon5 for aminoAcid5:
print codon1 + codon2 + codon3 + codon4 + codon5
end for
end for
end for
end for
end for
您现在要做的是使用原始数组在C ++中编写这些循环。您事先知道每个氨基酸符号哪个(以及多少个)密码子三联体是我们必须在循环中完成的候选者。将它们存储为常量数组,并使用函数参数中提供的氨基酸在循环中访问此数组。
由于您不应该使用字符串和容器,因此您不得不使用C字符串(char数组)和原始数组来对C ++中的表进行编码。伪代码(codon1
... codon5
)中的变量应该只是const char*
(C字符串),并且可以使用cout
或{{ 1}}。
上面的表格可以写成如下数组。请注意,我将表的每一行都写成一个C字符串,该字符串以编码氨基酸符号的字母开头,然后是三元组的“列表”。所有这些三元组都以0结尾(这使得它们可以指向它们作为C字符串)。要遍历三元组,您必须找到空终止字符并将此指针递增1。如果此指针为非null,则会有另一个三元组出现。如果它为null(请注意,在这些行的末尾,将添加另一个null,因为它被添加到每个字符串文字中),这是最后一个三元组。
printf
使用从该表中找到正确行的实用程序函数,然后可以将循环写为(此处为第一个酸符号):
const char *codons[] = {
"AGCT\0GCC\0GCA\0GCG\0",
"RCGT\0CGC\0CGA\0CGG\0AGA\0AGG\0",
// ...
"*TAA\0TGA\0TAG\0"
};
在这个循环中,初始化使用效用函数(见下文),它返回表中的行,但不包括第一个字符(因此它指向给定酸的第一个密码子三联体)。递增操作只是将此指针增加C字符串长度(这将导致for(const char *codon1 = codonRow(aminoAcid1); codon1 += strlen(codon1); codon1 != NULL) {
...
}
指向下一个空终止字符之后。如果这是null,我们就完成了。
好的一点是,在这个循环的每次迭代中,codon1
指向一个C字符串(好吧,它指向上面的数组的字符串文字的中间)并且将被适当地终止。因此,打印codon1
只会打印3个字符。
这是在上面的循环中使用的实用程序函数,它在表中搜索特定字符并返回此行:
codon1
答案 1 :(得分:0)
好的,我会忽略你被告知究竟有多少密码子,并描述一个更通用的解决方案。
您知道每个密码子只能翻译成3个字符,因此您可以预先计算所需缓冲区的大小。在您的情况下,您当然可以使用固定大小的缓冲区。请记住为终止NUL字符留出空间。此输出缓冲区将是一个数组。看起来像这样:
void printEncodingCodonSequences(
char aminoAcid1,
char aminoAcid2,
char aminoAcid3,
char aminoAcid4,
char aminoAcid5 )
{
char outputBuffer[16]; // 5 codons, exactly
char codons[] = { aminoAcid1, aminoAcid2, aminoAcid3, aminoAcid4, aminoAcid5 };
findCodonEncodingCombinations(outputBuffer, outputBuffer, codons, 5);
}
接下来,您需要将每个密码子映射到所有可能的序列,并对您给出的许多密码子重复此操作。因为这是一个组合问题,所以它非常适合递归。该函数接受第一个密码子,并迭代不同的可能编码。在每次迭代中,它再次调用自己来处理剩余的密码子。
int findCodonEncodingCombinations( char* outputBuffer, char* outputPos, char* codons, int remaining )
{
if (remaining == 0) {
*outputPos = 0;
puts(outputBuffer);
puts("\n");
return 1;
}
int combinations = 0;
switch (*codon) {
case 'D': // GAT, GAC
case 'd':
outputPos[0] = 'G';
outputPos[1] = 'A';
outputPos[2] = 'T';
combinations += findCodonEncodingCombinations(outputBuffer, outputPos + 3, codons + 1, remaining - 1);
outputPos[2] = 'C';
combinations += findCodonEncodingCombinations(outputBuffer, outputPos + 3, codons + 1, remaining - 1);
break;
}
return combinations;
}
实际上,循环对此问题并不是特别有帮助。但是,您可以使用一个来验证所有输入是否有效,例如:
void printEncodingCodonSequences(
char aminoAcid1,
char aminoAcid2,
char aminoAcid3,
char aminoAcid4,
char aminoAcid5 )
{
char outputBuffer[16]; // 5 codons, exactly
char codons[] = { aminoAcid1, aminoAcid2, aminoAcid3, aminoAcid4, aminoAcid5 };
if (!validateCodons(codons, 5)) return;
findCodonEncodingCombinations(outputBuffer, outputBuffer, codons, 5);
}
bool validateCodons( char* codons, int count )
{
while (count--) { // it's a loop :)
switch (*codons++) {
case 'd':
case 'D':
//...
break;
default: // unrecognized codon
puts("?\n");
return false;
}
}
return true;
}
显然,你需要填写许多其他密码子映射。
答案 2 :(得分:0)
嗯,您想将氨基酸序列翻译成密码子序列。所以你需要的第一件事是将氨基酸代码翻译成密码子的表格。由于您不允许使用类,因此表表示数组。由于每个氨基酸可能转化为多个密码子,因此需要一系列阵列:
#define MAX_CODONS 6 /* maximum number of codons for one amino acid */
char *AminoAcidCodons[26][MAX_CODONS+1] = {
/* A */ { "GCT", "GCC", "GCA", "GCT", 0 },
/* B */ { 0 },
/* C */ { "TGT", "TGC", 0 },
:
/* Y */ { "TAT", "TAC", 0 },
/* Z */ { 0 },
};
现在,您可以使用循环将大写字母转换为密码组:
for (i = 0; AminoAcidCodons[aminoAcid1 - 'A'][i]; i++) {
/* AminoAcidCodons[aminoAcid1-'A'][i] is one of the codons that AminoAcid1 can be encoded as */
:
要获得5种氨基酸的所有可能组合,您需要5个嵌套循环。要处理小写字母,您需要将它们翻译成大写字母。您还需要处理无效代码(非字母和字母,没有相应的密码子)。函数isalpha
和toupper
可以在这里提供帮助。