我有一个大的核苷酸序列数据集(简单的长串),它转换成一个充满字符的104 * 13440矩阵。我的项目迫使我在探索所有可能的状态/机会时进行退化的字符串匹配(i-e没有花哨的启发式和/或筛选)。由于数据集太大,因此逐个字符地手动检查所有单词元组非常令人沮丧且计算复杂。
与简单的字符比较相比,将字符转换为相应的二进制文件,并使用按位比较实现次要神经网络可以节省处理时间和内存消耗吗?
我正在使用python 3。
忘记提及,单词元组重叠,大小范围从15-25个字符/元组,所以你可以看到困境
答案 0 :(得分:0)
将字符转换为 各自的二进制,并实现 使用按位的小神经网络 比较节省了处理时间和 与内存消耗相比 简单的字符比较?
没有。引入像神经网络这样复杂的东西来解决字符串比较会变得更长。
如果你想让你的代码更快,我建议你把它发布在http://codereview.stackexchange.com上,那里的人会告诉你你可以做些什么来加快它。