从章节中检索单词

时间:2015-03-13 01:22:34

标签: python

我有一个大约200,000个单词的列表,每个单词有大约10个数字特征。一些标题将200,000个单词拆分为500个大小的块(例如,"第x章")。我想编写一个除了提示用户输入一个字符串然后在200,000个单词中找到该字符串的脚本(该单词可能在多个块中,但在每个块中只能找到一次)并返回名称在该章节下,字符串按每个章节中该词的数字特征的值排序。例如,假设单词" 12"出现在3章中,我想按功能1对其进行排序,功能1分别在第10章,第14章和第9章中分别为50,30,2。我想要o / p:

Chapter 10, 50
Chapter 14, 30
Chapter 9, 2

在我开始编写脚本之前,我想确保这对Python来说是一个合理的任务。换句话说,执行时间是以秒为单位,以分钟为单位吗?如果我有500,000个单词,它仍然可行吗?我不想让用户等待。

1 个答案:

答案 0 :(得分:2)

棒球场时间:

假设您的所有单词都是10个8位字符串字符(因此,每个80位),您需要将输入字符串与所有200,000个字符串进行比较。那是大约1600万比特运算。如果您的处理器以1 GHz运行代码,则将在0.016秒内完成。

即使我低估了这项任务需要100倍的操作次数,也只需要大约1秒的时间来执行。