nltk程序太慢了

时间:2018-03-22 18:45:40

标签: python nltk

我(部分)使用Python开发了一个程序,它使用NLTK和其他库来处理整本书。现在,问题是该程序在一本在线词典中查找书中每个单词的词源,因此需要花费太多时间来处理所有内容。

有人知道如何解决这个问题吗?或者,如果有更快的方法来查找单词的词源(不是定义)而不是废弃网页?

1 个答案:

答案 0 :(得分:0)

我不确定我到底知道你想做什么,但听起来好像你在迭代大数据集时遇到了问题。在这种情况下,在任何情况下,您希望使用大型数据集的对象进行打印(或实际执行任何操作),您应该使用generators,它们是运行时迭代器,它动态迭代可迭代对象因此适合于检查非常大的数据集。你可以做的事情可能是这样的:

.plat {
  background-color: grey;
  width: 20%;
  border: 3px solid red;
  margin-left: -0.5%;
}

.duck {
  background-color: blue;
  color: yellow;
  border: solid 3px red;
  margin-left: 20%;
  width: 20%;
}

.bill {
  background-color: green;
  width: 20%;
  margin-left: 40%;
  border: solid 3px red;
}

.dan {
  background-color: yellow;
  border: 3px solid red;
  width: 20%;
  margin-left: 60%;
  text-align: center;
}

p {
  line-height: 3px;
}

.five {
  background-color: purple;
  width: 20%;
  border: red solid 3px;
  margin-left: 80%;
}

.six {
  background-color: black;
  color: white;
  border: 3px solid red;
  width: 20%;
  position: absolute;
  top: 0;
  right: 0;
}

.seven {
  background-color: blue;
  border: 3px solid red;
}