Gensim / Python - 将文档ID映射到文档,在sorted()中

时间:2017-03-20 20:12:19

标签: python lambda gensim

想要使用gensim获取最相关文档(到LDA模型)的可识别列表,即与下面链接中的OP完全相同

https://groups.google.com/forum/#!topic/gensim/lHi2MhoNDsY有相关的答案,但不知道如何让它发挥作用:

tops = sorted(zip(my_ids, all_documents)), reverse=True, \
key=lambda my_id, doc: abs(dict(doc).get(topic_number, 0.0))) 

除了似乎位于错误位置的括号外,两个主要问题是:

  1. 如何生成my_ids(这些是映射到文档还是单词)?像my_ids = [my_id for my_id in range(len(all_documents))]之类的东西 抛出
  2. lambda()缺少1个必需的位置参数:' doc'

    1. 出现此错误的原因是什么,应该如何理解key=lambda my_id, doc: abs(dict(doc).get(topic_number, 0.0)))?如果提供了正确的abs(dict(doc).get(topic_number, 0.0)),或者是否需要其他修复,是否会根据需要解压缩my_ids? 还看了python 3 map/lambda method with 2 inputs,但到目前为止还没有开始。

0 个答案:

没有答案