Python - 查询文本挖掘&索引

时间:2016-03-14 16:54:29

标签: python text-mining

python新手并请求某人分享代码段 -

我有一个包含2个变量的表 - 事故,文字描述

我想在python中创建一个函数(或函数组合)来创建2个指标 -

  1. 如果下列词语中至少有一个(类型1字) - ('The','Metabolism','Rate of','The Man buy')存在于指标中,则指标值为1描述(自由流动文本),例如,'人们认为鸟类的新陈代谢率高于动物。然而,事实并非如此。'

  2. 如果上述条件1中提到的条件为真,则第二个指标将取值1. 如果以下中没有任何单词 (否定)单词) - ('不','完全没有','不是1','然而')在同一描述中与上述第1点中提到的1类单词的给定距离+ x或-x相同。 / p>

  3. 上面给出的单词和句子只是为了理解。实质上,会有这些信息片出现 -

    1. 包含文本说明(自由流文本)和名称(ID)
    2. 的表
    3. 类型1字词列表
    4. 否定词汇列表
    5. 给定距离(+ x / -x),其中不应出现上述第3点中的否定词
    6. 我正在使用Python 2.7版。如果有人可以发布相同的Python代码,将会很有帮助。

      朱小伟

0 个答案:

没有答案