分析文本以查找模式和有用信息

时间:2013-09-20 06:26:31

标签: python nlp

提供一些上下文:应用程序中的问题记录在Excel工作表中,该工作表中的一列包含用户(提出问题的人)与解决团队成员之间的电子邮件通信。还有许多其他列包含其他有用的信息。我的工作是从商业数据中找到有用的见解。

  1. 找出那是什么类型的问题?例如这是对用户或访问问题等的培训问题。这将意味着我分析邮件文本并通过某种方式找出问题的类型。
  2. 一个问题发生了多少次电子邮件对话?
  3. 这是重复问题吗?
  4. 还有其他简单的统计问题,例如每周有多少问题......
  5. 我读到使用Python的NLP可以解决我的问题。我也同样看过Rapidminer。

    现在我的问题是 一个。 “我是否走在正确的轨道上?,NLP(自然语言处理)是解决这些问题的方法吗?” 湾如果是,那么如何开始..我已经开始阅读有关使用Python的NLP的书籍,但这是巨大的,我应该专注于哪些特定领域并开始我的分析? C。 Rapidminer工具如何?它可以回答所有这些问题吗?数据量不是太大(可能是100000行)......看起来很容易在Rapidminer中构建一个进程,因此从它开始......

    感谢任何建议!!!

1 个答案:

答案 0 :(得分:0)

尝试使用 xlrd Python模块来阅读和处理Excel工作表。 我认为使用此模块的适当实现是解决问题的简单方法。