生成数百个段落的语法分析

时间:2012-02-15 14:44:04

标签: parsing text grammar analysis

我有1000条(例如)记录的客户支持说明条目。

这些笔记中的每一个(长度为25个字符到500个字符)已由用户输入系统(用户将有多个由他们创建的笔记),我希望能够生成相当于通过分析文本来获得“语法KPI”。

我想避免对它们进行拼写检查,而是考虑基本语法的一致性,如大写字母和标点符号(如果可能,请使用正确的标点符号)。包括每个音符的详细程度以考虑所述'KPI'的输出也将是一个有趣的转折。

如果不沉迷于编程语言,那么创建不是100%准确表示的最有效方式/方法是什么,但足以在这些用户提交的注释中看到语法的异常值?

我没有这样的经历。

由于

1 个答案:

答案 0 :(得分:1)

Python软件基金会主任的演示文稿实际上是从正式文件(专利许可证)中提取语义:

  

http://vimeo.com/53058803

本文介绍了从书面文本中提取情绪的技术:

  

http://goo.gl/wY9sW