我有1000条(例如)记录的客户支持说明条目。
这些笔记中的每一个(长度为25个字符到500个字符)已由用户输入系统(用户将有多个由他们创建的笔记),我希望能够生成相当于通过分析文本来获得“语法KPI”。
我想避免对它们进行拼写检查,而是考虑基本语法的一致性,如大写字母和标点符号(如果可能,请使用正确的标点符号)。包括每个音符的详细程度以考虑所述'KPI'的输出也将是一个有趣的转折。
如果不沉迷于编程语言,那么创建不是100%准确表示的最有效方式/方法是什么,但足以在这些用户提交的注释中看到语法的异常值?
我没有这样的经历。
由于
答案 0 :(得分:1)
Python软件基金会主任的演示文稿实际上是从正式文件(专利许可证)中提取语义:
本文介绍了从书面文本中提取情绪的技术: