应用错误收集

对文档内的单词进行分类

时间：2016-06-02 13:23:16

标签： machine-learning text-classification

我面临的问题是：我想阅读一个文档，获取该文档的原始字符串，并对信息进行分类。例如，我想确定字符串何时是“名称”，或者“日期”以及其他一些有用的信息。

是否可以使用机器学习来做到这一点？我该如何处理这个问题？

这里最难的问题是我不是要对文档本身进行分类，而是对文档中的String信息进行分类。

1 个答案:

答案 0 :(得分：2)

所以关于你如何看待你的问题。我认为您的问题可以表述为实体提取/识别问题，您可以在其中拥有一个文档，并希望在文本中识别特定实体（实体可能是人，日期等）。看看条件随机字段及其应用程序到命名实体识别（简称NER），因为有一些库和＆amp;工具已经实施。

例如，请查看StanfordNER。

相关问题

将英语单词分为罕见和常见

如何标记（单词）将标点符号分类为空格

更新文档内部和文档内部的文档

在Mongodb文档中找到n个单词

用重叠的单词分类句子

对文档分类中的“不适用”类别进行分类

对文档内的单词进行分类

使用R在单词中对相同模式进行分类

在大文件中对否定词和肯定词进行分类？

Python机器学习对句子中的单词进行分类

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？