机器学习用于从一堆文件中提取文本

时间:2019-05-28 15:18:01

标签: machine-learning .net-core text-processing information-extraction ml.net

在某些情况下,我有很多规范文件,并且需要从中提取特定类型的信息(一段文本)。无法通过RegExp解决方案完成此操作,因为文件非常不规则(可以完成,但是在创建RegExp字符串方面付出了很大的努力,而我不想这样做)。我的第一个想法是使用来自机器学习分支的信息提取(我有很多示例可以用来学习模型)。我的主要语言是C#,所以我检查了ML.NET,但似乎库中没有此类功能。所以我的问题是,是否有任何图书馆可以让我实现目标?还是有人有想法在不编写复杂的RegExp的情况下自动执行此类任务?

0 个答案:

没有答案