找到最简单的正则表达式查询以匹配一组示例

时间:2016-02-16 19:59:31

标签: regex algorithm

在线服务Kimono提供供用户选择的GUI 页面元素然后使用所选元素创建一个匹配这些选择的正则表达式。然后可以使用该正则表达式在不同时间点从同一页面提取信息。该服务很有用,因为您不必自己生成正则表达式查询,而是提供一组示例查询匹配,然后将其编译为查询正则表达式。该公司被收购,因此该服务不再可用。

然而问题似乎是一个有趣的问题,所以我的问题是:什么算法能够将大型文档中的大量示例(正面和负面都需要)转换为正则表达式,然后在应用时将匹配那些例子?