从文本中提取结构化数据

时间:2020-03-06 11:32:08

标签: nlp semantic-analysis amazon-comprehend

是否有可以从纯文本中提取结构化数据的可用工具/库(最好是已建立的/固体商业产品或开源)?通常,纯文本包含布尔值或数学操作数,例如(AND,OR,BETWEEN等)。

我喜欢AWS Comprehend,但我不确定它是否可以轻松用于此任务。

vehicle with 2 to 5 wheels
=>
SUBJECT: vehicle
EXPRESSION:
  SUBJECT: wheels
  OPERAND: BETWEEN
    NUMBER: 2
    NUMBER: 5

1 个答案:

答案 0 :(得分:0)

理解不支持将文本本地转换为结构化格式。但是,您可以使用语法API导出词性,并从那里创建基于规则的结构。

https://docs.aws.amazon.com/comprehend/latest/dg/how-syntax.html

对于上面的示例,“车辆”和“车轮”将被检测为名词,“ 2”和“ 5”将被检测为数字/值,而“ to”和“ with”将被检测为位置。