是否有可以从纯文本中提取结构化数据的可用工具/库(最好是已建立的/固体商业产品或开源)?通常,纯文本包含布尔值或数学操作数,例如(AND,OR,BETWEEN等)。
我喜欢AWS Comprehend,但我不确定它是否可以轻松用于此任务。
vehicle with 2 to 5 wheels
=>
SUBJECT: vehicle
EXPRESSION:
SUBJECT: wheels
OPERAND: BETWEEN
NUMBER: 2
NUMBER: 5
答案 0 :(得分:0)
理解不支持将文本本地转换为结构化格式。但是,您可以使用语法API导出词性,并从那里创建基于规则的结构。
https://docs.aws.amazon.com/comprehend/latest/dg/how-syntax.html
对于上面的示例,“车辆”和“车轮”将被检测为名词,“ 2”和“ 5”将被检测为数字/值,而“ to”和“ with”将被检测为位置。