我正在使用GATE处理用自然语言编写的文本。我必须从文本中提取高度,重量,bp等,并以结构化形式存储它。现在,这些东西(即身高,体重等)可以用我不知道的许多形式写出来。以我能想出的所有不同方式编写JAPE语法,仅仅是硬编码。我是否有其他选择以更灵活的方式处理文档?
另外,我很困惑我是否可以通过呈现不同的身高,体重等方式来使用ANTLR来生成jape语法?
该文本将包含以下内容:
Vitals: Height: 72 inches, Weight is 170 pounds, T is 89.9 degree Fahrenheit. OR
Vitals: He is 184 cm tall, his weight was 67.8 Kg, RR 16 (its respiration rate). OR
Vitals: height is 6ft 3 in, he weighs 70 kg, pulse is 67, Temperature 99.8 degrees.
现在我使用JAPE语法和ANNIE来标记文本以提取这些生命体征并以结构化形式存储。使用ANTLR是否可以灵活地对这样的文本进行标记化?灵活的,我不应该为每种表示方式硬编码,因为你看到高度,重量等可以用多种形式表示。
搜索或开发任何会产生jape语法的语法生成器会是个好主意吗?
如果您需要任何细节以便更好地了解问题,请告诉我。
非常感谢!!