如何自动检测字符串中的语义数据类型?

时间:2018-10-29 13:25:36

标签: data-processing

我需要像人类一样检测/注释String的(语义)数据类型。

例如,以下几行内容:

string = "1,000,000 €"
// Integer with value 1000000
// and/or
// Amount in Currency: {Amount: 1000000.00, Currency: €}

string = "23 October 2017"
// Date with value: 2017-10-23

string = "USA"
// String with value "USA"
// or maybe even: Nation with value: United States of America

string = "Tim"
// String "Tim"
// First Name with value: "Tim"

是否存在可以处理某些情况的库/ API?

例如,诸如Trifacta或Talend之类的数据准备工具有时可以检测语义数据类型。但是,这些检测结果无法在Python脚本等工作流中使用。

0 个答案:

没有答案