如何将文本提取到不同的部分?

时间:2019-06-19 07:08:59

标签: logging data-analysis

说我有一段文字

The robot says: {
   "temperature": 32,
   "timestamp": "2019-06-19T00:00:00",
   "command": "gcc -o test test.c",
   "comment": "gcc vs llvm"
}

如何编写识别实体的程序?喜欢

  • The robot says:之后的json对象
  • 在json对象中,有一个数字32和一个日期时间字符串2019-06-19T00:00:00,其中2019-06-19是日期,00:00:00是时间。
  • 在json对象中,gcc -o test test.c是用于编译test.c的命令行,因此gcc是命令,test.c是文件;同时,gcc vs llvm显示gcc是一个单词,它描述了产品/编译器的名称。

由于我们需要提取包括结构/层次结构信息的数据,因此正则表达式无法完成这项工作。

机器学习模型可以判断分类(滑动窗口+锚定方法可以检测不同类别),并且是否存在现有模型?

0 个答案:

没有答案