非结构化数据方法和解决方案

时间:2019-05-16 00:10:29

标签: data-structures nlp data-science data-warehouse

我想,我有很多非结构化/半结构化数据,带有基本的收件人/主题/主题的电子邮件,但是包含许多其他类型数据的正文文本。我希望挖掘这一点,以便在包含地理数据的情况下为某些自动化,洞察力甚至热图提供信息。

不过,我正在尝试以正确的方式解决问题。从系统架构来看,有人有“操作顺序”到围绕它设计系统和流程吗?

最好的客人: 步骤1是定义存储数据的“存储桶” 作为示例,第2步是在到/从/主题数据周围应用图形或一般结构。 步骤3可能是应用NLP或Watson来挖掘某些关键字或情感的非结构化数据。围绕重要发现的用例将推动所有这些。 然后,步骤4可能是应用“找到的”结构并从那里构建功能,自动化和过程。

这有意义吗?希望我走在正确的轨道上,但很想听听想法。

0 个答案:

没有答案