我是大数据文件世界的新手,我想知道我的数据格式可能是什么。数据位于包含一些匿名医疗记录的非常大的文本文件中。我在下面贴了一个样本。
我理解每列是什么,除了第四列似乎是与相似行相关的代码。这种类型的数据是否来自关系数据库?如果是这样,这种格式有名称吗?
非常感谢任何帮助。
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1169|Blood Pressure (Diastolic)|80
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1170|Blood Pressure (Systolic)|140
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1174|Vital Signs Delta|0
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1175|Pulse|64
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1176|Respiratory Rate|14
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1178|Weight|73.7
649|183|Vital Signs|33877743-BE2A-48EE-A53C-D507D59CE540|1180|Weight Units|Kilograms
649|183|Vital Signs|ACEFCC5F-C6FA-426F-AC26-7A23D7E6B26E|1169|Blood Pressure (Diastolic)|
649|183|Vital Signs|ACEFCC5F-C6FA-426F-AC26-7A23D7E6B26E|1170|Blood Pressure (Systolic)|
答案 0 :(得分:1)
使用|
作为分隔符,看起来像是一个普通的分隔样式文本文件。
这不是一个特定的标准,但许多不同的程序可以生成和使用这些文件。无法分辨出这个软件的具体内容。
根据平台和语言,您可以非常轻松地解析此文件 - 它看起来像每行一条记录,每个字段用|
分隔。
第四列是GUID。 GUID在许多应用程序中非常常见,并且在非常大的数据库和断开连接的数据库方案中多次用作标识符(因为它们的性质意味着不太可能创建重复项。)