如何处理列中每行可包含多个条目的原始数据?

时间:2016-01-26 00:10:00

标签: excel csv collections multiple-columns

我想要将一些数据导出(碰巧来自Ruby,但这并不重要),并将其转换为通用格式以供进一步分析。不幸的是,某些记录/行/数据条目可能包含给定列的大于1的值(或者就此而言为0)。

例如,一个人可能戴着太阳镜和帽子。这样有多个列。

我不确定如何处理理想情况下可能属于通用格式的同一列的数据集合(我需要将此数据导入其他软件,最好包括Excel)。

我能想到的唯一简单,通用的方法是为每个可能的数据块添加一列,并将其视为布尔值。但我不愿意,从那以后我最终会有超过300列。然后我还必须包含一个辅助CSV文件,该文件指定哪些列属于哪些类别。

1 个答案:

答案 0 :(得分:0)

如果要将该数据输出到csv文件,可以使用不同的分隔符将数据分组到一个字段中:

John,sunglasses|hat,other,fields

或使用相同的分隔符,但随后需要引用该字段(并且该字段内的引号需要使用另一个引号进行转义):

John,"sunglasses,hat",other,fields

或者,如果其他字段的数量不大,则可以为每个值使用一行:

John,sunglasses
John,hat

或者您可以使用xml:

<record>
    <name>John</name>
    <options>
        <option>sunglasses</option>
        <option>hat</option>
    </options>
</record>

这完全取决于您希望如何处理导出的数据。