我有一个包含大约10个不同列的CSV文件。我想弄清楚最新的方法是什么。
数据如下所示: “20070906 1 0 0否”
Theres大约有40,000条此类记录需要进行分析。我不确定这里最好的是什么,将每一列拆分成自己的向量,或者将每一行放入一个向量中。
谢谢!
答案 0 :(得分:0)
我认为这是一个主观问题,但是我认为拥有包含拆分行的单个向量可能比每列的单独向量更容易管理。您甚至可以创建向量存储的行对象,以便更方便地访问和处理行/列中的数据。 虽然如果您只是在列级别进行处理而不是在行或入口级别上进行处理,那么单个列向量会更容易。
答案 1 :(得分:0)
由于数据集相当小(假设您使用的是PC而不是智能手机等其他设备),您可以逐行读取文件到字符串向量中,然后逐个解析元素,填充一些包含记录数据的结构的向量。