在Open Refine中附加两个文件,并通过两列向下钻取数据

时间:2014-10-03 23:57:07

标签: dataset openrefine

我有两个关于Open Refine的问题

  1. 我有Excel文件形式的多组数据,但我想将它全部上传到Open Refine。如何在Open Refine中附加文件A,文件B和文件C?所有文件都具有相同的列名。注意,我不是在一个共同的,唯一的字段之间尝试合并或cell.cross。我只想将三个文件一起添加到一个项目中。

  2. 我有一个数据集,其中包括检查类型和违规字段。 “检查类型”下的一些常见类别包括“事故”,“投诉”,“推荐”,“计划”以及其他一些类别。违规类别/记录包含三种常见类型:严重,重复,故意。我需要分析的是,每种类型的检查类型(例如,对于事故)如何对应于违规行为,以及这些行为的数量。例如,对于有多少事故检查类型,违规被认为是严重或故意,并在单独的列中显示该信息。我能够检查“检查类型”列以计算每种类型下的类别数,但我无法继续完成下一步的操作。

  3. 非常感谢任何帮助!

2 个答案:

答案 0 :(得分:0)

<强> 1。附加文件

在精简中创建项目时,您可以选择“导入工作表”&#39;&#39;。通过预览面板,您可以确保在创建项目之前整齐排列。如果这不起作用,那么最好是在Excel First中执行此操作。

<强> 2。刻面

请注意,您可以将多个构面组合在一起,例如,您可以先选择属于某个检验类型的所有记录,然后在事故上创建新构面字段有计数。您可以创建new column to add the count

PS Stack Overflow上的最佳做法是每个问题只询问一个问题。接下来每个问题创建一个帖子。

答案 1 :(得分:0)

参考Open Refine - Add another file to the existing Project,您可以将每个项目导出为CSV文件,创建包含这些CSV的zip文件,然后将其重新导入OpenRefine。