我有一个电子表格/ csv:
Code:,101,Course Description:,"Introduction to Rocket Science",
Student Name,Lecture Hours,Labs Hours,Test Score,Status
John Galt,48,120,4.7,Passed
James Taggart,50,120,4.9,Passed
...
我需要将其重塑为以下视图:
Code:,Course Description:,Students,Lecture Hours,Labs Hours,Average Test Score,Teaching Staff
101,"Introduction to Rocket Science",John Galt,48,120,4.7,Passed
101,"Introduction to Rocket Science",James Taggart,50,120,4.9,Passed
...
相信与否,虽然它似乎是非常原始的转变,却无法正确理解如何做到这一点,是否有任何银弹?
原始记录(csv)具有类似json的结构,所以我的第一种方法是将原始数据表示为向量然后转置它,(但在这种情况下,我的结果表看起来很像像sparced矩阵 - 我已经传输的行在其余值中是空白的)
我m considering - **serialize it into jsons and then de-serialize** into new spreadsheet (jsonize()) - in this case, I
遇到合并问题的另一种方法。
在两种方式中我都有它"半工作&#34 ;; 任何人都可以建议简单可靠的算法; 任何语言,RegEx,任何工具,代码片段都非常受欢迎
答案 0 :(得分:1)
假设您在此描述的模式始终如一,我认为您可以采取不同的方法,但在所有情况下,您基本上都可以使用“#Course”' ;行以&#34开头;代码:"但那永远不会成为学生的名字。
您可以通过正则表达式查找/替换或在OpenRefine中利用此功能。
示例: