我有一行数据如下:
header1 header2 header3 header4 header5
row key datavalue1 datavalue2 datavalue3 datavalue4 datavalue5....
所以基本上,我有一个非规范化的数据集,其中数据值可能是逐行的,也可能不是空的。我需要将它们标准化。
即
12345678 NULL 10 3 NULL 14
会变成:
12345678 header2 10
12345678 header3 3
12345678 header5 14
我可以通过使用粘贴特殊转换来实现这一点,但我有数千行,我需要确保为每个转换获得正确的行键。此外,每一行都有一堆与之关联的描述,我需要将每个数据值复制一遍。
转换每一列的最简单方法是什么,以便我有一个单行的多行,所有非空数据值加上相关的数据值引用?我需要能够转动数据集。
答案 0 :(得分:3)
如果您有五个“标题”列,请输入这些公式
H1: =OFFSET($A$1,INT((ROW()-1)/5)+1,0)
I1: =OFFSET($A$1,0,IF(MOD(ROW(),5)=0,5,MOD(ROW(),5)))
J1: =INDEX($A$1:$F$9,MATCH(H1,$A$1:$A$9,FALSE),MATCH(I1,$A$1:$F$1,FALSE))
复制H1:J ??并在顶部粘贴特殊值。在列J上排序并删除任何零。如果您在数据中有合法的零,那么您首先需要用一些唯一的字符串替换空白单元格,然后您可以将其删除。
如果您有更多列,则将所有上述公式中的“5”替换为您拥有的任何数字。
答案 1 :(得分:1)
在我看来,您尝试做的部分工作是“解除枢轴”数据透视表。当我不得不做类似的任务时,我发现这个提示是一个巨大的帮助:http://spreadsheetpage.com/index.php/tip/creating_a_database_table_from_a_summary_table/
请注意,在Excel 2007中,您可以使用按键Alt + D,P来访问旧的Excel 2003数据透视表向导。
答案 2 :(得分:1)
Excel具有转置功能,可以满足您的需求。它非常隐蔽,有点笨拙,但可能比钻研VBA更容易。以下是Excel 2007帮助的摘录:
块引用 切换(转置)列和行 显示AllHide All 如果在列或行中输入数据,但您希望将该数据重新排列为行或列,则可以快速将数据从一个转换为另一个。
例如,按列组织的区域销售数据在转置数据后会显示在行中,如下图所示。
1.在工作表上,执行以下操作: 要将数据从列重新排列到行,请选择包含数据的列中的单元格。 要从行重新排列数据,请选择包含数据的行中的单元格。 2.在“主页”选项卡上的“剪贴板”组中,单击“复制”。
键盘快捷键要复制所选数据,也可以按CTRL + C.
注意您只能使用“复制”命令重新排列数据。要成功完成此过程,请不要使用“剪切”命令。
3.在工作表上,选择要重新排列复制数据的目标行或列的第一个单元格。 注意复制区域(复制区域:当您要将数据粘贴到另一个位置时复制的单元格。复制单元格后,它们周围会出现一个移动边框,表示它们已被复制。)并粘贴区域(粘贴区域:使用Office剪贴板剪切或复制的数据的目标目标。)不能重叠。确保在粘贴区域中选择一个位于复制数据区域之外的单元格。
4.在“主页”选项卡上的“剪贴板”组中,单击“粘贴”下面的箭头,然后单击“转置”。 5.数据转换成功后,您可以删除复制区域中的数据。 提示如果转置的单元格包含公式,则会调换公式,并自动调整对转置单元格中数据的单元格引用。要确保公式继续正确引用非转置单元格中的数据,请在转置它们之前在公式中使用绝对引用。
有关更多信息,请参阅在相对,绝对和混合引用之间切换。
块引用
答案 3 :(得分:0)
我会创建一个VBA宏,循环遍历每一行并将数据输出到另一页。这样,您可以在数据输出后在新页面中创建数据透视表。
不确定你对VBA的熟悉程度,但这很容易通过将数据加载到数组(或者如果你真的想要正确地执行它的对象集合)并将其写回来来完成。
这是一个很好的VBA文档的链接。
http://social.msdn.microsoft.com/Forums/en/isvvba/thread/d712dbdd-c876-4fe2-86d2-7d6323b4262c
修改强>
请注意,这并不是一个完全可行的解决方案,而是一个真正的通用框架,可以帮助您朝着正确的方向前进。
作为一个通用的例子,它可以完成你需要做的很多事情(不是最好的方式,但对于初学者来说可能是最简单的方法),这样的事情应该让你开始,虽然很难说没有看到更多你的工作表。
Sub RowsToColumns ()
Application.ScreenUpdating = False
Dim srcWrkSheet As Worksheet
Dim destWrkSheet As Worksheet
Dim excelData as pExcelData
Dim srcRowNumber As Long
Dim srcRolNumber As Long
Dim destRowNumber As Long
Dim destColNumber As Long
SET srcWrkSheet = Sheets("YourSourceWorkSheetName")
SET destWrkSheet = Sheets("YourDestinationWorkSheetName")
srcRowNumber = 1
srcColNumber = 1
destRowNumber = 1
destColNumber = 1
'Loop until blank row is encountered in column 1
Do
destWrkSheet.Cells(destRowNumber ,1).Value = "Header 1 " & srcWrkSheet.Cells(srcRowNumber,srcColNumber )
destWrkSheet.Cells(destRowNumber ,1).Value = "Header 2 " & srcWrkSheet.Cells(srcRowNumber ,srcColNumber)
srcRowNumber = srcRowNumber + 1
srcColNumber = srcColNumber + 1
destRowNumber = destRowNumber + 1
Loop Until srcWrkSheet .Cells(rowNumber, 1).value = ""
End Sub
答案 4 :(得分:0)
让我们看看VBA中可能的解决方案。我认为这会有所帮助。以下是您应该了解的有关我的代码的一些事项。
NULL
的值。如果单元格为空,则您需要检查If IsEmpty(rngCurrent.Value) Then
。
Sub NormalizeSheet()
Dim wsOriginal As Worksheet
Dim wsNormalized As Worksheet
Dim strKey As String
Dim clnHeader As Collection
Dim lngColumnCounter As Long
Dim lngRowCounterOriginal As Long
Dim lngRowCounterNormalized As Long
Dim rngCurrent As Range
Dim varColumn As Variant
Set wsOriginal = ThisWorkbook.Worksheets("Original") 'This is the name of your original worksheet'
Set wsNormalized = ThisWorkbook.Worksheets("Normalized") 'This is the name of the new worksheet'
Set clnHeader = New Collection
wsNormalized.Cells.ClearContents 'This deletes the contents of the destination worksheet'
lngColumnCounter = 2
lngRowCounterOriginal = 1
Set rngCurrent = wsOriginal.Cells(lngRowCounterOriginal, lngColumnCounter)
' We'll loop through just the headers to get a collection of header names'
Do Until IsEmpty(rngCurrent.Value)
clnHeader.Add rngCurrent.Value, CStr(lngColumnCounter)
lngColumnCounter = lngColumnCounter + 1
Set rngCurrent = wsOriginal.Cells(lngRowCounterOriginal, lngColumnCounter)
Loop
'Here we'll reset our Row Counter and loop through the entire data set'
lngRowCounterOriginal = 2
lngRowCounterNormalized = 1
lngColumnCounter = 1
Do While Not IsEmpty(wsOriginal.Cells(lngRowCounterOriginal, lngColumnCounter))
Set rngCurrent = wsOriginal.Cells(lngRowCounterOriginal, lngColumnCounter)
strKey = rngCurrent.Value ' Get the key value from the current cell'
lngColumnCounter = 2
'This next loop parses the denormalized values for each row'
Do While Not IsEmpty(wsOriginal.Cells(lngRowCounterOriginal, lngColumnCounter))
Set rngCurrent = wsOriginal.Cells(lngRowCounterOriginal, lngColumnCounter)
'We're going to check to see if the current value'
'is equal to NULL. If it is, we won't add it to'
'the Normalized Table.'
If rngCurrent.Value = "NULL" Then
'Skip it'
Else
'Add this item to the normalized sheet'
wsNormalized.Range("A" & lngRowCounterNormalized).Value = strKey
wsNormalized.Range("B" & lngRowCounterNormalized).Value = clnHeader(CStr(lngColumnCounter))
wsNormalized.Range("C" & lngRowCounterNormalized).Value = rngCurrent.Value
lngRowCounterNormalized = lngRowCounterNormalized + 1
End If
lngColumnCounter = lngColumnCounter + 1
Loop
lngRowCounterOriginal = lngRowCounterOriginal + 1
lngColumnCounter = 1 'We reset the column counter here because we're on a new row'
Loop
End Sub