我使用wc -l file.csv
对制表符分隔文件中的记录进行计数。显示127992
。
连接到Tableau中的文件,它显示63k条记录和一些更改。确定,所以我检查源文件中的空白ID:
awk -F'\t' '!length($1)' file.csv
awk -F'\t' '!length($1){print $0}'
awk -F'\t' '$1 == ""{print $0}'
在任何情况下都不会公开null或空白ID,这是非常低的概率,因为从中提取的数据库不允许将其设置为null。试图弄清楚,在哪种用例情况下,您希望您的软件丢弃一半的数据?
在Tableau中,我创建一个计算字段,想知道为什么这是必要的,但是可以:
COUNT([Itemnumber])
请记住,我仔细检查以确保没有NULL值,然后得到:63,756
我已经习惯了Unix和Tableau的新知识,所以我想念什么?
对文件中的行进行采样:
itemnumber title author itemcallnumber barcode lib datelastseen datelastborrowed amountoutstanding
7666 Indian legends of American scenes / Gridley, Marion E. J 398.2 GRIDLEY 39030000964991 Lost 2001-06-04 2001-06-04
12927 The legend of the Indian paintbrush / DePaola, Tomie, J 398.2089 DE PAOL 39030002344226 Lost 2002-04-03 2002-04-03
16943 The Tainos : Jacobs, Francine. J 972.901 JACOBS 39030001423195 Lost 2003-06-04 2003-06-04
124564 Columbia River, the Astoria odyssey : Penttila, Bryan. 979.7002 PENTTIL 39030008124408 Lost 2005-09-12 2005-09-12
答案 0 :(得分:1)
要修复,我必须: