一行数据看起来像
"!Next?" (1994) Italy
我需要创建3列。
""
()
我需要为每列指定不同的分隔符。
一个重要的事情 - 我正在从文件/home/ap/Downloads/country.list
如果可以解释一点点查询,那将是很好的。
提前致谢...
答案 0 :(得分:0)
使用此cmd
cat YOUR_FILE_HERE|sed 's/"\(.*\)"\s*(\(.*\))\s*\([^\s].*\)/\1^A\2^A\3/g' > OUTPUT_FILE
然后将此OUTPUT_FILE加载到您的hive表。
记住:
我在这里使用\001
作为分隔符。如果您更改表默认字段终结符,请使用它来替换我的cmd中的^A
。
此外,^A
由ctrl-v
输入,然后ctrl-a
而不是^
和A
输入。