我有一个包含多个列的csv,如:
id, latitude,longitude
1, 20-55-70.010N,32-11-50.000W
2, ..., ...
假设我有一个包含其中许多内容的CSV文件,我怎么能有效地输出一个CSV,其中包含使用pig转换为十进制的所有纬度经度,同时保留所有其他列?
答案 0 :(得分:1)
您可以编写a PIG UDF以从地理坐标(DMS)转换为十进制度数。 请参阅this Wikipedia article,了解如何执行转换。
答案 1 :(得分:0)
如果你只想删除N和W,你可以使用子串函数。
SUBSTRING(latitude,0,12) , SUBSTRING(longitude,0,12)