我的问题很简单,但实际上可以说是一个头疼的问题。 确定文件内数据类型的最有效,最快的方法是什么。
例如,如果您的原始文件具有无数列...
您有提供给我的提示吗? :)
ps:我正在将python用于小型文件,将hortonworks用于大型文件。
非常感谢!
答案 0 :(得分:0)
事实上,我想要这样的快速返回:
truckid STRING,
driverid STRING,
event STRING,
latitude DOUBLE,
longitude DOUBLE,
city STRING,
state STRING,
velocity INT,
event_ind INT,
idling_ind INT