我经常使用Java来清理下面的数据文件 http://usda.mannlib.cornell.edu/usda/current/uscanpot/uscanpot-02-12-2016.txt
我尝试使用整洁数据的原则将数据重现为CSV文件,例如:
"每个变量形成一列。"
"每个观察形成一行。"
"每种类型的观察单位都形成一个表格。"
作为使用上述文件的第一个表格的示例,我的CSV文件中的记录如下所示:
裁剪,变量,单位,年份,值
北美土豆,种植面积,1000英亩,2006年,995.7
为了使使用Java更容易清理半结构化/非结构化数据,我应该学习哪些库/工具/知识?