标签: hadoop fixed-width
我目前正在研究一个用例,其中所有固定宽度的输入记录都存在于一行中。该文件非常大,可以跨越hadoop集群上的多个块。 如何才能实现此功能以正确读取所有记录?