标签: hadoop mapreduce distributed-computing
我可以拆分映射器正在处理的文件,并在遇到特定句子时将其余部分发送给另一个映射器吗?是否有可能在映射之间拆分文件?请指导我这个。
我的数据文件格式如下:
我想找到每年的最高温度。 我怎么做,因为我不知道我的数据文件在哪些部分被分割?