是否有任何选项可以使用c#代码将Hadoop分布式文件系统文件编写为序列文件。如果是这样,你可以建议我链接或其他细节
答案 0 :(得分:0)
我在Hadoop工作中没有使用C#,但我们可以做到这一点。
在JAVA中
Configuration conf = new Configuration();
Job job = new Job(conf);
job.setOutputFormatClass(SequenceFileOutputFormat.class);
这将编写SequenceFile。同样在C#中应该有这样的
HadoopJobConfiguration myConfig = new HadoopJobConfiguration();
myConfig.InputPath = "/demo/simple/in";
myConfig.OutputFolder = "/demo/simple/out";
更新:
HadoopJobConfiguration myConfig = new HadoopJobConfiguration();
myConfig.InputPath = "/demo/simple/in";
myConfig.OutputFolder = "/demo/simple/out";
myConfig.outputformat = // Your needed o/p format
希望这会给你一个想法