如何使用Jena从HDFS读取文件并将其转换为Rdf?

时间:2017-04-27 05:07:56

标签: apache hadoop rdf jena

我正在使用Apache Jena将.csv文件转换为.rdf。我使用model.read(pathFile),但它只读取本地文件系统中的文件。我想从hdfs中读取,例如model.read(hdfs://....),但它会出错。

My code

错误是:

  

线程“main”中的异常org.apache.jena.riot.RiotNotFoundException:未找到:hdfs:// localhost:54310 / user / hduser / demo / departments / part-00000.csv

我该怎么办?

感谢您的帮助。

1 个答案:

答案 0 :(得分:1)

您需要在Locator添加StreamManager来处理" hdfs://"。

Jena没有附带用于阅读HDFS网址的代码。