Hadoop MapFile:如何将可写值传递给原始类?

时间:2012-05-31 09:01:18

标签: hadoop nutch

Hadoop中有nutch数据,我通过方法get(key,val)获取值,但是如何将可写数据传输到其原始类。我的代码贴在下面:

Text key = new Text();
key.set(url);
Writable value = null;
value = reader.get(key, value);

值如下:

Version: -1
url:http://www.google.com
base: http://www.google.com
contentType: application/xhtml+xml
metadata:***
Content:
<!DOCTYPE html****

我怎样才能获得仅限内容或contentType? 我可以将值传输到其原始类并使用getContent()方法吗?

1 个答案:

答案 0 :(得分:0)

如果value的运行时类型为org.apache.nutch.protocol.Content,则为是,您可以转换为该类型,然后调用getContent()方法

Content content = (Content) value;
content.getContent();