Hadoop中有nutch数据,我通过方法get(key,val)获取值,但是如何将可写数据传输到其原始类。我的代码贴在下面:
Text key = new Text();
key.set(url);
Writable value = null;
value = reader.get(key, value);
值如下:
Version: -1
url:http://www.google.com
base: http://www.google.com
contentType: application/xhtml+xml
metadata:***
Content:
<!DOCTYPE html****
我怎样才能获得仅限内容或contentType? 我可以将值传输到其原始类并使用getContent()方法吗?
答案 0 :(得分:0)
如果value
的运行时类型为org.apache.nutch.protocol.Content
,则为是,您可以转换为该类型,然后调用getContent()
方法
Content content = (Content) value;
content.getContent();