在RapidMiner中,我正在尝试从div类“description”中提取数据。当我使用Google XPath导入XML测试语法时,它会返回相应的数据。当我在RapidMiner中尝试以下操作时,我得到空白结果:
//h:div[@id='description']/text()
这有效:
//h:div[@id='description']
但我得到了所有的HTML标记数据。
我需要添加或删除哪些内容?
在同一份文件中,我能够得到这个以返回预期的结果:
//h:label[@id='desc']/text()
XML:
div id="description" class="longdesc" style=" padding-top: 0px; display: block;" xmlns:IDB="urn:ItemDataBinding">Description Text Here./div