我正在使用“XPath抓取页面”来获取网页的DOM树的子树。我想将该子树未修改为RSS(包含所有标签,链接等)。我正在使用“RSS项目构建器”来制作RSS项目,但似乎该模块从输入中删除所有标签。这样所有链接都会丢失。我该怎么做才能保留元素?
我正在处理的管道:Tatoeba Wall posts。倒数第二个元素是一个循环的“RSS项目构建器”,它应该将item.message
中存储的子树作为项目的描述字段。例如,一个项目(在“RSS项目构建器”之前跟踪元素的调试器的屏幕截图):
将由“RSS项目构建器”转换:
为:
item.description
元素不再包含任何html。