导入时不使用funnelweb更改URL

时间:2013-02-04 12:32:36

标签: plone plone-funnelweb

我已经从互联网上的某个网站导入了一些页面到我的plone网站。现在的问题是,当导入到plone时,它会更改url,这会导致plone无法找到文件。因此,在导入之前,以下是其中一个网址的示例:

http://wiki.scandiatransplant.org/?What_Is_Scandiatransplant

导入后,它看起来像这样:

http://localhost:8080/Scandiatransplant/wiki/index.html?What_Is_Scandiatransplant

显然这是一个问题,因为没有名为index.html的选项? 有办法解决这个问题吗?我想也许可以通过在pipeline.cfg文件中添加一个告诉不要更改URL的步骤来修复它?这只是猜测。我还没有做过pipeline.cfg。网站:http://plone.org/products/funnelweb/#using-a-local-pipeline-configuration解释说可以创建一个pipeline.cfg文件,但它不知道放置该文件的位置。我应该在哪里放置这个文件?

最后......它可以通过正则表达式来表达,在导入过程中要忽略哪些文件,但我没有告诉funnelweb忽略任何文件。仍然没有导入图像,pdf文件,xslt等。有没有人经历过这个?

所以,总结一下我的问题。

  1. 我应该在哪里放置pipeline.cfg文件?

  2. 如何让plone / funnel不更改网址,但保持导入的网址相同?

  3. 如何让funnelweb导入图像和pdf文件?

1 个答案:

答案 0 :(得分:3)

  1. 您可以将pipeline.cfg文件放在任何地方;你告诉funnelweb从命令行找到它的位置:

    bin/funnelweb --pipeline=path/to/your/pipeline.cfg
    
  2. 这更复杂。您的目标站点是Wiki,页面名称是查询字符串的一部分。 ?What_Is_Scandiatransplant需要用作新Plone页面的id,并且需要重写其他页面中使用的URL以匹配。

    你当然可以在管道中做到这一点,但比这里容易写的要复杂一点。请按照funnelweb的文档(urltidy组件将帮助重写网址),随时在SO上询问有关您遇到的问题的具体问题。

  3. 检查日志并查看funnelweb已找到并上传的内容。您可能需要调整webcrawler设置;这因站点而异。没有关于该网站的更多细节,我只能给你这个一般提示。