我已经从互联网上的某个网站导入了一些页面到我的plone网站。现在的问题是,当导入到plone时,它会更改url,这会导致plone无法找到文件。因此,在导入之前,以下是其中一个网址的示例:
http://wiki.scandiatransplant.org/?What_Is_Scandiatransplant
导入后,它看起来像这样:
http://localhost:8080/Scandiatransplant/wiki/index.html?What_Is_Scandiatransplant
显然这是一个问题,因为没有名为index.html的选项? 有办法解决这个问题吗?我想也许可以通过在pipeline.cfg文件中添加一个告诉不要更改URL的步骤来修复它?这只是猜测。我还没有做过pipeline.cfg。网站:http://plone.org/products/funnelweb/#using-a-local-pipeline-configuration解释说可以创建一个pipeline.cfg文件,但它不知道放置该文件的位置。我应该在哪里放置这个文件?
最后......它可以通过正则表达式来表达,在导入过程中要忽略哪些文件,但我没有告诉funnelweb忽略任何文件。仍然没有导入图像,pdf文件,xslt等。有没有人经历过这个?
所以,总结一下我的问题。
我应该在哪里放置pipeline.cfg文件?
如何让plone / funnel不更改网址,但保持导入的网址相同?
如何让funnelweb导入图像和pdf文件?
答案 0 :(得分:3)
您可以将pipeline.cfg文件放在任何地方;你告诉funnelweb
从命令行找到它的位置:
bin/funnelweb --pipeline=path/to/your/pipeline.cfg
这更复杂。您的目标站点是Wiki,页面名称是查询字符串的一部分。 ?What_Is_Scandiatransplant
需要用作新Plone页面的id,并且需要重写其他页面中使用的URL以匹配。
你当然可以在管道中做到这一点,但比这里容易写的要复杂一点。请按照funnelweb
的文档(urltidy
组件将帮助重写网址),随时在SO上询问有关您遇到的问题的具体问题。
检查日志并查看funnelweb已找到并上传的内容。您可能需要调整webcrawler设置;这因站点而异。没有关于该网站的更多细节,我只能给你这个一般提示。