XSLT格式化Wordpress WXR XML以通过Feeds导入Drupal

时间:2013-07-18 10:32:52

标签: wordpress xslt drupal

我正在尝试使用XSLT格式化Wordpress WXR文件,因此我可以将其导入Drupal。

我知道Drupal的模块将导入WXR文件,但我需要Feeds模块可以提供的灵活性,因为导入的数据将针对不同的内容类型导入,我将把图像和其他附件拉入到新创建的Drupal页面。考虑到这一点,标准的WordPress Migrate不会削减它。

因此,WXR格式将Wordpress帖子和附件作为单独的items添加到Feed中,并使用ID链接帖子附件。附件可以是图像,文件(pdf,doc等),可以在xpath wp:postmeta/wp:meta_key找到,其值为_thumbnail_id,_wp_attached_file

我想做的是从类型附件的项目中取出各种节点,并将它们放在相应的帖子项目中,其中id将它们链接在一起

要转换的xml片段......第一项是post秒,attachment

<item>
    <title>Some groovy title</title>
    <link>http://example.com/groovy-example</link>
    <wp:post_id>2050</wp:post_id>
    <wp:post_type>page</wp:post_type>
    ...
    ...
    ...
    <wp:postmeta>
        <wp:meta_key>_thumbnail_id</wp:meta_key>
        <wp:meta_value>566</wp:meta_value>
    </wp:postmeta>
</item>
...
...
...
<item>
    <title>My fantastic attachment</title>
    <link>http://www.example.com/fantastic-attachment</link>
    <wp:post_id>566</wp:post_id>
    <wp:post_type>attachment</wp:post_type>
    ...
    ...
    ...
    <wp:attachment_url>http://www.example.com/wp-content/uploads/2012/12/fantastic.jpg</wp:attachment_url>
    <wp:postmeta>
        <wp:meta_key>_wp_attached_file</wp:meta_key>
        <wp:meta_value>2012/12/fantastic.jpg</wp:meta_value>
    </wp:postmeta>
</item>

转换后我想

<item>
    <title>Some groovy title</title>
    <link>http://example.com/groovy-example</link>
    <wp:post_id>2050</wp:post_id>
    <wp:post_type>page</wp:post_type>
    ...
    ...
    ...
    <wp:postmeta>
        <wp:meta_key>_thumbnail_id</wp:meta_key>
        <wp:meta_value>566</wp:meta_value>
        <wp:meta_url>http://www.example.com/wp-content/uploads/2012/12/fantastic.jpg</wp:attachment_url>
    </wp:postmeta>


</item>

也许,还有更好的方法吗?也许合并post和attachment,其中id在节点之间创建链接?

我是XSLT的新手并阅读了一些关于身份转换的帖子,我认为这是正确的方向,但我只是没有经验来提取我需要的东西,我将不胜感激。

1 个答案:

答案 0 :(得分:0)

看起来我已经设法解决了问题。

我使用了许多索引来组织附件。我的要求在进一步检查XML方面有所改变,因为有

我将结果输出改为格式为......

<item>
    <title>Some groovy title</title>
    <link>http://example.com/groovy-example</link>
    <wp:post_id>2050</wp:post_id>
    <wp:post_type>page</wp:post_type>
    ...
    ...
    ...
    <thumbnail>
        <title>Spaner</title>
        <url>http://www.example.com/wp-content/uploads/2012/03/spanner.jpg</url>
    </thumbnail>
    <attachments>
        <attachment>
            <title>Fixing your widgets: An idiots guide</title>
            <url>http://www.example.com/wp-content/uploads/2012/12/fixiing-widgets.pdf</url>
        </attachment>
        <attachment>
            <title>Do It Yourself Trepanning</title>
            <url>http://www.example.com/wp-content/uploads/2013/04/trepanning.pdf</url>
        </attachment>
    </attachments>
</item>

因此使用以下xsl给了我想要的结果。索引的条件确保我选择了正确的文件。

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
 xmlns:wp="http://wordpress.org/export/1.2/">

    <xsl:output indent="yes" cdata-section-elements="content"/>

    <!-- Setup indexes -->

    <!-- Index all main posts -->
    <xsl:key 
        name="mainposts" 
        match="*/item[wp:post_type[text()='post']]" 
        use="wp:post_id" />

    <!-- Index all sub posts (posts within posts)-->
    <xsl:key 
        name="subposts" 
        match="*/item[wp:post_type[text()='post'] and category[@nicename = 'documents']]" 
        use="category[@domain = 'post_tag']" />

    <!-- Index all image thumbs -->
    <xsl:key 
        name="images" 
        match="*/item[wp:post_type[text()='attachment'] and wp:postmeta/wp:meta_key[text()='_wp_attachment_metadata']]" 
        use="wp:post_parent" />

    <!-- Index all files (unable to sort members file at the moment)-->
    <xsl:key 
        name="attachments" 
        match="*/item[wp:post_type[text()='attachment'] and not(wp:postmeta/wp:meta_key = '_wp_attachment_metadata')]"
        use="wp:post_parent" />

    <xsl:key 
        name="thumbnails" 
        match="*/item[wp:post_type[text()='attachment']]" 
        use="wp:post_id" />

    <xsl:template match="node()|@*">
        <xsl:copy>
            <xsl:apply-templates select="node()|@*"/>
        </xsl:copy>
    </xsl:template>

    <xsl:template match="*/item/wp:post_parent[text()= 0]">
        <wp:post_parent>
            <xsl:value-of select="." />
        </wp:post_parent>

        <xsl:for-each select="key('thumbnails', ../wp:postmeta[wp:meta_key[text()='_thumbnail_id']]/wp:meta_value)">
            <thumbnail>
                <title><xsl:value-of select="title" /></title>
                <url><xsl:value-of select="wp:attachment_url" /></url>
            </thumbnail>
        </xsl:for-each>

        <xsl:for-each select="key('subposts', ../category[@domain = 'post_tag'])">
            <attachments>

                <xsl:for-each select="key('images', wp:post_id)">
                    <file>
                        <title><xsl:value-of select="title" /></title>
                        <url><xsl:value-of select="wp:attachment_url" /></url>
                    </file>
                </xsl:for-each>

                <xsl:for-each select="key('attachments', wp:post_id)">
                    <file>
                        <title><xsl:value-of select="title" /></title>
                        <url><xsl:value-of select="wp:attachment_url" /></url>
                    </file>
                </xsl:for-each>

            </attachments>
        </xsl:for-each>

    </xsl:template>