带有缺失标签的RSS Feed

时间:2018-01-11 20:09:39

标签: php xml rss

我正在开发一个非常简单的RSS Feed。我正在做的是从数据库中提取信息并使用PHP将其转换为XML。但是,当我使用Chrome浏览器来查看代码以确保其全部显示时,我会在页面顶部显示这些错误。

error on line 1322 at column 12: Encoding error

以下是我用来从我的数据库中提取并创建RSS Feed的代码。

<?php
include('connectDatabaseScript.php');
$sql = "SELECT * FROM table ORDER BY id DESC";
$query = mysql_query($sql) or die(mysql_error());

header("Content-type: text/xml"); 

echo "<?xml version='1.0' encoding='UTF-8'?> 
<rss version='2.0'>
<channel>
<title>My RSS Feed</title>
<link>http://www.mywebsite.com/rss.php</link>
<description>The description for the feed.</description>
<language>en-us</language>"; 

while($row = mysql_fetch_array($query)) {
$title=$row['title'];
$finalTitle = str_replace("&", "and", $title);
$link=$row['link'];
$newLink = str_replace("&", "&amp;", $link);
$category = $row['category'];
$date = $row['date'];
$description = $row['description'];

echo "<item> 
<title>$finalTitle</title>
<link>$newLink</link>
<description>$description</description>
<author>John Doe</author>
<pubDate>$date<pubDate>
<category>$category</category>
</item>"; 
} 
echo "</channel></rss>"; 
?>

此代码通常卡在标题标签上。当它这样做时,它会将链接合并在一起,并且还可以合并项目的其余部分和其他几个项目。以下是正在发生的事情的一个例子。

<item> 
<title>Title No 415: Title <item> 
<title>Title No 291: Another Title</title>
<link>http://www.mywebsite.com/post.php?id=291</link>
<description>description</description>
<author>John Doe</author>
<pubDate>Jan. 1, 2000</pubDate>
<category>Generic</category>
</item>

我已经弄清楚导致这种情况发生的特征。这是&#34; - &#34;出现在我所拥有的导致问题的一些标题中的字符。我一直在尝试使用str_replace函数删除它。虽然我已经能够使用&#34;&amp;&#34;成功之后,它与#34; - &#34;无法合作。还有另一种解决方案可以摆脱&#34; - &#34;从标题或str_replace仍然可以吗?

2 个答案:

答案 0 :(得分:1)

你不应该像这样写你的XML。为避免此类错误,您可以使用DOMDocument编写XML,并使用saveXML保存。

答案 1 :(得分:-1)

我有一些PHP脚本可以生成MySQL查询并使用它来生成RSS源。需要清除RSS元素的文本,例如titledescription,以便以XML格式呈现。

这是一个能够做到这一点的功能:

function clean_text($in_text) {
    return utf8_encode(
        htmlspecialchars(
            stripslashes($in_text)));
}

我认为更简单的功能可以解决您遇到的问题:

function clean_text($in_text) {
    return htmlspecialchars(
            stripslashes($in_text));
}

utf8_encode()的调用将ISO-8859-1字符串编码为UTF-8,对我来说是必要的,因为我在我的数据库中处理ISO-8859-1字符编码。 PHP中的htmlspecialchars()函数转为&amp;到&amp; amp;,&lt;到&amp; lt;和&gt;到&amp; gt;。

这是一个使用该函数输出一些RSS的语句:

echo "<description>" . clean_text($row['description']) . "</description>";