从Google网站站长工具获取Sitemap是HTML

时间:2009-08-03 18:44:32

标签: text sitemap google-webmaster-tools

[注意明智的:跳到最后编辑]

我有一个非常简单的txt站点地图(名为sitemap.txt),如下所示:

http://myDomain.com
http://myDomain.com/about.html
http://myDomain.com/faq.html
http://myDomain.com/careers.html

当我在网站管理员工具上加载时,我得到:

网站地图是HTML - 您的站点地图似乎是一个HTML页面。请使用支持的站点地图格式

我尝试了一些替代方案(例如有或没有www),但没有运气。

任何人都有任何线索?

任何帮助表示赞赏!

修改

我尝试使用xml站点地图并获得相同的错误,因此看起来服务器正在以HTML格式提供服务(正如ceejayoz正确建议的那样)。 现在的问题是...... 如何将appspot服务器作为纯文本提供给服务器文本

修改

好的 - 我厌倦了并实现了一个servlet来为我的站点地图(我现在正在尝试使用XML和TXT)显式地作为text / plain。如果我手动调用servlet但仍然获得Sitemap是HTML,一切正常。我不知道在哪里敲我的脑袋!

修改 我尝试使用firefox插件验证内容类型 - 一切似乎都会出现 预期(我将实际的URL放在人们可以看一下):

http://wokheisandbox.appspot.com/sitemaps/sitemap.txt - >内容类型:text / plain http://wokheisandbox.appspot.com/sitemaps/sitemap.xml - >内容类型:application / xml

使用我的servlet(显式设置text / plain): http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=TXT - >内容类型:text / plain http://wokheisandbox.appspot.com/wokhei/serveSitemap?fileType=XML - >内容类型:text / plain

我从网站站长工具获得的所有内容仍然是 - > 站点地图是HTML

修改

我想我发现了原因 - >我在Google网站管理员工具上注册了我的网站http://mydomain.com,但应用程序托管在http://myapp.appspot.com的appspot上,该地图已映射到mydomain.com。如果我注册http://myapp.appspot.com,一切正常(站点地图已验证)。

这是个好消息,但它并不理想,因为我希望mydomain.com被编入索引...有关如何克服的任何想法?

5 个答案:

答案 0 :(得分:5)

听起来您的网络服务器正在将.txt个文件作为text/html而不是text/plain投放。

对于Apache,.htaccess文件中的以下内容应该修复它:

AddType text/plain .txt

答案 1 :(得分:1)

我发现了thread discussing duplicate entries causing recent sitemap grief。我在您的站点地图中没有看到此问题,但您不希望条目之间有任何重复。例如,请确保您的站点地图不包含以下内容:

http://mydomain.com/ or http://www.mydomain.com/

AND

http://mydomain.com/index.html or http://www.mydomain.com/index.html

我认为您发布了整个站点地图,所以我再次认为这不是您的问题。您确实提到过您尝试了各种网址(有和没有www。)如果您通过Google WebMaster工具验证网站地图,则修改可能需要20分钟才能生效。我希望它有所帮助。

答案 2 :(得分:0)

<?xml version='1.0' encoding='utf-8' ?>
<urlset xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'>
    <url>
        <loc>http://myDomain.com</loc>
    </url>
    <url>
        <loc>http://myDomain.com/about.html</loc>
    </url>
    <url>
        <loc>http://myDomain.com/faq.html</loc>
    </url>
    <url>
        <loc>http://myDomain.com/careers.html</loc>
    </url>
</urlset>

这种方式总是对我有用。

答案 3 :(得分:0)

万一你会改变对非xml站点地图的看法:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.test.com/</loc>
    <lastmod>2009-08-03T23:40:40+00:00</lastmod>
    <changefreq>daily</changefreq>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>http://test/</loc>
    <lastmod>2009-08-03T23:59:08+00:00</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.6</priority>
  </url>
</urlset>

答案 4 :(得分:-1)

我很确定您需要提供XML格式的站点地图文件(sitemap.xml)。请参阅此处获取格式示例:http://en.wikipedia.org/wiki/Sitemaps