Google抓取工具找到robots.txt,但无法下载
谁能告诉我这个robots.txt有什么问题?
http://bizup.cloudapp.net/robots.txt
以下是我在Google网站站长工具中收到的错误:
Sitemap errors and warnings
Line Status Details
Errors -
Network unreachable: robots.txt unreachable
We were unable to crawl your Sitemap because we found a robots.txt file at the root of
your site but were unable to download it. Please ensure that it is accessible or remove
it completely.
实际上,上面的链接是一个行动机器人的路线的映射。该操作从存储中获取文件并以text / plain方式返回内容。谷歌表示他们无法下载该文件。是因为那个吗?
没有找到相关结果
已邀请:
4 个回复
藐刚
编辑 它实际上比这更深入,Googlebot无法在您的网站上下载任何页面。以下是Googlebot请求robots.txt或主页时返回的例外情况: 此应用程序不支持无Cookie表单身份验证。 异常详细信息:System.Web.HttpException:无Cookie表单身份验证 此应用程序不支持。
FormsAuthentication正在尝试使用cookieless模式,因为它识别出Googlebot不支持cookie,但是FormsAuthentication_OnAuthenticate方法中的某些内容随后会抛出异常,因为它不想接受无cookie验证。 我认为最简单的方法是在web.config中更改以下内容,这会阻止FormsAuthentication尝试使用cookieless模式...
寇剩
暑袜眠退
。以下是标题检查的结果: 请求:http://bizup.cloudapp.net/robots.txt GET /robots.txt HTTP / 1.1 连接:保持活力 保持活力:300 接受:*/* 主持人:bizup.cloudapp.net 接受语言:en-us Accept-Encoding:gzip,deflate 用户代理:Mozilla / 5.0(兼容; Googlebot / 2.1; + http://www.google.com/bot.html) 服务器响应:500内部服务器错误 缓存控制:私有 内容类型:text / html;字符集= utf-8的 服务器:Microsoft-IIS / 7.0 X-AspNet-Version:4.0.30319 X-Powered-By:ASP.NET 日期:2010年8月19日星期四16:52:09 GMT 内容长度:4228 最终目的地页面 您可以在http://www.seoconsultants.com/tools/headers/#Report上测试标题
校勒魏寡
但是它不是在执行递归robots.txt调用吗? Sitemap应该是一个xml文件,请参阅Wikipedia