从URL获取网站内容

| 我有一个网站,该网站与我的组织一起部署在服务器中,URL是 http://mysubsite.mysite.com/Folder1/Folder2/Default.aspx 是他们以任何方式可以读取文件夹中存在的所有页面的方式。喜欢资料夹1的内容还是资料夹2的内容?     
已邀请:
        可以使用wget(http://www.gnu.org/software/wget/)完成。 例如:wget -nc --page-conditions --domains mysubsite.mysite.com --no-parent mysubsite.mysite.com/Folder1/Folder2/ mysubsite.mysite.com/Folder1/Folder2/ -nc是无缓冲的,这意味着任何现有文件都不会被覆盖 --page-conditions将获取正确查看页面所需的所有内容(css文件等) --domains mysubsite.mysite.com将不会跟随mysubsite.mysite.com以外的任何链接 --no-parent:不要跟随目录/ Folder1 / Folder2 /外的链接 编辑:只需重新阅读您的问题-我认为您不希望使用递归标记。坚持使用--no-parent,这将使您可以在/ Folder1 / Folder2 /目录中获取所有内容。 高温超导     
        不,你不能。 当然,您可以按照其他人的建议使用wget,但是那样做不会做您想做的。它只会读取链接并收集可以找到的文件。 简而言之,客户端不知道服务器上有哪些文件,并且并非所有服务器都可以告诉它。     

要回复问题请先登录注册