PHP-检测外部数据库驱动的站点中的更改

| 对于一个家庭作业项目,我正在创建一个PHP驱动的网站,其主要功能是汇总有关各种大学课程的新闻。 主要问题是:(几乎)每个课程都有自己的网站。这些通常只是纯HTML或使用一些简单的免费CMS系统构建而成。 作为一名学生,参加6-7个课程,几乎每天您都会通过6-7个网站检查是否有任何新闻。该项目背后的想法是,您不必这样做,而只需检查聚合站点。 我的想法如下:每次学生登录时,都要查看他的课程列表。对于每门课程,请访问它的网站(递归地使用wget),并为其创建一个哈希值。如果哈希值与存储在数据库中的哈希值不同,则我们知道该站点已更改,并通知学生。 那么,您认为这是实现功能的合理方法吗? 如果是的话,从技术上讲,最好的方法是什么?我正在检查php_curl,但我不知道它是否可以递归获取网站。 此外,还有一个小问题:我的资源有限,在公共(大学)服务器上只有几个MB的配额。但是,如果这是一个大问题,我可以使用单独的托管解决方案。 谢谢 :)     
已邀请:
        只需使用
file_get_contents
,或者如果绝对必须使用cURL(以防您需要COOKIES)。 您可以使用哈希技巧来检查修改,但这不是很优雅。您想知道的是它的上次更改时间。我怀疑这些信息是否在网站上,但也许他们提供了RSS源或一些可用于此目的的Web服务或API。 不必担心执行递归请求。每次都发出一个新请求。 \“当所有其他方法都失败时,请构建刮板\”     

要回复问题请先登录注册