如何使数据输入过程自动化

| 我遇到一种情况,我需要访问100个奇怪的网站来收集联系信息,然后在自己的网站中输入此信息。我想知道的是,是否有可能编写程序或搜寻器(如果我正确输入的话)来获取所有这些信息。我猜这些信息将以非结构化html形式提供,然后我必须进行解析以使其结构化。任何人都有类似的经验。也想就所用语言发表意见。     
已邀请:
您正在寻找网络刮板。进行一些Google搜索后,应该会找到可以解决您问题的各种免费和商业产品。如果您要收集的数据相当简单且结构合理,则可能无需自己编写。     
试试ruby(机械化lib): http://mechanize.rubyforge.org/mechanize/GUIDE_rdoc.html 例如:
agent.get(\'http://someurl.com/\').search(\".//p[@class=\'posted\']\")
    

要回复问题请先登录注册