自动浏览复杂的网页

| 我有一个项目,其中涉及复杂网页的大量自动化。 我知道这里有Mechanize和Beautiful Soup,但是当处理大量DOM脚本和您在复杂网页上发现的其他怪异内容时,这些功能是否不会中断? 我想我基本上想要一个运行WebKit的准系统实例,该实例允许我执行“ GUI脚本”或访问DOM。有想法吗?     
已邀请:
        使用PhantomJS尝试Sahi。 Sahi是浏览器自动化工具,而PhantomJS是无头Webkit浏览器。您可以在此处找到设置说明:http://sahi.co.in/w/sahi-headless-execution-with-phantomjs 免责声明:我们创建了Sahi产品。     
        您在哪个平台上工作?您打算使用哪种语言? Adobe Air让您将Webkit嵌入到Air应用程序中并与页面JavaScript进行交互(页面JS与AIR运行时之间存在双向通信)。 否则,如果您不受限于Webkit,则可以试用Mozilla Chromeless。 我很抱歉,如果这一切都不做您需要做的事情,我无法完全弄清您到底想做什么(页面抓取,提交表格?)。     
        对于测试/抓取,我会尝试: 硒 EnvJS 风车 瓦蒂尔 沙希 网络测试     

要回复问题请先登录注册