如何使用r在google scholar上下载搜索结果？

我想用R提取Google Scholar搜索的前100个结果（比如说）。有谁知道怎么做？确切地说，我只需要论文的名称，作者和引文数。这是合法的吗？

已邀请:

5 个回复

倪蕊悲潍

请考虑更新的biobucket帖子： http://thebiobucket.blogspot.com/2011/11/r-function-google-scholar-webscraper.html

俯乡骚钵皆

有一些Python和Perl刮刀你可能能够适应，链接在http://bmb-common.blogspot.com/2011/02/does-google-scholar-suck-or-am-i-just html的

掸牛浓疗

我无法谈论你的任务的合法性，但有几种方法可以解决这个问题。虽然我在XPath中不强，但它可能是最好的方法。我相信您可以使用XML包来检索页面内容并使用XPath来提取所需元素的数据。例如，我使用Chrome浏览器浏览器，当我使用开发人员工具检查页面时，页面上似乎有一个结构，数据“隐藏”在各种标签内，您应该能够轻松地利用它们XPath的。查看此链接以获取使用XPath的示例。 HTH和好运

味芯憨

你绝对可以使用RCurl检索页面的HTML内容，并按照Btibert3的建议使用RXML解析它们。您可能面临的唯一问题是Google不允许您以“机器人”方式进行查询。在短时间内在谷歌进行200次查询之后，它将不再返回结果。也许与Google学术搜索有所不同，但我对此表示怀疑......

信藉乒

最近发布了一个解决方案： http://thebiobucket.blogspot.com/2011/11/visually-examine-google-scholar-search.html

要回复问题请先登录或注册

如何使用r在google scholar上下载搜索结果？

5 个回复

发起人

google_scholar

问题状态

如何使用r在google scholar上下载搜索结果？

与内容相关的链接

5 个回复

发起人

google_scholar

问题状态