免费的大数据集来试验Hadoop
你知道任何大型数据集来试验免费/低成本的Hadoop吗?
任何相关的指针/链接都表示赞赏。
Prefernce:
至少一GB的数据。
Web服务器的生产日志数据。
到目前为止我发现的很少:
维基百科转储
http://wiki.freebase.com/wiki/Data_dumps
http://aws.amazon.com/publicdatasets/
我们也可以运行自己的抓取工具从网站收集数据,例如维基百科?关于如何做到这一点的任何指针也受到赞赏。
没有找到相关结果
已邀请:
4 个回复
敦肌
破弯
澜悍景哭苟
揽芳僵迷仇