ElasticSearch + Cassandra的实际限制

| 我计划使用ElasticSearch索引我的Cassandra数据库。我想知道是否有人看到过ElasticSearch的实际限制。在PB范围内事情变慢吗?此外,有人使用ElasticSearch索引Cassandra是否有任何问题?     
已邀请:
        请参阅2011年的这篇文章,其中提到了带有1700个分片(每个200GB)的ElasticSearch配置,该分片的范围为1/3 PB。我希望ElasticSearch的体系结构将支持几乎无限的水平可伸缩性,因为每个分片索引都与所有其他分片分开工作。 实际限制(也适用于任何其他解决方案)包括首先实际加载大量数据所需的时间。管理这样大小的Cassandra集群(或任何其他分布式数据存储)也将涉及大量的工作负载,仅用于维护,负载平衡等。     
        Sonian是kimchy在该主题中提到的公司。我们在多个ES集群上的AWS上超过PB。对ES的水平缩放范围没有技术限制,但是正如DNA所述,这存在实际问题。迄今为止最大的是网络。它适用于每个分布式数据存储。一次只能跨电线移动这么多。当ES必须从故障中恢复时,它必须移动数据。最好的选择是在更多的节点上使用较小的碎片(更多的并发传输),但是您将面临更高的失败率和每字节高昂的成本。     
        正如DNA提到的,有1700个分片,但不是1700个分片,而是有1700个索引,每个索引有1个分片和1个副本。因此,很可能这些1700索引不存在于单台计算机上,而是分散在多台计算机上。 所以这绝不是问题     
        我目前正在与Elisandra合作(Elasticsearch + Cassandra) 我也有问题,用elasticsearch为Cassandra编制索引。我的问题基本上是节点配置。 做
$ nodetool status
,您会看到
Host ID
,然后毁了:
curl -XGET http://localhost:9200/_cluster/state/?pretty=true
您可以检查ѭ​​3ѭ之一与
Host ID
同名     

要回复问题请先登录注册