Avantages de bases de données comme Greenplum ou Vertica par rapport à MongoDB ou Cassandra [fermé]

je suis actuellement en train de travailler quelques projets avec MongoDB et Apache Cassandra respectivement. J'utilise aussi beaucoup Solr et je manipule "beaucoup" de données avec eux (environ. 1-2 TO). J'ai entendu parler de Greenplum et Vertica la première fois la semaine dernière et je ne suis pas vraiment sûr, où les mettre dans mon cerveau. Ils me semblent comme Dataware House (DWH) solutions et je n'ai pas vraiment travaillé DWH. Et ils semblent coûter beaucoup d'argent (par exemple 60 K $pour 1 To de stockage à Greenplum). Je ne suis pas actuellement en train de gérer Petaoctet de données et ne le fera pas je pense, mais les produits comme cassandra semblent également être en mesure de gérer cela

Cassandra est le leader reconnu de NoSQL quand il s'agit de mise à l'échelle confortable en teraoctets ou petaoctets de données.

par http://www.datastax.com/why-cassandra

alors ma question: pourquoi les gens devraient utiliser Greenplum & Co? Est-il un énorme avantage par rapport à ces autres produits?

Merci.

13
demandé sur High6 2012-01-24 17:36:07

6 réponses

Cassandra, Greenplum et Vertica traitent tous d'énormes quantités de données, mais de façons très différentes.

certains ont créé des usecases où chaque base de données a ses points forts:

utilisez cassandra pour:

tweets.insert(key:user, data:blob);
tweets.get(key:user)

utilisez greenplum pour:

begin;
update account set balance = balance - 10 where account_id = 1;
update account set balance = balance + 10 where account_id = 2;
commit;

utilisez Vertica pour:

select sum(balance)
over (partition by region order by account rows unbounded preceding)
from transactions;
41
répondu serbaut 2012-02-17 23:40:01

je travaille dans l'industrie des télécommunications. Nous traitons de grands ensembles de données et des modèles complexes EDW(enterprise data warehouse).Nous avons commencé avec Teradata et C'était bien pendant quelques années. Puis les données ont augmenté de façon exponentielle, et comme vous le savez, l'expansion en Teradata est chère. Nous avons donc évalué EMCs notamment green plum, oracle exadata, HP Vertica et IBM netteza.

en vitesse, génération de 20 rapports est allé comme ceci: 1. Vertica, 2. Netteza, 3. prune verte, 4. oracle

dans taux de compression: Vertica avait un avantage naturel. Entre autres IBM est bon aussi. Le pire selon les normes emc et oracle. Comme toujours prévu car ses deux veulent vendre tonne de stockage et de matériel.