Avantages et inconvénients de BigQuery vs. Amazon Redshift [fermé]
comparer Google BigQuery par rapport à Amazon Redshift montre que les deux peuvent répondre à la même série d'exigences, diffèrent principalement par les plans de coûts. Il semble que Redshift soit plus complexe à configurer (définition des clés et du travail d'optimisation) que Google BigQuery qui a peut-être un problème avec l'assemblage des tables.
y a-t-il une liste des avantages et des inconvénients de Google BigQuery contre Amazon Redshift?
2 réponses
j'ai posté cette comparaison sur reddit. Assez rapidement un praticien RedShift à long terme est venu pour commenter mes déclarations. S'il vous plaît voir https://www.reddit.com/r/bigdata/comments/3jnam1/whats_your_preference_for_running_jobs_in_the_aws/cur518e pour toute la conversation.
dimensionnement de votre grappe:
- Redshift vous demandera de choisir un nombre de CPU, RAM, HD, etc. et pour les activer.
- BigQuery s'en fiche. A utiliser quand vous voulez, pas de provisionnement nécessaire.
coûts horaires quand on ne fait rien:
- Redshift vous demandera de payer par heure de chacun de ces serveurs qui tournent, même si vous ne faites rien.
- lorsque BigQuery inactif vous charge seulement 0,02 $par mois par GO stocké. 2 cents par mois par GO, c'est tout.
Vitesse d'exécution des requêtes:
- la performance de Redshift est limitée par le montant des CPU que vous payez
- BigQuery apporte de manière transparente autant de ressources que nécessaire pour exécuter votre requête en quelques secondes.
Indexation:
- Redshift vous demandera d'indexer (correction: distribuer) vos données selon certains critères, et vous ne pourrez lancer que des requêtes rapides basées sur cet index.
- BigQuery n'a pas d'index. Chaque opération est rapide.
passez l'Aspirateur:
- le Redshift nécessite un entretien périodique et "vide" des opérations qui durent des heures. Vous payez pour chacun de ces serveur heures.
- BigQuery ne l'est pas. Oublie "passer l'aspirateur".
partitionnement et distribution des données:
- Redshift exige que vous réfléchissiez à la façon de distribuer des données dans vos serveurs pour maintenir la performance up - optimisation qui ne fonctionne que pour certaines requêtes.
- BigQuery ne l'est pas. Lancez juste la requête que vous voulez.
diffusion en direct données:
- Impossible(?) avec le Redshift.
- BigQuery manipule facilement jusqu'à 100 000 rangées par seconde par table.
faire croître votre grappe:
- si vous avez plus de données, ou plus d'utilisateurs concurrents mise à l'échelle sera douloureuse avec Redshift.
- BigQuery ne fera que fonctionner.
Multi zone:
- vous voulez un Redshift multi-zone pour la disponibilité et l'intégrité des données? Douloureux.
- BigQuery est multi-zoné par défaut.
pour essayer BigQuery vous n'avez pas besoin d'une carte de crédit ou n'importe quel temps d'installation. Il suffit de l'essayer ( instructions rapides pour essayer BigQuery