Avantages et inconvénients de BigQuery vs. Amazon Redshift [fermé]

comparer Google BigQuery par rapport à Amazon Redshift montre que les deux peuvent répondre à la même série d'exigences, diffèrent principalement par les plans de coûts. Il semble que Redshift soit plus complexe à configurer (définition des clés et du travail d'optimisation) que Google BigQuery qui a peut-être un problème avec l'assemblage des tables.

y a-t-il une liste des avantages et des inconvénients de Google BigQuery contre Amazon Redshift?

16
demandé sur user2339344 2014-10-13 16:58:44

2 réponses

j'ai posté cette comparaison sur reddit. Assez rapidement un praticien RedShift à long terme est venu pour commenter mes déclarations. S'il vous plaît voir https://www.reddit.com/r/bigdata/comments/3jnam1/whats_your_preference_for_running_jobs_in_the_aws/cur518e pour toute la conversation.

dimensionnement de votre grappe:

  • Redshift vous demandera de choisir un nombre de CPU, RAM, HD, etc. et pour les activer.
  • BigQuery s'en fiche. A utiliser quand vous voulez, pas de provisionnement nécessaire.

coûts horaires quand on ne fait rien:

  • Redshift vous demandera de payer par heure de chacun de ces serveurs qui tournent, même si vous ne faites rien.
  • lorsque BigQuery inactif vous charge seulement 0,02 $par mois par GO stocké. 2 cents par mois par GO, c'est tout.

Vitesse d'exécution des requêtes:

  • la performance de Redshift est limitée par le montant des CPU que vous payez
  • BigQuery apporte de manière transparente autant de ressources que nécessaire pour exécuter votre requête en quelques secondes.

Indexation:

  • Redshift vous demandera d'indexer (correction: distribuer) vos données selon certains critères, et vous ne pourrez lancer que des requêtes rapides basées sur cet index.
  • BigQuery n'a pas d'index. Chaque opération est rapide.

passez l'Aspirateur:

  • le Redshift nécessite un entretien périodique et "vide" des opérations qui durent des heures. Vous payez pour chacun de ces serveur heures.
  • BigQuery ne l'est pas. Oublie "passer l'aspirateur".

partitionnement et distribution des données:

  • Redshift exige que vous réfléchissiez à la façon de distribuer des données dans vos serveurs pour maintenir la performance up - optimisation qui ne fonctionne que pour certaines requêtes.
  • BigQuery ne l'est pas. Lancez juste la requête que vous voulez.

diffusion en direct données:

  • Impossible(?) avec le Redshift.
  • BigQuery manipule facilement jusqu'à 100 000 rangées par seconde par table.

faire croître votre grappe:

  • si vous avez plus de données, ou plus d'utilisateurs concurrents mise à l'échelle sera douloureuse avec Redshift.
  • BigQuery ne fera que fonctionner.

Multi zone:

  • vous voulez un Redshift multi-zone pour la disponibilité et l'intégrité des données? Douloureux.
  • BigQuery est multi-zoné par défaut.

pour essayer BigQuery vous n'avez pas besoin d'une carte de crédit ou n'importe quel temps d'installation. Il suffit de l'essayer ( instructions rapides pour essayer BigQuery