preguntar acerca de apache-pig

5
réponses

Quelle est la différence entre Apache Pig et Apache Hive?

Quelle est la différence exacte entre le porc et la ruche? J'ai découvert que les deux ont la même signification fonctionnelle parce qu'ils sont utilisés pour faire le même travail. La seule chose est l'implimentation qui est différente pour les deux …
demandé sur 1970-01-01 00:33:32
7
réponses

Comment puis-je Parser JSON dans Pig?

j'ai beaucoup de gzip avais des fichiers journaux dans s3 qui a 3 types de lignes de log: b,c,j'. i et c sont les deux seul niveau json: {"this":"that","test":"4"} gist on parle de compiler un bocal pour que ça marche. Comme mes compétences en j …
demandé sur 1970-01-01 00:33:31
4
réponses

Apache Pig: exécution parallèle et aplatie de réducteurs

j'ai implémenté un script de cochon Apache. Quand j'exécute le script, il en résulte de nombreux mappers pour une étape spécifique, mais n'a qu'un réducteur pour cette étape. En raison de cette condition (beaucoup de mappers, un réducteur) le cluster …
demandé sur 1970-01-01 00:33:33
10
réponses

Pig Latin: charger plusieurs fichiers à partir d’une plage de dates (fait partie de la structure du répertoire)

j'ai le scénario suivant - version porcine utilisée 0.70 exemple de structure de répertoire HDFS: /user/training/test/20100810/<data files> /user/training/test/20100811/<data files> /user/training/test/20100812/&l …
demandé sur 1970-01-01 00:33:30
4
réponses

Hadoop Pig: Passer Des Arguments En Ligne De Commande

Est-il un moyen de faire cela? par exemple, passer le nom du fichier à traiter, etc? ... …
demandé sur 1970-01-01 00:33:30
15
réponses

Quand utiliser Hadoop, HBase, Hive et Pig?

Quels sont les avantages d'utiliser soit Hadoop ou HBase ou Hive ? d'après ce que j'ai compris, HBase évite l'utilisation de map-reduce et dispose d'un stockage en colonne au-dessus de HDFS. Hive est une interface …
demandé sur 1970-01-01 00:33:32