preguntar acerca de hadoop

réponses

Le formatage du code de nom Hadoop 3.2.1 ne fonctionne pas

J'ai [ce qui ressemble à] le même problème avec le formatage du namenode Hadoop 3.2.1 Par demande pour poser cette question comme une nouvelle question, et fournir également plus de détails: Cela se produit sur un bureau, Windows 10, 64 bits, t …
demandé sur 1970-01-01 00:00:00
réponses

Pourquoi Hadoop n’est-il pas un entrepôt de données ?

Quelles sont les raisons fonctionnelles pour lesquelles Hadoop ne peut pas être un entrepôt de données Sur plusieurs sites, on peut voir des instructions indiquant qu'un cluster Hadoop ne remplace pas un entrepôt de données traditionnel. Cependant, …
demandé sur 1970-01-01 00:00:00
13
réponses

Enchaîner plusieurs emplois MapReduce dans Hadoop

Dans de nombreuses situations réelles où vous appliquez MapReduce, les algorithmes finaux finissent par être plusieurs étapes MapReduce. C'est-à-dire Map1, Reduce1, Map2, Reduce2, et ainsi de suite. Vous avez donc la sortie de la dernière réduction …
demandé sur 1970-01-01 00:33:30
5
réponses

Différence entre HBase et Hadoop/HDFS

C'est une question un peu naïve mais je suis nouveau dans le paradigme NoSQL et je n'en sais pas grand-chose. Donc, si quelqu'un peut m'aider à comprendre clairement la différence entre HBase et Hadoop ou si donner des conseils qui pourraient m'aider …
demandé sur 1970-01-01 00:33:33
9
réponses

Quel est le but de mélanger et de trier la phase dans le réducteur dans la programmation Map Reduce?

Dans la programmation Map Reduce, la phase reduce a été mélangée, triée et réduite comme sous-parties. Le tri est une affaire coûteuse. Quel est le but de mélanger et de trier la phase dans le réducteur dans la programmation Map Reduce? ... …
demandé sur 1970-01-01 00:33:34
8
réponses

Spark-charger le fichier CSV en tant que DataFrame?

Je voudrais lire un CSV dans spark et le convertir en DataFrame et le stocker dans HDFS avec df.registerTempTable("table_name") J'ai essayé: scala> val df = sqlContext.load("hdfs:///csv/file/dir/file.csv") Erreur que j'ai eu: java.lang.Runt …
demandé sur 1970-01-01 00:33:35
3
réponses

Quels sont les avantages et les inconvénients du format de parquet par rapport aux autres formats?

Les caractéristiques D'Apache Parquet sont: Auto-décrivant Format colonnaire indépendant de la Langue Par rapport à Avro, fichiers de séquence, fichier RC, etc. Je veux un aperçu des formats. J'ai déjà lu: Comment fonctionne Impala avec les …
demandé sur 1970-01-01 00:33:36
24
réponses

Comment connaître les versions Hive et Hadoop à partir de l’invite de commande?

Comment puis-je trouver la version de la ruche que j'utilise à partir de l'invite de commande. Voici les détails - J'utilise Putty pour me connecter à la table hive et accéder aux enregistrements dans les tables. Donc, ce que j'ai fait est-j'ai ouv …
demandé sur 1970-01-01 00:33:32
9
réponses

Où Hive stocke-t-il les fichiers dans HDFS?

J'aimerais savoir comment trouver le mappage entre les tables Hive et les fichiers HDFS réels (ou plutôt, les répertoires) qu'ils représentent. J'ai besoin d'accéder directement aux fichiers de la table. Où Hive stocke-t-il ses fichiers dans HDFS? . …
demandé sur 1970-01-01 00:33:31
14
réponses

erreur de mémoire insuffisante dans Hadoop

J'ai essayé d'installer Hadoop en suivant ceci http://hadoop.apache.org/common/docs/stable/single_node_setup.html document. Quand j'ai essayé d'exécuter ceci bin/hadoop jar hadoop-examples-*.jar grep input output 'dfs[a-z.]+' Je reçois l'Excep …
demandé sur 1970-01-01 00:33:31