preguntar acerca de hadoop
réponses
Le formatage du code de nom Hadoop 3.2.1 ne fonctionne pas
J'ai [ce qui ressemble à] le même problème avec le formatage du namenode Hadoop 3.2.1
Par demande pour poser cette question comme une nouvelle question, et fournir également plus de détails:
Cela se produit sur un bureau, Windows 10, 64 bits, t …
demandé sur
1970-01-01 00:00:00
réponses
Pourquoi Hadoop n’est-il pas un entrepôt de données ?
Quelles sont les raisons fonctionnelles pour lesquelles Hadoop ne peut pas être un entrepôt de données
Sur plusieurs sites, on peut voir des instructions indiquant qu'un cluster Hadoop ne remplace pas un entrepôt de données traditionnel. Cependant, …
demandé sur
1970-01-01 00:00:00
13
réponses
Enchaîner plusieurs emplois MapReduce dans Hadoop
Dans de nombreuses situations réelles où vous appliquez MapReduce, les algorithmes finaux finissent par être plusieurs étapes MapReduce.
C'est-à-dire Map1, Reduce1, Map2, Reduce2, et ainsi de suite.
Vous avez donc la sortie de la dernière réduction …
demandé sur
1970-01-01 00:33:30
5
réponses
Différence entre HBase et Hadoop/HDFS
C'est une question un peu naïve mais je suis nouveau dans le paradigme NoSQL et je n'en sais pas grand-chose. Donc, si quelqu'un peut m'aider à comprendre clairement la différence entre HBase et Hadoop ou si donner des conseils qui pourraient m'aider …
demandé sur
1970-01-01 00:33:33
9
réponses
Quel est le but de mélanger et de trier la phase dans le réducteur dans la programmation Map Reduce?
Dans la programmation Map Reduce, la phase reduce a été mélangée, triée et réduite comme sous-parties. Le tri est une affaire coûteuse.
Quel est le but de mélanger et de trier la phase dans le réducteur dans la programmation Map Reduce? ... …
demandé sur
1970-01-01 00:33:34
8
réponses
Spark-charger le fichier CSV en tant que DataFrame?
Je voudrais lire un CSV dans spark et le convertir en DataFrame et le stocker dans HDFS avec df.registerTempTable("table_name")
J'ai essayé:
scala> val df = sqlContext.load("hdfs:///csv/file/dir/file.csv")
Erreur que j'ai eu:
java.lang.Runt …
demandé sur
1970-01-01 00:33:35
3
réponses
Quels sont les avantages et les inconvénients du format de parquet par rapport aux autres formats?
Les caractéristiques D'Apache Parquet sont:
Auto-décrivant
Format colonnaire
indépendant de la Langue
Par rapport à Avro, fichiers de séquence, fichier RC, etc. Je veux un aperçu des formats. J'ai déjà lu: Comment fonctionne Impala avec les …
demandé sur
1970-01-01 00:33:36
24
réponses
Comment connaître les versions Hive et Hadoop à partir de l’invite de commande?
Comment puis-je trouver la version de la ruche que j'utilise à partir de l'invite de commande. Voici les détails -
J'utilise Putty pour me connecter à la table hive et accéder aux enregistrements dans les tables. Donc, ce que j'ai fait est-j'ai ouv …
demandé sur
1970-01-01 00:33:32
9
réponses
Où Hive stocke-t-il les fichiers dans HDFS?
J'aimerais savoir comment trouver le mappage entre les tables Hive et les fichiers HDFS réels (ou plutôt, les répertoires) qu'ils représentent. J'ai besoin d'accéder directement aux fichiers de la table.
Où Hive stocke-t-il ses fichiers dans HDFS? . …
demandé sur
1970-01-01 00:33:31
14
réponses
erreur de mémoire insuffisante dans Hadoop
J'ai essayé d'installer Hadoop en suivant ceci http://hadoop.apache.org/common/docs/stable/single_node_setup.html document.
Quand j'ai essayé d'exécuter ceci
bin/hadoop jar hadoop-examples-*.jar grep input output 'dfs[a-z.]+'
Je reçois l'Excep …
demandé sur
1970-01-01 00:33:31