Pentaho vs Microsoft BI Stack [fermé]

mon entreprise est fortement investi dans la pile MS BI (services de rapports de Serveur SQL, - services D'analyse et-services D'intégration), mais je veux avoir un oeil à ce que le apparemment le plus parlé de Pentaho open-source alternative est comme.

j'ai installé une version, et je l'ai mise en marche sans douleur. Donc c'est bien. Mais je n'ai pas vraiment le temps de commencer à l'utiliser pour le travail réel pour obtenir une compréhension approfondie de l'emballage.

ayez l'un de vous avez-vous des idées sur les avantages et les inconvénients de Pentaho vs MS BI, ou des liens vers de telles comparaisons?

Beaucoup apprécié!

35
demandé sur Dustin Brooks 2008-09-30 01:36:38

9 réponses

j'ai passé en revue plusieurs piles de Bi alors que j'étais sur un chemin pour me débarrasser d'objets professionnels. Beaucoup de mes commentaires sont de préférence. Les deux ensembles d'outils sont excellents. Il y a des choses que je préfère à la glace au chocolat plutôt qu'au chocolat.

Pentaho a quelques gars très intelligents qui travaillent avec eux, mais Microsoft a été sur une voie bien financée et bien planifiée. Gardez à l'esprit que les MS sont toujours les perdants sur le marché des bases de données. Oracle est roi ici. Pour être compétitif MS a donné loin beaucoup de bonnes choses quand vous achetez la base de données et ont été forcés de réinventer leur plate-forme à quelques reprises. Je sais que ce n'est pas à propos de la base de données, mais la bataille de DB a fait que MS donne beaucoup afin d'ajouter de la valeur à leur pile.

1. La plate -

SQL server ne fonctionne pas sous Unix ou Linux, ils sont donc automatiquement exclus de ce marché. Windows est à peu près le même prix que certaines versions ou Unix maintenant. Windows est assez bon marché et fonctionne très mal maintenant. Ça me pose autant de problèmes que Linux.

2.) OLAP

Les services d'analyse ont été réinventés en 2005 (current is 2008) par rapport à la version de 2000. C'est un ordre de magnatude plus puissant sur 2000. Le pentaho (Mondrian) n'est pas aussi rapide Une fois que vous devenez grand. Il a aussi quelques fonctionnalités. Il est assez bon, mais il ya moins dans la voie des outils. Tous deux supportent Excel comme plate-forme essentielle. La version MS est plus robuste.

3.) ETL

Le MS-DTS a été remplacé par le SSIS. Encore une fois, l'ordre de magnatude augmente la vitesse, la puissance et la capacité. Il contrôle tous les mouvements de données ou le contrôle de programme. S'il ne peut pas le faire, vous pouvez écrire un script dans Powershell. Sur un pied d'égalité avec Informatica dans la version 2008. Pentaho - Beaucoup mieux que ce qui est utilisé pour être. Pas aussi vite que je le voudrais, mais je peux faire tout ce que je veux.

4.) tableau de bord

Pentaho a amélioré cela. C'est une sorte de mal à l'aise et peu amical de se développer, mais il n'y a vraiment pas d'equiv pour MS

5.) les rapports

MS reports est vraiment puissant, mais pas si difficile à utiliser. Je l'aime maintenant, mais détesté au début, jusqu'à ce que j'ai appris à la connaître un peu mieux. J'avais utilisé crystal reports et le MS report builder est beaucoup plus puissant. Il est facile de faire des choses difficiles dans la SEP, mais un peu plus difficile de faire des choses faciles. Pentaho est un peu maladroit. Je ne l'aimais pas du tout, mais vous pourriez. Je l'ai trouvé trop complexe. J'aimerais que ce soit plus comme le Crystal report builder ou le MS report builder, mais c'est comme jasper. J'ai trouver est d'être dur. Que peut être une préférence.

6.) ad hoc!--5-->
MS - c'était le vrai gagnant pour moi. Je l'ai testé avec mes utilisateurs et ils instantanément en amour avec le MS User report builder. Ce qui a fait la différence, c'est qu'il n'était pas seulement facile à utiliser, mais aussi productif. Pentaho - est bon, mais assez vieille école. Il utilise le plus typique modèle de magicien basé et a des outils puissants, mais je déteste. C'est un excellent outil pour ce qu'il est, mais nous avons passé de ce style, et personne ne veut revenir en arrière. Le même problème que j'ai eu avec logiXML. L'interface a bien fonctionné pour ce qu'elle était mais n'est pas vraiment un changement par rapport à ce que nous avons utilisé 12 ans. http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of+Interactive+Reporting

il y a des gens expérimentés qui peuvent faire du Pentaho vraiment bien courir, je viens de trouver la suite MS pour être plus productif.

51
répondu Stradas 2008-10-01 17:01:10

avertissement -- il y a de nombreux sites dehors énumérant les nombreuses déficiences, les bogues, et les nuisances avec SSIS. Je ne suis pas sûr de savoir pourquoi les petites industries de la santé ont pris le dessus avec le post -- mais avant que vous pariez votre projet dessus, regardez ce que les gens ont à dire dans la blogosphère. D'après mon expérience, il est environ 20:1 à se plaindre de la façon horrible avec laquelle les petites industries du Sud travaillent--je peux être d'accord aussi, actuellement à la recherche de n'importe quelle alternative.

8
répondu alchemical 2009-04-04 23:16:33

grande information ici? Je n'ai pas essayé le Pentaho mais j'ai l'intention de le vérifier. Je suis une consultante chevronnée de MS BI, qui l'utilise depuis 1998. Les petites entreprises de transformation sont très rapides et très puissantes, mais les critiques sont nettes. J'ai trouvé les questions suivantes avec SSIS:

(1) Il est difficile de déboguer, vous obtenez des erreurs cryptiques qui peuvent ne pas vous donner d'indication sur quoi et où le problème est réellement.

(2) Selon un commentaire antérieur, c'est l'environnement de développement le plus merdique de tous les temps! Je n'ont aucune idée de ce qu'ils pensent.

(a) créer une table avec 100 colonnes ou plus et y mettre une jointure de fusion. Allez maintenant, et essayez de faire une mise à jour de la jointure de fusion (comme tirer une nouvelle colonne à travers). Cela peut prendre plusieurs minutes, même sur la machine la plus rapide après avoir cliqué sur ok sur la jointure de la fusion pour enregistrer votre changement. J'ai un énorme flux de données, avec beaucoup de grande enregistrements et de nombreuses jointures de fusion. Ajouter une colonne pour le flux de données prend plus d'une demi-journée. Je mets à jour une fusion et puis il faut faire autre chose et revenir 5-10 minutes plus tard pour voir si c'est fait. La réponse de Microsoft à cela est de décomposer votre paquet en plusieurs paquets, placer les données dans une table ou binaire entre eux. Eh bien, si vous allez à disque entre toutes les étapes, vous pouvez bien faire toute la chose en SQL! L'un des principaux objectifs d'un outil ETL est de tout cela en mémoire et d'éviter les entrées/sorties de disque

(b) le concepteur s'écrase parfois, perdant tout votre travail depuis la dernière sauvegarde (je fais ctrl-S dans mon sommeil maintenant, à cause de cela)

(c) j'ai dû trouver un hack et générer un paquet SSIS XML dans Excel pour les wide records. J'ai un client de soins de santé où plus de 600 dossiers de colonne sont courants. Si vous essayez de définir un format de fichier avec 600 colonnes dans SSIS, vous devez taper chaque colonne à la fois!!! Même MS access vous permet de couper et coller une mise en page à partir d'un tableur dans une mise en page de fichier, mais pas SSIS. J'ai donc dû générer le XML à partir de la mise en page et coller le code XML au bon endroit dans le paquet. Laid façon de le faire mais il a sauvé des journées entières de travail et beaucoup d'erreurs.

(d) similaire à (c), si vous avez besoin de couper toutes vos colonnes et vous avez dire 600+ d'entre eux, devinez quoi? Dans le composant de colonne dérivé, vous devez taper trim (column1) 600+ fois! Je fais maintenant toutes les transformations simples comme ceci dans la requête SQL pour obtenir les données, puisque cela peut facilement être généré à partir d'une feuille Excel.

(e) Il y a il y a beaucoup de choses étranges, des composants qui deviennent invisibles, parfois vous ouvrez le paquet et tous les composants sont complètement réorganisés de manière incohérente.

(f) la fonctionnalité FTP, probablement l'une des choses les plus courantes dont vous avez besoin dans ETL, est faible et ne supporte que le simple FTP vanille que personne n'utilise. Tout le monde ces jours-ci utilise SFTP, FTPS, https, etc... Ainsi, presque chaque mise en œuvre nécessite l'utilisation d'une application de transfert de fichiers pilotée par la ligne commend d'une tierce partie. appeler.

(g) en essayant de CYA, similaire à la sécurité ridicule de Windows Vista, Microsoft a rendu extrêmement difficile de promouvoir réellement un paquet SSIS d'un environnement à l'autre. Il est par défaut à cette chose stupide de "cryptage des informations sensibles avec clé utilisateur" de sécurité qui signifie qu'il doit fonctionner sous le même compte dans l'environnement où vous le déplacez comme l'environnement que vous l'avez développé, quelque chose qui est rarement le cas. Il y a de meilleures façons de configurer mais il essaie toujours de revenir à cette protection de sécurité complètement inutile.

(h) enfin la plupart de ces problèmes sont maintenant dans la 3ème version, ce qui indique clairement Microsoft n'a pas le plan de les corriger.

(i) le débogage n'est pas aussi simple que les autres langues.

SSIS a encore beaucoup d'avantages, mais pas sans une douleur sérieuse.

7
répondu Lee 2011-11-29 22:24:40

j'ai commencé à utiliser MS Reporting Services il y a de nombreuses années et j'adore ça. Je n'ai pas essayé la solution de rapport de Penaho donc je ne peux pas le commenter. Je n'ai pas non plus essayé les services D'analyse ou L'alternative de Pentaho.

récemment, j'ai eu besoin d'une solution ETL et étant familier avec MSSQL et MSRS, il me semblait évident que je passerais en revue et choisirais probablement MS Integration Service. Mais pour moi, le MSIS était horrible. Surtout parce que ce n'était pas intuitif. Après avoir passé quelques jours à essayer pour apprendre l'outil j'ai décidé de chercher une alternative et suis tombé sur Pentaho Data Integration, anciennement connu sous le nom de Kettle. Je l'ai fait fonctionner en quelques minutes et j'ai immédiatement créé ma première transformation. Il fonctionne, tout simplement.

certes, mes besoins sont assez simples mais la performance a été grande et la communauté semble très utile.

4
répondu Gary Brunton 2008-11-02 04:53:27

j'ai utilisé SSIS et Pentaho Kettle, et je recommande fortement L'utilisation Pentaho Kettle pour votre outil ETL au lieu de SSIS.

Mes raisons: - le flux des SSI est de tâche en tâche. Kettle vous fait penser à des rangées de données circulant dans le système. L'approche de Kettle me semble beaucoup plus intuitive. -Le SSIS est mal documenté. Ce qui se passe. Mais il semble y avoir beaucoup de cliquetis et de réglages de variables. Très complexe. Pentaho a un forum communautaire qui est tout à fait utile. - Je fais confiance à Pentaho pour intégrer plusieurs types de bases de données, y compris SQL Server. Vous pouvez également utiliser JDBC qui est agréable. Aussi, je l'ai utilisé pour aller entre SQL Server et Oracle d'un côté et Vertica de l'autre. Il possède un bloc chargeur sur Vertica. C'est assez agréable. -J'ai trouvé très, très difficile relativement parlant de faire tourner un paquet SSIS sur un serveur. Il n'était tout simplement pas la peine de mon temps. - J'ai trouvé assez facile pour Pentaho de poster un message d'avertissement ou d'erreur à un personne ou liste de personnes. - Pentaho permet des tâches à faire en JavaScript pour les choses qui ont besoin d'une certaine logique. Simple et facile à faire avec un langage que la plupart d'entre nous ont rencontré.

4
répondu geoffrobinson 2011-04-15 15:48:52

Je ne peux pas donner d'entrée sur la pile MS BI mais à la plus récente Barcamp Orlando, les gens de Pentaho étaient là et ont parlé de leurs produits et c'était une démo extrêmement impressionnante.

le fait qu'il s'agisse d'un projet Open Source que vous pouvez étendre vous-même ainsi qu'un forfait payé pour un très bon service vous laisse avec beaucoup d'options. Ils ont fait des travaux rémunérés pour un client et ils ont vraiment foule.

j'ai aussi eu l'occasion de discuter un peu avec un développeur travaillant sur le côté stockage de données pour Pentaho et il était extrêmement pointu et très ouvert aux suggestions et n'a eu aucun problème à répondre à toutes les questions.

en ce qui concerne une entreprise, Pentaho m'a vraiment impressionné avec leur travail et à quel point tous leurs développeurs étaient amicaux et accessibles.

3
répondu mwilliams 2008-10-01 14:56:10

quelques points à ajouter

  • bien qu'il existe une version Windows de tous les outils Pentaho, la configuration de windows est onéreuse. Pentaho (en particulier le serveur start and stop qui est séparé de L'outil GUI) est généralement utilisé sous Linux, pas windows shop, et il y a une courbe d'apprentissage abrupte allant de Windows à Linux.
  • aucun outil a une courbe d'apprentissage lorsque vous déplacez. quand vous vous habituez à toujours cliquer OK et rafraîchir les métadonnées quand vous avez des problèmes, Le SSIS n'est pas si mauvais. Le Pentaho peut être bizarre aussi.

les questions sur les outils doivent être traitées en termes de questions culturelles plus larges - quels types de magasins utilisent les outils de logiciels libres? dans mon expérience, j'ai constaté que bien que les magasins Microsoft semblent plus rigides, quand vous avez des problèmes avec une chaîne de connexion dans un magasin Microsoft, vous pouvez obtenir de l'aide.. dans les magasins Pentaho et Linux son plus DYI.

BTW, regarder dehors pour Pentaho ventes gars faire des démos - toutes les choses qui montrent qu'ils sont un c'est plus dur de travailler qu'il n'y paraît! :)

3
répondu gnackenson 2012-04-26 18:35:31

si vous êtes à la recherche d'une alternative robuste et économique à la LogiXML big boys, dashboarding et ad hoc reporting sont disponibles sur une plateforme .NET. Nous les utilisons depuis la fin de 2006, quand Pentaho commençait à peine, mais je ne l'ai pas regardé depuis un moment.

0
répondu 2008-10-30 22:38:32

j'ai récemment essayé pentaho open source BI. Je l'ai trouvé extrêmement maladroite. Ce n'était pas très intuitif et le temps de développement a été beaucoup plus long.

c'est très différent des solutions Oracle ou ms BI. Peut-être que l'édition enterprise est mieux.

0
répondu q Tran 2012-12-14 02:08:00