Quels sont les cas d'utilisation pour utiliser Elasticsearch par rapport aux requêtes sql standard?

je suis juste en train de commencer avec Elasticsearch et l'un des principaux cas d'utilisation que j'ai vu est son évolutivité avec des recherches sur de grands ensembles de données, mais en plus de cela quand voudriez-vous l'utiliser plus de juste créer des requêtes sql avec un RDBMS traditionnel?

81
demandé sur Kevin Ghaboosi 2015-10-22 17:38:58

2 réponses

il existe deux cas d'utilisation de L'Elasticsearch primaire:

  1. recherche textuelle

Vous voulez Elasticsearch lorsque vous faites beaucoup de recherche de texte, où les SGBD bases de données ne sont pas performants vraiment bien (mauvaise configuration, agit comme une boîte noire, une mauvaise performance). Elasticsearch est hautement personnalisable, extensible par des plugins. Vous pouvez construire la recherche robuste sans beaucoup de connaissances assez rapidement.

  1. enregistrement et d'analyse

un autre cas de bord est que beaucoup de gens utilisent Elasticsearch pour stocker des grumes provenant de diverses sources (pour les centraliser), de sorte qu'ils peuvent les analyser et faire sens hors de lui. Dans ce cas, Kibana devient pratique. Il vous permet de vous connecter à Elasticsearch cluster et de créer des visualisations immédiatement. Par exemple, Loggly est construit en utilisant Elasticsearch et Kibana.

gardez à l'esprit que vous ne voudriez pas utiliser Elasticsearch comme votre stockage de données principal. Raisons ici: comment fiable est ElasticSearch comme un datastore primaire contre des facteurs comme la perte d'écriture, la disponibilité des données

mise à Jour

j'ai eu l'impression que la deuxième partie n'est plus énervante, c'est en fait ce Qu'Elastic as a company a fait vraiment bien au cours de la dernière année. Avec le mouvement actuel de DevOps, les pipelines de CI/CD, la quantité croissante de mesures de diverses sources, ELK est devenu un choix de fait pour la surveillance de l'infrastructure, il n'est plus seulement un texte distribué RESTful-moteur de recherche. Il a un ensemble étonnant de produits:

  • Logstash (tonnes of data inputs)
  • Beats
    • Filebeat
    • Metricbeat
    • Packetbeat
    • Winlogbeat
  • Kibana
    • Graphique
    • Timelion
  • X-Pack (premium)
    • alertes
    • Reporting
    • sécurité
    • Apprentissage Machine
    • Croix de centre de données métriques

un écosystème, construit par la communauté, est en croissance autour de la pile de wapitis qui élargit les caractéristiques actuelles, peu d'entre eux valent la peine de mentionner:

  • ElastAlert
  • "151930920 De La Recherche" De Garde
59
répondu Evaldas Buinauskas 2018-03-23 06:18:41

pour ajouter à l'autre réponse, la journalisation est toujours un cas d'utilisation majeure ainsi que des recherches, mais maintenant les mesures et les analyses deviennent plus importantes.

je crois que ce billet résume les changements sur le marché qui sont à l'origine des nouveaux cas d'utilisation du Big Data. Tout ce que vous devez savoir sur les Bases de données Open Source

avec L'avènement du Web 2.0, les pages Web statiques sont devenues dynamiques et les médias sociaux nous entourent. Tout le monde tweete, postant, les blogs, vlogging, partage de photos, de chat et de la commenter. Le L'Internet des objets (IoT) est en train d'émerger - un réseau les dispositifs connectés qui recueillent et échangent des données, tels que des capteurs et appareils intelligents. Il ya quelques grands exemples.

au total, ce génère d'énormes quantités de données que les entreprises veulent absorber et utilisez pour rester à l'avant, pour fournir des fonctionnalités telles que recommandations de produits et une meilleure expérience client. Les données peuvent être analysées à la recherche des modèles pour des applications telles que la détection de la fraude et comportement Analytics. Beaucoup de nouvelles données non structurées, ce qui signifie qu'il ne peut pas être soigneusement conservé dans une base de données tabulaire.

imaginez essayer de concevoir une base de données pour stocker des données sur vos achats d'épicerie - ce que vous aimez, comment souvent vous de l'acheter, si vous préférez le lait ou la crème avec votre café. De nouveaux types de les bases de données sont nécessaires pour stocker les nouvelles données, et ils ont besoin de être non relationnelle et idéalement peu coûteuse. Sonner les cloches? Pas relationnel comme dans NoSQL et à faible coût comme dans open source.

l'un des architectes Elasticsearch avec qui j'ai parlé a déclaré que 80% des données Elasticsearch fonctionne avec dans les entreprises est non structuré, tandis que 20% est structuré. ce sont les données non structurées que les entreprises examinent pour découvrir des modèles de données rares ou inhabituelles. ils utilisent également Elasticsearch pour surveiller les profils de données. Par exemple, un grand détaillant effectue un suivi en temps réel avec Elasticsearch afin d'assurer un approvisionnement adéquat en argent dans les magasins pour que les gens puissent encaisser leurs chèques les jours de paie.

dans ma propre expérience avec notre cas d'utilisation de la recherche, nous n'utilisons pas seulement des recherches floues, mais il a évolué en recherche auto-complète et rapide. De ce que j'ai vu, une fois que vous commencez à travailler avec Elasticsearch, vous commencez à évoluer dans d'autres cas d'utilisation qui complètent ce que vous avez déjà en place. Maintenant que nous avons établi Elasticsearch en tant que moteur de recherche flou à notre entreprise, nous avons d'autres équipes qui se penchent sur l'analyse et les mesures pour la journalisation.

Voici quelques ressources supplémentaires qui vont plus en profondeur sur ce sujet:

22
répondu James Drinkard 2017-06-20 03:26:50