Skip to Content
Dismiss
Innovation
Eine AIVision für alle

Eine einheitliche, automatisierte Grundlage für die Umwandlung von Daten in Intelligenz im großen Maßstab.

Erfahren Sie, wie das geht
Dismiss
16. bis 18. Juni, Las Vegas
Pure//Accelerate® 2026

Entdecken Sie, wie Sie den wahren Wert Ihrer Daten erschließen können.

Jetzt anmelden
Dismiss
Gartner® Magic Quadrant™-Bericht 2025
Beste Umsetzungsfähigkeit und beste Vision

Everpure wurde im Gartner® Magic Quadrant™ 2025 für Enterprise Storage-Plattformen als Leader genannt und als das Unternehmen mit der besten Umsetzungsfähigkeit und der besten Vision eingestuft.

Report downloaden

Was ist Elasticsearch Architecture?

Elasticsearch wurde 2010 eingeführt und war eine der ersten verteilten Suchmaschinen für die schnelle Abfrage von Daten zur Anzeige in Analysen oder Big-Data-Ausgaben. Damals sammelten immer mehr Unternehmen riesige Datenmengen, aber herkömmliche Datenbank-Engines konnten nicht mithalten. Elasticsearch wurde als Vektordatenbank eingeführt, die strukturierte und unstrukturierte Daten speichern kann. Es war der erste große Sprung in die Big-Data-Indizierung und schnellere Abfragen, als Unternehmensanalysen Terabyte an Daten überschritten und Performance-Probleme verursachten.

Was ist Elasticsearch?

Elasticsearch ist ein Datastore, der verwendet wird, um Daten zusammenzuführen und über eine API durchsuchbar zu machen. Es basiert auf Apache Lucene, einem Indexierungs- und Storage-Service, der Daten in Shards verteilt. Jeder Shard enthält seine eigenen Daten, aber die Shards werden voneinander getrennt gehalten, um Daten über Knoten zu verteilen. Elasticsearch fasst alle Shards zusammen und bietet Entwicklern eine API zum Abfragen von Daten. Mit der API können Administratoren Berechtigungen für bestimmte Benutzer festlegen, um Daten weiter zu sichern und nur autorisierten Benutzern Zugriff auf bestimmte Daten zu gewähren.

Entwickler sind nicht auf strukturierte oder unstrukturierte Daten beschränkt. Mit Elasticsearch können Benutzer sowohl strukturierte als auch unstrukturierte Daten abrufen, aber sie fragt Daten in ihren verteilten Shards ab, als wäre Storage eine große Datenbank. Die Art und Weise, wie Elasticsearch Daten verarbeitet, macht sie viel schneller als eine Standarddatenbank-Engine. Daher eignet sie sich am besten für Anwendungen mit Analysen, Suchfunktionen für viele Daten oder Netzwerkverkehrsanalysen.

Kernkomponenten der Elasticsearch-Architektur

Die erste Kernkomponente von Elasticsearch ist der Knoten. Ein Knoten ist ein Server oder ein Gerät, auf dem Daten gespeichert sind. Cluster bestehen aus einer Sammlung von Knoten. Knoten und Cluster können zur Redundanz über Rechenzentren verteilt werden, aber verteilte Daten verbessern die Performance bei Datenabfragen. Elasticsearch ist eine Vektordatenbank, die Daten jedoch als Dokument speichert. Ein Dokument ist eine Entität, die unstrukturierte Daten speichert, obwohl auch strukturierte Daten darin gespeichert werden können.

Daten werden über Knoten hinweg fragmentiert. Shards sind ein Teil der Daten, um große Datastores in kleinere Teile zu segmentieren, was es einfacher macht, Daten in einem Ergebnissatz für die Frontend-Anwendung zu verteilen und gleichzeitig abzufragen. Logstash wird als Datenpipeline verwendet, die Daten in ihrer Rohform aufnimmt und in eine nutzbare Form umwandelt. 

Elasticsearch verfügt auch über eine API, die das Gateway zu Daten ist. Entwickler müssen sich bei der API authentifizieren und sie mit einem Schlüssel abfragen. Die API steuert den Zugriff auf die Daten und die Art und Weise, wie Entwickler sie abfragen können. Eine API verdeckt auch die Backend-Architektur und sichert sie, sodass sie für Entwickler zugänglich ist, die mit der Funktionsweise von Apache Lucene und anderen Komponenten nicht vertraut sind.

Knoten und Cluster

Ein Cluster ist eine Gruppe von Knoten, aber Knoten haben ihre eigene spezifische Rolle in einem Cluster. Der Masterknoten steuert im Allgemeinen den Cluster. Der Masterknoten kann Indizes erstellen oder löschen und andere Knoten verfolgen, die am Cluster teilnehmen. Jeder Cluster hat einen Masterknoten.

Ein Datenknoten speichert die Daten. Jede Manipulation oder Änderung von Daten liegt in der Verantwortung des Datenknotens. Wenn Sie Daten aggregieren, fügen Sie sie dem Datenknoten hinzu. Die Suchfunktion erfolgt auch am Datenknoten.

Stellen Sie sich die Koordination von Knoten als die Gateways vor, die den Datenverkehr zum richtigen Knoten steuern. Ein koordinierender Knoten sendet Anfragen an den Masterknoten oder Datenknoten, abhängig von ihrem Ziel. Wenn beispielsweise eine Suche an den Cluster gesendet wird, verwaltet der koordinierende Knoten seine Anfrage.

Elasticsearch verfügt über eine Pipeline zum Transformieren und Verschieben von Daten. Der Aufnahmeknoten ist für die Verwaltung von Dokumenten und deren Transformation für die Indexierung verantwortlich. Elasticsearch empfiehlt, in Umgebungen mit starken Datenübertragungen einen Aufnahmeknoten unabhängig von den Master- und Datenknoten zu haben.

Remote-fähige Knoten senden Anfragen an andere Cluster im Elasticsearch-System. Suchabfragen können Daten mithilfe von Cluster-übergreifenden Funktionen mit einem ferngeeigneten Knoten finden. Die Replikation von Daten über Cluster hinweg liegt auch in der Verantwortung der ferngeeigneten Knoten.

Shards und Replikas

Schnelle Suchen und Abfragen erfordern Indizes. Indexe sind die Art und Weise, wie ein Datenspeicher Daten so organisiert, dass Suchen schneller werden. In Elasticsearch besteht jeder Index aus einer Reihe von Shards. Shards werden über Knoten gespeichert, in denen Elasticsearch sie für eine schnellere Verarbeitung über den Cluster verteilt. Shards enthalten eine Kopie von Daten, aber Elasticsearch kann gleichzeitige Suchen auf mehreren Shards durchführen.

Redundanz ist für Failover und Fehlertoleranz erforderlich, sodass Replikate eine Kopie von Shards verarbeiten. Replikate werden auf verschiedenen Knoten gespeichert, sodass Daten nicht verloren gehen, wenn ein Knoten ausfällt. Wenn ein Knoten ausfällt, wäre Elasticsearch dann in der Lage, auf Daten auf einer Replikation auf einem anderen Knoten zuzugreifen.

Datenfluss in Elasticsearch

Elasticsearch bietet eine API für Entwickler, um ihre Abfragen zu senden. Die API schützt Entwickler vor der Komplexität des Backends. Das Backend besteht wie besprochen aus mehreren Komponenten, einschließlich Shards, Knoten, Indizes und Replikaten. Anstatt Entwickler zur Verwaltung von Elasticsearch-Forschern zu zwingen, beginnt der Datenfluss mit einer Abfrage nach der API.

Die API sendet die Abfrage zuerst an einen Koordinator. Der Koordinator sendet ihn an den entsprechenden Knoten, in dem sich Shards befinden. Eine Abfrage könnte auch an mehrere Shards mit jeweils eigenem Datensatz gesendet werden. Das Routing erfolgt durch den Koordinator, der die richtigen Shards für die Abfrage bestimmt.

Nachdem Shards Dokumente gesammelt haben, werden Indizes für die Dokumente an den Koordinator zurückgeschickt. Wenn mehrere Shards Daten an den Koordinator zurücksenden, organisiert der Koordinator die Indizes, führt sie zusammen und sortiert sie. Wenn die Indizes sortiert sind, ruft der Koordinator dann die tatsächlichen Dokumente aus den Shards ab. Nachdem die Daten abgerufen wurden, werden sie über die API an die Anwendung zurückgesendet.

Best Practices für die Optimierung der Elasticsearch-Architektur

Elasticsearch ist viel komplexer als die durchschnittliche Datenbank-Engine, sodass die Optimierung einen anderen Ansatz erfordert. Sie müssen zunächst sicherstellen, dass genügend Ressourcen im Backend ausgeführt werden. Wenn die Abfragen zu langsam sind, sollten Sie die CPU-, Speicher- oder Server-Storage-Kapazität erhöhen.

Für die Suche nach Daten sind Indizes erforderlich, aber einige Daten werden nicht so häufig verwendet wie andere Daten. Mit Elasticsearch können Sie Indizes einfrieren, wodurch ungenutzte Indizes auf einen anderen Shard verschoben werden. Koordinatoren haben dann weniger Shards, um nach jeder Abfrage zu suchen und so die Performance zu verbessern.

Thread-Pools in Elasticsearch steuern Abfragegrößen und sollten so optimiert werden, dass sie die in jeder Abfrage verarbeitete Datenmenge unterstützen. Konfigurieren Sie Thread-Pools, um genügend Daten für Ihre Abfragen zu verarbeiten, aber sie binden auch an Knotenressourcen. Sowohl Knoten als auch Thread-Pools sollten über genügend Ressourcen verfügen, oder Sie können bei Abfragen mit hohem Volumen eine Verschlechterung der Performance feststellen.

Fazit

Elasticsearch ist viel komplexer als eine Standarddatenbank. Daher ist es für eine optimale Performance erforderlich, über die richtige Architektur und die richtigen Rechenressourcen zu verfügen. Verwenden Sie Best Practices, wenn Sie Elasticsearch konfigurieren, aber es ist auch wichtig, über die richtigen Rechenressourcen zu verfügen, um die Abfragen und den Daten-Storage zu unterstützen, die für das Backend erforderlich sind.

Eine Möglichkeit, sicherzustellen, dass Sie über genügend Storage-Ressourcen verfügen, besteht darin, Pure Storage® FlashBlade® zu nutzen. FlashBlade unterstützt exponentielles Wachstum für kleine bis große Unternehmen. Ihre Anwendungen können skaliert werden, wenn mehr Benutzer Daten speichern und eine beliebige Anzahl von Kunden unterstützen.

02/2026
Meeting Oracle Recovery SLAs with FlashBlade | Everpure
FlashBlade delivers 60TB/hr Oracle RMAN restore rates with Direct NFS, enabling enterprise backup consolidation and aggressive RTO targets at scale.
White Paper
18 pages

Wichtige Ressourcen und Veranstaltungen durchsuchen

VIDEO
Sehen Sie selbst: Der Wert einer Enterprise Data Cloud

Charlie Giancarlo erklärt, warum die Zukunft in der Verwaltung von Daten und nicht in der Verwaltung von Storage liegt. Erfahren Sie, wie ein einheitlicher Ansatz IT-Abläufe in Unternehmen transformiert.

Jetzt ansehen
RESSOURCE
Herkömmlicher Storage kann die Zukunft nicht beflügeln.

Moderne Workloads erfordern KI-fähige Geschwindigkeit, Sicherheit und Skalierbarkeit. Ist Ihr Stack darauf vorbereitet?

Bewertung durchführen
PURE360-DEMOS
Pure Storage erkunden, kennenlernen und erleben.

Überzeugen Sie sich mit On-Demand-Videos und -Demos von den Möglichkeiten von Pure Storage.

Demos ansehen
THOUGHT LEADERSHIP
Der Innovationswettlauf

Branchenführer, die an vorderster Front der Storage-Innovationen stehen, geben Einblicke und Ausblicke.

Mehr erfahren
Ihr Browser wird nicht mehr unterstützt!

Ältere Browser stellen häufig ein Sicherheitsrisiko dar. Um die bestmögliche Erfahrung bei der Nutzung unserer Website zu ermöglichen, führen Sie bitte ein Update auf einen dieser aktuellen Browser durch.

Personalize for Me
Steps Complete!
1
2
3
Personalize your Everpure experience
Select a challenge, or skip and build your own use case.
Zukunftssichere Virtualisierungsstrategien

Storage-Optionen für alle Ihre Anforderungen.

KIAIProjekte in beliebigem Umfang ermöglichen

Hochleistungs-Storage für Datenpipelines, Training und Inferenz.

Verhindern Sie Datenverluste

Cyber-Resilienz-Lösungen, die Ihr Risiko senken.

Senken Sie die Kosten für Cloud-Operationen

Kosteneffizienter Storage für Azure, AWS und Private Clouds.

Beschleunigen Sie die Performance von Anwendungen und Datenbanken

Storage mit geringer Latenz zur Beschleunigung der Anwendungs-Performance.

Verringern Sie den Stromverbrauch und den Platzbedarf von Rechenzentren

Ressourceneffizienter Storage zur Verbesserung der Rechenzentrumsauslastung.

Confirm your outcome priorities
Your scenario prioritizes the selected outcomes. You can modify or choose next to confirm.
Primary
Reduce My Storage Costs
Lower hardware and operational spend.
Primary
Strengthen Cyber Resilience
Detect, protect against, and recover from ransomware.
Primary
Simplify Governance and Compliance
Easy-to-use policy rules, settings, and templates.
Primary
Deliver Workflow Automation
Eliminate error-prone manual tasks.
Primary
Use Less Power and Space
Smaller footprint, lower power consumption.
Primary
Boost Performance and Scale
Predictability and low latency at any size.
What’s your role and industry?
We've inferred your role based on your scenario. Modify or confirm and select your industry.
Select your industry
Financial services
Government
Healthcare
Education
Telecommunications
Automotive
Hyperscaler
Electronic design automation
Retail
Service provider
Transportation
Which team are you on?
Technical leadership team
Defines the strategy and the decision making process
Infrastructure and Ops team
Manages IT infrastructure operations and the technical evaluations
Business leadership team
Responsible for achieving business outcomes
Security team
Owns the policies for security, incident management, and recovery
Application team
Owns the business applications and application SLAs
Describe your ideal environment
Tell us about your infrastructure and workload needs. We chose a few based on your scenario.
Select your preferred deployment
Hosted
Dedicated off-prem
On-prem
Your data center + edge
Public cloud
Public cloud only
Hybrid
Mix of on-prem and cloud
Select the workloads you need
Databases
Oracle, SQL Server, SAP HANA, open-source

Key benefits:

  • Instant, space-efficient snapshots

  • Near-zero-RPO protection and rapid restore

  • Consistent, low-latency performance

 

AI/ML and analytics
Training, inference, data lakes, HPC

Key benefits:

  • Predictable throughput for faster training and ingest

  • One data layer for pipelines from ingest to serve

  • Optimized GPU utilization and scale
Data protection and recovery
Backups, disaster recovery, and ransomware-safe restore

Key benefits:

  • Immutable snapshots and isolated recovery points

  • Clean, rapid restore with SafeMode™

  • Detection and policy-driven response

 

Containers and Kubernetes
Kubernetes, containers, microservices

Key benefits:

  • Reliable, persistent volumes for stateful apps

  • Fast, space-efficient clones for CI/CD

  • Multi-cloud portability and consistent ops
Cloud
AWS, Azure

Key benefits:

  • Consistent data services across clouds

  • Simple mobility for apps and datasets

  • Flexible, pay-as-you-use economics

 

Virtualization
VMs, vSphere, VCF, vSAN replacement

Key benefits:

  • Higher VM density with predictable latency

  • Non-disruptive, always-on upgrades

  • Fast ransomware recovery with SafeMode™

 

Data storage
Block, file, and object

Key benefits:

  • Consolidate workloads on one platform

  • Unified services, policy, and governance

  • Eliminate silos and redundant copies

 

What other vendors are you considering or using?
Thinking...
Your personalized, guided path
Get started with resources based on your selections.