What Is Traditional Data?

Traditional data is structured, relational data organizations have been storing and processing for decades. Traditional data still accounts for the majority of the world’s data. Businesses can use traditional data for tracking sales or managing customer relations or workflows. Traditional data is often easier to manipulate and can be managed with conventional data processing software. However, it generally provides less sophisticated insights and more limited benefits than big data.

Big data can refer to both a large and complex data set, as well as the methods used to process this type of data. Big data has four main characteristics, often known as “the four Vs”: Volume: Big data is...big. While big data isn’t only distinguishable by its size, it’s also typically very high volume in nature. Variety: A big data set typically contains structured, semi-structured, and unstructured data. Velocity: Big data generates quickly and is often processed in real time. Veracity: Big data isn’t inherently better quality than traditional data, but its veracity (accuracy) is extremely important. Anomalies, biases, and noise can significantly impact the quality of big data.

The Differences between Big Data and Traditional Data

Several characteristics are used to distinguish between big data and traditional data. These include: The size of the data How the data is organized The architecture required to manage the data The sources from which the data derives The methods used to analyze the data Size Traditional data sets tend to be measured in gigabytes and terabytes. As a result, their size can allow for centralized storage, even on one server. Big data is distinguished not only by its size but also by its volume. Big data is usually measured in petabytes, zettabytes, or exabytes. The increasingly large size of big data sets is one of the main drivers behind the demand for more modern, high-capacity, cloud-based data storage solutions. Organization Traditional data is normally structured data that’s organized in records, files, and tables. Fields in traditional data sets are relational, so it’s possible to work out their relationship and manipulate the data accordingly. Traditional databases, such as SQL, Oracle DB, and MySQL, use a fixed schema that is static and preconfigured. Big data uses a dynamic schema. In storage, big data is raw and unstructured. When big data is accessed, the dynamic schema is applied to the raw data. Modern non-relational or NoSQL databases like Cassandra and MongoDB are ideal for unstructured data, given the way they store data in files. Architecture Traditional data is typically managed using a centralized architecture, which can be more cost-effective and secure for smaller, structured data sets. In general, a centralized system consists of one or more client nodes (e.g., computers or mobile devices) connected to a central node (e.g., a server). The central server controls the network and monitors its security. Because of its scale and complexity, it isn’t possible to manage big data centrally. It requires a distributed architecture. Distributed systems link multiple servers or computers over a network, operating as co-equal nodes. The architecture can scale horizontally (scale “out”) and will continue functioning even if an individual node fails. Distributed systems can leverage commodity hardware to reduce costs. Sources Traditional data typically derives from enterprise resource planning (ERP), customer relationship management (CRM), online transactions, and other enterprise-level data. Big data derives from a broader range of enterprise and non-enterprise-level data, which can include information scraped from social media, device and sensor data, and audiovisual data. These source types are dynamic, evolving, and growing every day. Unstructured data sources can also include text, video, image, and audio files. Leveraging this type of data isn’t possible using the columns and rows of traditional databases. Because an increasingly significant amount of data is unstructured and comes from multiple sources, big data analysis methods are required to extract value from it. Analysis Traditional data analysis occurs incrementally: An event occurs, data is generated, and the analysis of this data takes place after the event. Traditional data analysis can help businesses understand the impacts of given strategies or changes on a limited range of metrics over a specific period. Big data analysis can occur in real time. Because big data generates on a second-by-second basis, analysis can occur as data is being collected. Big data analysis offers businesses a more dynamic and holistic understanding of their needs and strategies. For example, suppose a business has invested in a training program for its staff and wants to measure its impact. Under a traditional model of data analysis, the business might set out to determine the impact of the training program on a particular area of its operations, such as sales. The business notes the sales volume before and after the training and excludes any extraneous factors. It can, in theory, see how much sales have increased as a result of the training. Under a big data model of analysis, the business can set aside questions regarding how the training program has impacted any particular aspect of its operations. Instead, by analyzing a mass of data collected in real time across the whole business, it can identify the specific areas that have been impacted, such as sales, customer service, public relations, and more.

Pure Knowledge
Guide to Big Data
Big Data versus herkömmliche Daten

Anfängerleitfaden zu Big Data

Big Data versus herkömmliche Daten

Big Data bietet Unternehmen immense Möglichkeiten, darunter aussagekräftigere Einblicke in das Kundenverhalten, genauere Prognosen über das Marktgeschehen und eine insgesamt höhere Effizienz.

Menschen und Unternehmen erzeugen jedes Jahr immer mehr Daten. Laut einem IDC-Bericht hat die Welt im Jahr 2010 gerade einmal 1,2 Zettabyte (1,2 Billionen Gigabyte) an neuen Daten erzeugt. Bis 2025 könnte dieser Wert auf 175 Zettabyte (175 Billionen Gigabyte) oder mehr ansteigen¹.

In dem Maße, in dem Unternehmen diese florierende Ressource über vorausschauende Analysen und Datengewinnung erschließen, wird auch der Markt für Big Data wachsen. Untersuchungen von Statista prognostizieren, dass sich der Wert des Big-Data-Marktes zwischen 2018 und 2027 von 169 Milliarden Dollar auf 274 Milliarden Dollar nahezu verdoppeln wird.

Aber was sind die wesentlichen Unterschiede zwischen Big Data und herkömmlichen Daten? Und welche Auswirkungen haben sie auf die aktuelle Daten-Storage-, Datenverarbeitungs- und Datenanalysetechnologie? Hier erklären wir die unterschiedlichen Zwecke der einzelnen Arten von Daten und betonen gleichzeitig die Bedeutung einer Strategie, bei der sowohl Big Data als auch herkömmliche Daten gewinnbringend eingeplant werden.

Was sind herkömmliche Daten?

Bei herkömmlichen Daten handelt es sich um strukturierte, relationale Daten, die Unternehmen seit Jahrzehnten speichern und verarbeiten. Herkömmliche Daten machen noch immer den größten Teil der weltweiten Daten aus.

Unternehmen können herkömmliche Daten zum Nachverfolgen von Verkäufen oder zum Verwalten von Kundenbeziehungen oder Arbeitsabläufen verwenden. Herkömmliche Daten sind oft einfacher zu bearbeiten und können mit herkömmlicher Datenverarbeitungssoftware verwaltet werden. Sie bieten jedoch im Allgemeinen weniger tiefgehende Einblicke und einen geringeren Nutzen als Big Data.

Was ist Big Data?

Der Begriff „Big Data“ kann sich sowohl auf einen großen und komplexen Datensatz beziehen als auch auf die Methoden, die zur Verarbeitung dieser Art von Daten verwendet werden. Big Data hat vier Hauptmerkmale, die oft als „die vier Vs“ bezeichnet werden:

Volume (Volumen): Big Data ist … nun, groß. Big Data zeichnet sich nicht nur durch seine Größe aus, sondern typischerweise auch durch ein sehr hohes Datenvolumen.
Variety (Vielfalt): Ein großer Datensatz enthält in der Regel strukturierte, halbstrukturierte und unstrukturierte Daten.
Velocity (Geschwindigkeit): Big Data wird schnell generiert und oft in Echtzeit verarbeitet.
Veracity (Stichhaltigkeit): Big Data ist nicht automatisch von besserer Qualität als herkömmliche Daten, aber seine Stichhaltigkeit (Genauigkeit) ist extrem wichtig. Anomalien, Verzerrungen und Rauschen können die Qualität von Big Data erheblich beeinträchtigen.

Die Unterschiede zwischen Big Data und herkömmlichen Daten

Zur Unterscheidung zwischen Big Data und herkömmlichen Daten werden mehrere Merkmale verwendet. Dazu gehören folgende:

die Größe der Daten
wie die Daten organisiert sind
die zum Verwalten der Daten erforderliche Architektur
die Quellen, aus denen die Daten stammen
die zum Analysieren der Daten verwendeten Methoden

Größe

Herkömmliche Datensätze werden in der Regel in Gigabytes und Terabytes gemessen. Dank ihrer Größe können sie zentral, sogar auf einem Server, gespeichert werden.

Big Data zeichnet sich nicht nur durch seine Größe, sondern auch durch seine Menge aus. Big Data wird üblicherweise in Petabytes, Zettabytes oder Exabytes gemessen. Die stets wachsenden Big-Data-Datensets sind einer der Hauptgründe für die Nachfrage nach moderneren Cloud-basierten Daten-Storage-Lösungen mit hoher Kapazität.

Organisation

Herkömmliche Daten sind normalerweise strukturierte Daten, die in Datensätzen, Dateien und Tabellen organisiert sind. Felder in traditionellen Datensätzen sind relational, sodass es möglich ist, ihre Beziehung zueinander herauszuarbeiten und die Daten entsprechend zu bearbeiten. Herkömmliche Datenbanken wie SQL, Oracle DB und MySQL verwenden ein festes Schema, das statisch und vorkonfiguriert ist.

Big Data verwendet ein dynamisches Schema. Im Storage ist Big Data roh und unstrukturiert. Wenn auf Big Data zugegriffen wird, wird das dynamische Schema auf die Rohdaten angewendet. Moderne nicht relationale oder NoSQL-Datenbanken wie Cassandra und MongoDB sind aufgrund der Art und Weise, wie sie Daten in Dateien speichern, ideal für unstrukturierte Daten.

Architektur

Herkömmliche Daten werden in der Regel über eine zentralisierte Architektur verwaltet, die für kleinere, strukturierte Datensätze kostengünstiger und sicherer sein kann.

Im Allgemeinen besteht ein zentralisiertes System aus einem oder mehreren Client-Knoten (z. B. Computer oder mobile Geräte), die mit einem zentralen Knoten (z. B. einem Server) verbunden sind. Der zentrale Server steuert das Netzwerk und überwacht dessen Sicherheit.

Aufgrund seiner Größe und Komplexität ist es nicht möglich, Big Data zentral zu verwalten. Es erfordert eine verteilte Architektur.

Verteilte Systeme verbinden mehrere Server oder Computer über ein Netzwerk und fungieren als gleichberechtigte Knoten. Die Architektur kann horizontal skaliert werden („auswärts“) und funktioniert auch dann noch, wenn ein einzelner Knoten ausfällt. Verteilte Systeme können Standardhardware nutzen, um Kosten zu senken.

Quellen

Herkömmliche Daten stammen in der Regel aus dem Enterprise Resource Planning (ERP), dem Customer Relationship Management (CRM), Online-Transaktionen und von anderen Daten auf Unternehmensebene.

Big Data stammt aus einem breiteren Spektrum von Daten auf Unternehmens- und Nicht-Unternehmensebene. Dazu können Informationen aus sozialen Medien, Geräte- und Sensordaten sowie audiovisuelle Daten gehören. Diese Quellentypen sind dynamisch, entwickeln sich ständig weiter und wachsen mit jedem Tag.

Zu den Quellen unstrukturierter Daten können auch Text-, Video-, Bild- und Audiodateien gehören. Mit den Spalten und Zeilen herkömmlicher Datenbanken kann diese Art von Daten nicht genutzt werden. Da immer mehr Daten unstrukturiert sind und aus verschiedenen Quellen stammen, sind Big-Data-Analysemethoden erforderlich, um aus ihnen einen Wert zu schöpfen.

Analyse

Die Analyse herkömmlicher Daten erfolgt inkrementell: Ein Ereignis tritt ein, Daten werden generiert und die Analyse dieser Daten erfolgt nach dem Ereignis. Die Analyse herkömmlicher Daten kann Unternehmen dabei helfen, die Auswirkungen bestimmter Strategien oder Änderungen auf Basis einer begrenzten Anzahl an Kennzahlen über einen bestimmten Zeitraum zu verstehen.

Big-Data-Analysen können in Echtzeit erfolgen. Da Big Data im Sekundentakt generiert wird, kann die Analyse bereits während der Datenerfassung erfolgen. Die Analyse von Big Data ermöglicht Unternehmen ein dynamischeres und ganzheitlicheres Verständnis ihrer Bedürfnisse und Strategien.

Nehmen wir zum Beispiel an, ein Unternehmen hat in ein Schulungsprogramm für seine Mitarbeiter investiert und möchte dessen Wirkung messen.

Bei einem herkömmlichen Datenanalysemodell könnte das Unternehmen versuchen, die Auswirkungen des Schulungsprogramms auf einen bestimmten Bereich des Betriebs, wie z. B. den Verkauf, zu bestimmen. Das Unternehmen stellt den Umsatz vor und nach der Schulung fest und schließt alle Fremdeinflüsse aus. Es kann theoretisch sehen, um wie viel der Umsatz durch die Schulung gestiegen ist.

Im Rahmen eines Big-Data-Analysemodells kann das Unternehmen Fragen danach beiseite lassen, wie sich das Schulungsprogramm auf einen bestimmten Aspekt seines Betriebs ausgewirkt hat. Stattdessen können durch das Analysieren einer großen Menge an Daten, die in Echtzeit im gesamten Unternehmen gesammelt werden, die spezifischen Bereiche identifiziert werden, auf die Auswirkungen erkennbar sind, wie z. B. Vertrieb, Kundenservice, Öffentlichkeitsarbeit usw.

Big Data versus herkömmliche Daten: Wichtige Überlegungen für die Zukunft

Big Data und herkömmliche Daten dienen unterschiedlichen, aber verwandten Zwecken. Es mag zwar den Anschein haben, dass Big Data einen größeren potenziellen Nutzen hat, aber es ist nicht unter allen Umständen geeignet (oder notwendig). Big Data …

… kann eine tiefere Analyse von Markttrends und Verbraucherverhalten liefern. Die Analyse herkömmlicher Daten kann enger gefasst und zu eingeschränkt sein, um die aussagekräftigen Erkenntnisse zu liefern, die Big Data liefern kann.
… liefert schneller Einblicke. Organisationen können in Echtzeit von Big Data lernen. Im Kontext von Big-Data-Analysen kann dies einen Wettbewerbsvorteil darstellen.
… ist effizienter. Die zunehmende Digitalisierung unserer Gesellschaft bedeutet, dass Menschen und Unternehmen jeden Tag – und sogar jede Minute – riesige Datenmengen erzeugen. Big Data ermöglicht es uns, diese Daten nutzbar zu machen und sie sinnvoll zu interpretieren.
… erfordert umfassende Vorbereitung. Um diese Vorteile zu nutzen, müssen sich Unternehmen durch neue Sicherheitsprotokolle, Konfigurationsschritte und eine Erhöhung der verfügbaren Rechenleistung auf Big Data vorbereiten.

Der Aufstieg von Big Data bedeutet nicht, dass herkömmliche Daten verschwinden. Herkömmliche Daten …

… können einfacher zu sichern sein, weshalb sie für hochsensible, persönliche oder vertrauliche Datensätze vorzuziehen sind. Da herkömmliche Daten kleiner sind, erfordern sie keine verteilte Architektur und seltener Storage Dritter.
… können mit herkömmlicher Datenverarbeitungssoftware und einer normalen Systemkonfiguration verarbeitet werden. Die Verarbeitung von Big Data erfordert in der Regel einen höheren Konfigurationsaufwand, was den Ressourcenverbrauch und die Kosten unnötig in die Höhe treiben kann, obwohl herkömmliche Datenmethoden ausreichen würden.
… sind leichter zu bearbeiten und zu interpretieren. Da herkömmliche Daten einfacher und relational sind, können sie mithilfe normaler Funktionen verarbeitet werden – und sind möglicherweise sogar für Nicht-Experten zugänglich.

Letztlich geht es nicht um die Wahl zwischen Big Data und herkömmlichen Daten. Da immer mehr Unternehmen große, unstrukturierte Datensätze generieren, benötigen sie die richtigen Tools dafür. Ein Verständnis dafür, wie beide Modelle genutzt und unterstützt werden, ist ein notwendiges Element der Aktualisierung Ihrer Strategie, um für eine Big Data-Zukunft gerüstet zu sein.

Zusätzliche Kapitel im Big-Data-Leitfaden

FlashBlade-Datei- und -Objekt-Storage

Produkt

KI-Infrastruktur AIRI

¹https://www.forbes.com/sites/gilpress/2020/01/06/6-predictions-about-data-in-2020-and-the-coming-decade/?sh=44e375c74fc3

Wichtige Ressourcen und Veranstaltungen durchsuchen

VIDEO

Sehen Sie selbst: Der Wert einer Enterprise Data Cloud

Charlie Giancarlo erklärt, warum die Zukunft in der Verwaltung von Daten und nicht in der Verwaltung von Storage liegt. Erfahren Sie, wie ein einheitlicher Ansatz IT-Abläufe in Unternehmen transformiert.

Jetzt ansehen

RESSOURCE

Herkömmlicher Storage kann die Zukunft nicht beflügeln.

Moderne Workloads erfordern KI-fähige Geschwindigkeit, Sicherheit und Skalierbarkeit. Ist Ihr Stack darauf vorbereitet?

Bewertung durchführen

PURE360-DEMOS

Pure Storage erkunden, kennenlernen und erleben.

Überzeugen Sie sich mit On-Demand-Videos und -Demos von den Möglichkeiten von Pure Storage.

Demos ansehen

THOUGHT LEADERSHIP

Der Innovationswettlauf

Branchenführer, die an vorderster Front der Storage-Innovationen stehen, geben Einblicke und Ausblicke.

Mehr erfahren

Ihr Browser wird nicht mehr unterstützt!

Ältere Browser stellen häufig ein Sicherheitsrisiko dar. Um die bestmögliche Erfahrung bei der Nutzung unserer Website zu ermöglichen, führen Sie bitte ein Update auf einen dieser aktuellen Browser durch.