No means NoSQL - Die Vorteile neuer Technologien

Meetrics Data Blog

Verfasst von Maurice Wolter, Lead Data Engineer

Die digitale Werbebranche wächst rapide und mit ihr die Menge an Daten, die es zu verwalten gilt. Dabei ist offensichtlich, dass die Lösung dieses Problems nicht nur ein paar mehr Computern und veralteten Datenbanken bedarf.

Heutzutage hat jeder eine mehr oder minder präzise Vorstellung von Datenbanken. Damit sprechen wir oft von relationalen Datenbanken, die auf einem Modell der 70er Jahre beruht. Vereinfacht ausgedrückt, beschreibt es den Ansatz Datenwerte gemäß ihrer Verhältnisse zueinander zu strukturieren. Dabei werden Daten in einer normalisierten Form gespeichert, um deren Integrität sicher zu stellen und um Redundanzen zu reduzieren. Sie können mit der populären Sprache SQL abgefragt werden. 

Relationale Datenbanken wären nicht so weit verbreitet, wie sie heute sind, ohne ihren ursprünglichen Zweck sehr gut zu erfüllen. Sie spielen eine entscheidende Rolle in jeglicher Art von Datenverarbeitungsprogramm. Zudem ist SQL ein mächtiges Werkzeug, um strukturierte Daten zu verwalten und zu verarbeiten. Nichtsdestotrotz fehlen relationalen Datenbanken wichtige Eigenschaften. Sie sind nur schwierig skalierbar und können von Natur aus schlecht mit unstrukturierten Daten umgehen.

NoSQL bedeutet “nicht relational”

Mit dem Beginn des Informationszeitalters, wurde das Bedürfnis für neue Konzepte und Technologien offensichtlich. NoSQL ward geboren. Dieses Modell bringt einige entscheidende Vorteile mit:

  • Einfaches Design: Weitverbreitete Datenstrukturen sind der Schlüssel, zu einfachen Werte-Mappings und großen Tabellen, die Daten in mehr oder weniger strukturierten Art und Weise beinhalten können.
  • Horizontale Skalierbarkeit: Mit der Möglichkeit jederzeit weitere Hosts zu einem Cluster hinzu zu fügen, sind einer Datenbank nahezu keine Grenzen gesetzt.

Des Weiteren wird ein für lange Zeit essentieller Vorteil von SQL, die Vermeidung von Datenredundanz, weniger und weniger wichtig wenn zusätzliche Speicherkapazität immer billiger wird. Heutzutage werden Daten sogar bewusst kopiert, um direkt am Ort ihrer Verarbeitung auf sie zugreifen zu können und um die Verlässlichkeit der gesamten Datenbank zu erhöhen. 

Sobald es sich um sehr große Datenmengen handelt, werden die Nachteile von NoSQL Technologien, wie transaction handling und das Fehlen einer standardisierten Sprache wie SQL, verschwindend gering. 

Heutzutage existieren unzählige Technologien und Produkte in diesem Gebiet. Während es schwierig wäre, alle aufzuzählen, möchten wir an dieser Stelle die wichtigsten nennen, welche wir auch bei Meetrics einsetzen: Hadoop, Spark, Kafka und Hive. Ein zukünftiger Artikel bespricht, wie wir diese nutzen, um unsere Verifizierungslösungen zu verbessern. Folgen Sie uns auf sozialen Medien, um jederzeit über neue Artikel informiert zu werden.

Database2