• Dr. Stefan Stöckl

Big-Data-Technologien

Ein Überblick für Praktiker


Weltweit steigen die Datenvolumina rasant an. Nicht nur das Internet, sondern auch mit dem Internet verknüpfte Gegenstände des täglichen Gebrauchs (Internet of Things), verursachen eine ganze Reihe an strukturierten, aber auch unstrukturierten Daten. Unternehmen stehen zunehmend vor der Herausforderung diese Datenmasse zu speichern, zu verwalten, aber auch zu analysieren (D. Frick et al., 2021). Um aus den Unmengen an Daten das passende Geschäftsmodell entwickeln zu können kommen Anwendungslösungen zum Einsatz, die passgenaue Schlussfolgerungen aus dem Datenvorrat zulassen.


Die Rede ist an dieser Stelle von sogenannten Big-Data-Technologien. Dabei gibt es für den Begriff Big Data erstmal keine einheitliche Definition. Innerhalb der Fachliteratur wird der Begriff zur Beschreibung einer Menge von strukturierten, aber auch unstrukturierter Daten herangezogen. Um sich einer sinnvollen Definition annähern zu können, haben sich in der Forschungspraxis fünf Kriterien etabliert, die aufgrund ihres englisch-sprachigen Ursprungs auch als die fünf Vs bekannt sind (D. Frick et al., 2021):



1. Kriterium: Volume


Definiert die enorme Menge an Daten, die täglich sowohl von Unternehmen, als auch Privatpersonen verursacht werden. Als Bezugsgröße ist hier der Datenumfang zu nennen.


2. Kriterium: Variety


Beschreibt die strukturierte Einordnung von Daten. Von Relevanz sind hier allen voran die Vielfalt der Datenformate & Datenquellen, aber auch die unterschiedlichen Strukturierungsgrade von Daten.


3. Kriterium: Velocity


Bezeichnet die Verarbeitungsgeschwindigkeit von Daten. Also die Geschwindigkeit mit der Daten generiert, ausgewertet und weiterverarbeitet werden. Aber auch die Veränderungsdynamik der Daten steht im Zentrum dieses Kriteriums. Denn auch die Geschwindigkeit mit der sich die Beziehungen zwischen den Daten oder die Daten selbst ändern, kann zu neuen Bedeutungen im Rahmen der Dateninterpretation führen.


4. Kriterium: Veracity


Hierbei geht es um die Richtigkeit bzw. die Glaubwürdigkeit der Daten. Das Kriterium ist dabei nicht nur von der Datenqualität bestimmter Datentypen abhängig, sondern zusätzlich mit einer gewissen Unvorhersehbarkeit verbunden. Dieses Risiko sollte bei der Dateninterpretation miteinkalkuliert werden.


5. Kriterium: Value


Dieses Kriterium zielt auf die Wertigkeit der Daten ab. Demnach müssen die Investitionen, welche in den Aufbau einer geeigneten Dateninfrastruktur getätigt werden, einem entsprechenden Nutzen gegenüber stehen, der sich in der Ausschöpfung entsprechender Datenpotenziale widerspiegelt.




Dieser Kriterien-Katalog vermittelt einen recht ausführlichen Eindruck der Herausforderungen, denen sich Unternehmen hinsichtlich großer Datenmengen gegenüber sehen. Gleichzeitig werden jedoch auch Handlungsempfehlungen vorgegeben, mit denen Problembereiche rechtzeitig erkannt und behoben werden können.


Je nach Art der Big Data Fragestellung, können verschiedene Technologien als Unterstützung herangezogen werden. Die Auswahl des Analyse-Tools ist dabei stark abhängig vom jeweiligen Anwendungsfall. Grundsätzlich unterstützen Big-Data-Technologien bei der Optimierung von Geschäftsprozessen, indem sie bspw. den Ressourceneinsatz näher beleuchten und somit verbessern. Bisher ungenutzte Datenquellen können sich aber auch bei der Erschließung neuer Geschäftsfelder als hilfreich erweisen.


Folglich haben sich rundum das Thema Big Data eine Vielzahl von technischen Lösungen entwickelt. Damit Sie die richtige Anwendung für Ihr konkretes Datenproblem finden und sich nicht im Dickicht der technologischen Alternativen verirren, stehen wir Ihnen gerne mit Rat und Tat zur Seite! Entdecken Sie gemeinsam mit uns Ihr schlummerndes Datenpotenzial und sichern Sie somit das nachhaltige Wachstum Ihrer Geschäftstätigkeit. Sprechen Sie uns gerne an!






Quellen:



D. Frick et al. (Hrsg.), Data Science, https://doi.org/10.1007/978-3-658-33403-1_1


https://www.bigdata-insider.de/die-wichtigsten-big-data-technologien-a-767470/





7 Ansichten0 Kommentare

Aktuelle Beiträge

Alle ansehen

Data Engineering

Data Literacy