• Dr. Stefan Stöckl

Data Engineering

Kennen Sie das Handwerkzeug erfolgreicher Daten-Analyse?



Daten entstehen an unterschiedlichen Stellen von Geschäfts- und Unternehmensprozessen (Quix et al., 2021). Dabei kommt es vor allem auf ihre Verfügbarkeit und Nutzbarkeit zur erfolgreichen Steuerung von Unternehmen an (Quix et al., 2021). Hierbei stellt sich die Frage, welche Strukturen Unternehmen etablieren sollten, um auf ein nachhaltiges Datenmanagement zurückgreifen zu können?


Mit dieser Problematik befasst sich das sogenannte Data Engineering. Der Begriff wird innerhalb der Fachliteratur sehr unterschiedlich definiert (Quix et al., 2021). Häufig sind in diesem Kontext auch die Fachbegriffe Information Engineering oder Data Management zu lesen (Quix et al., 2021). Da es jedoch in diesem Zusammenhang mehr um die Repräsentation von Daten als digitalisierte Informationen geht, als um die konzeptionelle Entwicklung von Informationsmodellen, trifft man in der Praxis häufiger auf die Definition des Data Engineerings (Quix et al., 2021).


Zu den Aufgaben des Data Engineerings zählen unter anderem technische Aufgaben, wie etwa die Definition von Datenstrukturen oder der Aufbau ganzer Daten-Management-Systeme (Quix et al., 2021). Dabei wird vorrangig das Ziel einer möglichst hohen Performance bei der Verarbeitung von Daten verfolgt. (Quix et al., 2021). Zwar handelt es sich hier auch um eine Form des Data Managements, jedoch ohne die rein organisatorischen Komponenten, die eher unter die Themenbereiche der Data Governance bzw. Datenqualität fallen (Quix et al., 2021). Im Zentrum des Data Engineerings steht vielmehr die Strukturierung von Daten anhand von ausgeklügelten Datenanalyse-Modellen (Quix et al., 2021).


Das Handwerkzeug mit dem die Daten analysiert werden ist dabei mannigfaltig.

Grundsätzlich kommen zahlreiche Vorgehensmodelle zur Datenanalyse in Frage. Beispielhaft seien hier der Prozess zu Knowledge Discovery Databases oder CRISP-DM (Cross-Industry-Standard-Process for Data Mining) genannt. Das Data Engineering setzt dabei vor allem bei den Aufgaben an, die vor der eigentlichen Analyse von Daten durchzuführen sind (Quix et al., 2021). Dazu zählen unter anderem das Verstehen der bereits vorhandenen Daten, die geeignete Auswahl von Daten und die Aufbereitung von Daten, sodass sie mithilfe passender Methoden nutzbar gemacht werden können (Quix et al., 2021). In der Unternehmenspraxis stellt sich vor allem die Beschaffung von Daten als äußerst problematisch dar. Demnach zählt der Aufbau einer Daten-Management-Architektur, in der Daten entsprechend zusammengeführt und miteinander verknüpft werden können, zu den fundamentalen Aufgaben des Data Engineerings (Quix et al., 2021).


Data Engineering kommt dabei nicht allein im betriebswirtschaftlichen Kontext zur Anwendung, sondern bspw. auch bei der Analyse von Produktionsdaten (Industrie 4.0), medizinischen Daten oder auch Mobilitätsdaten (Verkehrsanalyse) (Quix et al., 2021). Demnach sind für das Data Engineering domänenspezifische Kenntnisse wichtig, um die Daten anschließend ordnungsgemäß interpretieren zu können (Quix et al., 2021). Da sich diese Kenntnisse nicht so leicht formalisieren lassen, sollten die Daten in einem Datenmodell entsprechend abgebildet werden (Quix et al., 2021). Dadurch dass Daten im Unternehmenskontext meist in sehr heterogener Form vorliegen und zudem selten die erforderliche Qualität aufweisen, um sie entsprechend analysieren zu können, muss ein Data Engineer eine Vielfalt von Methoden und Werkzeugen beherrschen, um die Daten in das gewünschte Format bringen zu können (Quix et al., 2021).


Große Unternehmen verfügen meist über das notwendige Know-how und hauseigene Experten -Teams um teure Data-Engineering Prozesse anzustoßen und erfolgreich umzusetzen (Data Analytics – fünf Tipps für den Start im Mittelstand). Mittelständische Unternehmen sind hier oftmals im Rückstand, da sie nicht nur die Kosten und den organisatorischen Aufwand scheuen, der mit einem solchen Prozess einhergeht, sondern zudem schwer Zugang zu entsprechenden Experten haben (Data Analytics – fünf Tipps für den Start im Mittelstand) .


Als probates Mittel hat sich hier das Konzept Expert-as-a-Service erwiesen. Holen Sie sich Ihren Expertenrat einfach und unkompliziert ins Haus und das ganz ohne organisatorischen Hürdenlauf. Bringen auch Sie Ordnung in Ihre Daten. Wir unterstützen Sie dabei gerne!






Quellen:


Data Lake. Encyclopedia of Big Data Technologies:

R Hai, C Quix, M Jarke - arXiv preprint arXiv:2106.09592, 2021 - arxiv.org


Data Analytics im Mittelstand:

https://www.bigdata-insider.de/data-analytics-fuenf-tipps-fuer-den-start-im-mittelstand-a-707542/


Data Analytics – fünf Tipps für den Start im Mittelstand:

https://www.bigdata-insider.de/data-analytics-fuenf-tipps-fuer-den-start-im-mittelstand-a-707542/





16 Ansichten0 Kommentare

Aktuelle Beiträge

Alle ansehen