mindsquare.de durchsuchen

Data Science

Sie brauchen einen Data Science Berater und/oder möchten, dass wir Ihnen unser Angebot in diesem Umfeld vorstellen?

Max-Ludwig Stadler
Knowhow » Künstliche Intelligenz » Data Science
 - 11. März 2020

Data Science (deutsch: Datenwissenschaft) ist ein Sammelbegriff für Systeme, Algorithmen, Methoden und Prozesse, mit denen Wissen aus vorhandenen Daten extrahiert wird. Basis hierfür sind wiederum Theorien und Techniken aus den Bereichen IT, Mathematik, Wahrscheinlichkeitsrechnung und Statistik.

Historische Entwicklung

Data Science ist keine Entwicklung der jüngsten Vergangenheit. Vielmehr nahm die Datenanalyse mithilfe computergestützter Verfahren bereits in den 1960er Jahren ihren Anfang. Die Anwendung begrenzte sich jedoch lange auf den wissenschaftlichen Bereich. Erst mit der flächendeckenden Verbreitung der IT in den 1990er Jahren hielt Data Science Einzug in Unternehmen. Insbesondere wurden Daten seinerzeit für die Ableitung von Marketingmaßnahmen und Unternehmensstrategien herangezogen.

Trotz der neuen Möglichkeiten fristete Data Science eher ein Schattendasein, bis in den 2010er Jahren die Thematik „Big Data“ Popularität erlangte. Diese großen Mengen unstrukturierter Daten entstanden durch die weltweit voranschreitende Digitalisierung. Bis heute nimmt das Datenvolumen tagtäglich zu.

Unser E-Book zum Thema

Wie Ihr Unternehmen von Künstlicher Intelligenz (KI) profitieren kann

In unserem E-Book erfahren Sie die wichtigsten Inhalte rund um das Thema künstliche Intelligenz & wie Sie davon profitieren können!

Gleichzeitig verbesserten sich die Rechenleistung, analytische Datenbanken und Analyse-Tools signifikant. Hierdurch ist es mittlerweile möglich, große Mengen von Daten aus unterschiedlichen Quellen zu sammeln, aufzubereiten und zu analysieren. Zunehmend etablieren sich kostengünstige Cloud-Lösungen für diese Aufgaben. Neben Forschungseinrichtungen und großen Konzernen sind aufgrund der Entwicklung mittlerweile auch kleine und mittelständische Unternehmen in der Lage, Data Science zu betreiben.

Einsatzzweck

Data Science unterscheidet sich hinsichtlich seiner Ziele klar von herkömmlichen IT-Aufgaben. Datenanalyseprojekte bewegen sich stets an der Schnittstelle zwischen verschiedensten Unternehmensdaten und unternehmerischen Fragestellungen. Letztere können sich sowohl auf konkrete Ereignisse in der Vergangenheit als auch auf potenzielle Trends und Szenarien der Zukunft beziehen. Hierbei ermöglicht Data Science Einblicke, die mit herkömmlichen Analysemethoden bislang nicht realisierbar waren. Die Perspektive von Unternehmen erweitert sich, was zahlreiche Vorteile im Wettbewerb mit sich bringt.

Die übergeordneten Ziele von Data Science können aus betriebswirtschaftlicher Sicht wie folgt zusammengefasst werden:

  • Schaffung einer soliden Basis für Unternehmensentscheidungen
  • Realisierung von Wettbewerbsvorteilen
  • Steuerung, Optimierung und Automatisierung von Prozessen
  • Erstellung belastbarer Prognosen über zukünftige Entwicklungen („Predictive Analytics„)

Shot of Corridor in Working Data Center Full of Rack Servers and Supercomputers with High Internet Visualisation Projection.

Technologische und personelle Anforderungen

Data-Science-Projekte sind mit mehreren technologischen und fachlichen (personellen) Anforderungen verbunden. Neben Technologie-Know-how sind BWL- und Branchenkenntnisse erforderlich, um relevante Fragestellungen zu entwickeln. Dies ist auch einer der Hauptgründe dafür, warum Data Scientists (Berufsbild: siehe nächster Abschnitt) auf dem Arbeitsmarkt kaum verfügbar und äußerst begehrt sind.

Die technologischen Voraussetzungen orientieren sich an den oftmals extrem großen Datenmengen, die in Data-Science-Projekten – teils sogar in Echtzeit – gespeichert und verarbeitet werden müssen. Hierfür sind leistungsfähige Rechenzentren und zahlreiche parallel arbeitende Prozessoren erforderlich. Viele Organisationen lagern diesen Bereich mittlerweile in die Cloud aus, um die notwendigen Ressourcen nicht selbst vorhalten zu müssen.

Berufsbild Data Scientist

Data Science ist ein Wissenschaftsfeld, das sich aus Informationstechnologie, Mathematik, Wahrscheinlichkeitsrechnung und Statistik zusammensetzt. Daher können Data Scientists („Datenwissenschaftler“) Mathematiker, Informatiker, Physiker und auch Wirtschaftswissenschaftler mit entsprechender Fortbildung sein. Mittlerweile existieren jedoch auch Bachelor- und Master-Studiengänge für Data Science, in denen die zuvor genannten Wissensgebiete kombiniert werden. Hinzu kommen außerdem Methoden aus der künstlichen Intelligenz (insbesondere Machine Learning) und der Prognostik.

In ihrer täglichen Arbeit befassen sich Data Scientists vorwiegend mit folgenden Aspekten:

  • Datenerhebung (Data Sourcing)
  • Datenbereinigung (Data Cleansing)
  • Datenaufbereitung
  • Datenanalyse

Hierbei wenden Sie verschiedenen Methoden der Datenmodellierung, unterschiedliche mathematische Modelle sowie bestimmte statistische Verfahren an. Ihr Ziel ist es stets, die vorhandenen Daten in unternehmerisch verwertbares Wissen umzuwandeln. Daher müssen Data Scientists auch in der Lage sein, die gewonnenen Erkenntnisse leicht verständlich aufzubereiten, zu erklären und Handlungsempfehlungen abzuleiten. Treten Auffälligkeiten in den Daten auf, müssen sie darüber hinaus eigenständig die passenden Fragestellungen formulieren. Hierfür werden Branchenkenntnisse und betriebswirtschaftliches Wissen benötigt. Zudem sind gute kommunikative Eigenschaften erforderlich, um Projekte erfolgreich durchzuführen.

Einsatzmöglichkeiten in der Praxis

Data Science bietet zahlreiche Anwendungsmöglichkeiten. Die Methoden spielen immer dann eine Rolle, wenn Unternehmen aus großen Datenmengen lernen möchten – beispielsweise um Prozesse zu optimieren und die Kundenorientierung zu steigern. Die Bandbreite reicht hier von der Routenoptimierung in der Logistik bis hin zur Minimierung von Retouren im Versandhandel. Die Energiebranche nutzt Data-Science-Methoden hingegen, um Spitzen in der Auslastung von Stromnetzen vorherzusagen und Kapazitäten rechtzeitig anzupassen. Doch auch Versicherungen setzen mittlerweile auf fortgeschrittene datenbasierte Prognosen, um etwa die Wahrscheinlichkeit eines Schadensereignisses zu bestimmen.

Weitere Einsatzgebiete sind:

  • E-Commerce: Optimierung der Suchfunktion (relevanteste Ergebnisse anzeigen), dynamische Anpassung von Preisen in Echtzeit
  • Online-Marketing: personalisierte und situativ passende Werbung
  • Empfehlungsdienste (Recommendation Engines)
  • Medizin: automatisierte Therapie- und Medikationsempfehlung auf Basis ähnlicher Fälle
  • Predictive Analytics: unter anderem Prognosen zu Marktveränderungen, Konsumverhalten und Maschinenausfällen

Verwandte Know-Hows

SAP bezeichnet unsere gegenwärtige Epoche als „digitale Renaissance“. Was für ein Name wäre für ein digitales Innovationsportfolio, das Personen, Dinge und Menschen intelligent miteinander verknüpft, passender, als SAP Leonardo? Leonardo […]
Täglich werden große Mengen an Daten (Big Data) im Internet oder in Unternehmen angesammelt, doch womit werden diese einfach und profitabel verarbeitet? Und warum ist Big Data so wichtig? Das und […]
Der Amazon SageMaker ist ein von Amazon Web Services (AWS) bereitgestellter Service zur Erstellung von Machine-Learning-Modellen (ML-Modelle), die sich für Predicitive Analytics und weitere Analysen in der Cloud der Amazon […]
Kontakt aufnehmen
Ansprechpartner
Laura Feldkamp Kundenservice