Data Mining

Data Mining nutzt Erkenntnisse aus den Bereichen der Informatik, Statistik und Mathematik, um rechnergestützte Analysen von Datenbeständen durchzuführen. Mithilfe von Verfahren der künstlichen Intelligenz (KI) können Querverbindungen, Muster, Trends und Zusammenhänge untersucht und somit die Entscheidungsfindung im Unternehmen erleichtert werden. Data Mining liefert Hinweise, wie Unternehmen z. B. mehr Umsatz erzielen oder Kosten einsparen können.

Was ist Data Mining?

Das Ziel von Data-Mining-Analysen ist es, Theorien zu erstellen, mithilfe dieser Aussagen über die Zukunft getroffen werden können. In diesem Bereich gibt es verschiedene Methoden, die jeweils definierten Zielen und Aufgaben zugeordnet sind. Die Aufgaben lassen sich in verschiedene Einzelbereiche aufteilen:

  • Abhängigkeitsanalyse: Mit der Abhängigkeitsanalyse lassen sich Beziehungen bzw. Abhängigkeiten zwischen einzelnen Merkmalen eines Objekts oder zwischen verschiedenen Objekten identifizieren.
  • Prognose: Eine Prognose ist die Vorhersage von bisher unbekannten Merkmalen basierend auf zuvor gewonnen Erkenntnissen und anderen Merkmalen.
  • Klassifikation: Die Klassifikation ordnet einzelne Datenobjekte bestimmten Klassen zu. Mit Entscheidungsregeln wird die Zuordnung festgelegt und auf bestimmte Objektmerkmale angewendet.
  • Abweichungsanalyse: Diese Analyse identifiziert Objekte, die den Regeln der Abhängigkeit anderer Objekte nicht entsprechen.
  • Segmentierung: Hierbei werden Objekte mit gemeinsamen Merkmalen zu Gruppen zusammengefasst.

Für diese Methoden verwendet Data Mining Algorithmen aus der Statistik und Verfahren der KI. Aufgrund der immer weiter entwickelten Technologien und Fortschritte in dem Bereich kann Data Mining immer bessere und genauere Ergebnisse mit höherer Relevanz liefern.

Methoden und Techniken

Es gibt sehr viele verschiedene Methoden, Techniken und Algorithmen, um Muster in Datenbeständen zu finden. Diese Methoden kommen aus der Statistik oder dem maschinellen Lernen. Außerdem werden oft interaktive Analysen mittels Visualisierungsmethoden verwendet. Hier ist ein Ausschnitt solcher Methoden zusammengestellt:

  • Zeitreihenprognose,
  • Faktorenanalyse,
  • Verbindungsanalyse,
  • Entscheidungsbäume,
  • Regressionsmodelle und
  • neuronale Netze.

Data Mining und Big Data

Häufig werden die Begriffe Data Mining und Big Data gleich verwendet, obwohl die Begriffe jedoch sauber voneinander getrennt werden müssen. Big Data beschreibt große Datenmengen, die sich mit herkömmlichen Tools nicht effizient in einem angemessenen zeitlichen Rahmen verarbeiten lassen. Data Mining hingegen kommt zwar häufig bei großen Datenmengen zum Einsatz, ist jedoch nicht nur auf Big Data beschränkt. Data Mining kann auch bei kleinen Datenmengen zum Einsatz kommen, da es sich mit dem eigentlichen Vorgang der Gewinnung von Erkenntnissen aus den vorliegenden Daten beschäftigt.

Anwendungsbeispiele Data Mining

Data Mining kommt bereits in vielen Bereichen zum Einsatz und bietet in der Zukunft große Anwendungspotenziale:

  • Marketing und Customer Relationship Management (CRM): Mit am häufigsten wird Data Mining im Marketing und im Customer Relationship Management eingesetzt, da Unternehmen in diesen Bereichen über umfangreiche Datenbestände verfügen. Um Kundenbeziehungspflege zu betreiben, werden beispielsweise die Kundendaten mithilfe von Data Mining gruppiert.
  • Pharmaindustrie: Die Entwicklung von Medikamenten wird mithilfe von Data Mining erheblich verbessert. Wissenschaftler arbeiten bereits daran, mithilfe von Data Mining herauszufinden, warum Medikamente bei manchen Menschen wirken, bei anderen jedoch nicht.
  • Handel: Im Handel wird Data Mining genutzt, um das Kaufverhalten der Kunden mithilfe einer Warenkorbanalyse zu untersuchen. Zum Beispiel kann ein Supermarkt feststellen, dass 80 % der Frauen zwischen 25 und 35 Jahren beim Einkauf einer Zeitschrift auch gleichzeitig Snacks kaufen, wodurch die zielgruppenspezifische Werbung und die Produktplatzierung optimiert werden können.
  • Banken und Versicherung: Banken und Versicherungen nutzen Data Mining, um das Kaufverhalten von Kunden zu analysieren und zwischen zahlungsfähigen und zahlungsunfähigen Kunden zu unterscheiden. Somit wird das Verfahren für die Risikoanalyse genutzt.

Die Bonitätsprüfung

Ein weiteres Beispiel für Data Mining ist die Bonitätsprüfung. Die Aufgabe der Bonitätsprüfung ist die Beschaffung und Verarbeitung von Informationen zur Bestimmung des Bonitätsrisikos. Dies ist der Wert für die Wahrscheinlichkeit einer Kreditrückzahlung. Neben traditionellen Kreditprüfungen durch Sachbearbeiter werden heutzutage statistische Verfahren aus den Bereichen der künstlichen Intelligenz und des maschinellen Lernens angewendet, um Bonitätsprüfungen durchzuführen. Ausgehend von erfassten Attributen soll ein Kunde oder eine Firma einer vorgegebenen Bonitätsklasse zugeordnet werden. In der Vergangenheit abgewickelte Kreditfälle bilden dabei die Basis zur Konstruktion entsprechender Klassifikatoren, denn hier sind Informationen über die Attribute und Bonitätsklasse verfügbar. Mithilfe von Data Mining kann so zwischen guten und problembehafteten Kreditarrangements unterschieden werden.

Die Sonderform des Data Minings: Text Mining

Text Mining ist eine Sonderform des Data Minings. Das Verfahren des Text Minings ähnelt dem des Data Minings – Text Mining wird jedoch auf unstrukturierte Textdaten angewandt. Somit lässt sich Wissen aus Textdaten extrahieren. Anwender bekommen z. B. automatisch die Kernaussagen von Texten geliefert. So können Fachartikel nach spezifischen Informationen untersucht werden, die für bestimmte Projekte relevant sind.

Probleme

Aus den Zielsetzungen des Data Minings ergeben sich häufig sehr große Lösungsräume, die zusammen mit komplexen Algorithmen zu langen Laufzeiten führen. Außerdem wird die komplett autonome Extraktion von Mustern aus Datenbeständen häufig kritisiert, da Anwender oft keine Kenntnisse über das Umfeld haben und so Zusammenhänge und die Verwendung der gewonnen Informationen schwer zu identifizieren sind.

Auch der Schutz der persönlichen Daten vor Missbrauch und Diebstahl muss hier oberste Priorität haben. Daten müssen vor Angriffen geschützt sowie die DSGVO (Datenschutzgrundverordnung) eingehalten werden.

Zukunftsaussichten

Voraussichtlich werden zukünftige Data Mining Tools die angesprochenen Probleme reduzieren, da es zahlreiche Weiterentwicklungen in allen Bereichen von Big Data und Data Mining geben wird. Haben Sie Fragen zu diesen Themen? Wir sind Experten im Bereich der Digitalisierung und der digitalen Transformation und können Ihnen gerne weiterhelfen – kontaktieren Sie uns einfach.

Wie geht es weiter?

Schritt 1

Sie nehmen telefonisch, per Mail oder Formular Kontakt auf und schildern uns Ihr Anliegen.

Schritt 2

Zur Klärung von Rückfragen und von Details zum weiteren Vorgehen melden wir uns telefonisch bei Ihnen.

Schritt 3

Wir unterbreiten Ihnen ein Angebot und unterstützen Sie gerne auch bei der Präsentation für Ihr Management.

Jetzt Kontakt aufnehmen

Passende Angebote zum Thema

SuccessFactors Recruiting Workshop
SAP Analytics - die aktuelle Bezeichnung der SAP, die irgendwie alle Themen im Reporting-Umfeld mit einfangen soll. SAP BusinessObjects, SAP BW, SuccessFactors Workforce Analytics, Predictive Analytics,... alles wird mit "SAP Analytics" abgedeckt. Oder gibt es da noch mehr?
crm_kickstarter_2
Sie wollen Salesforce als Ihr neues CRM-System einführen und Ihre Vertriebsprozesse optimieren? Profitieren Sie von unseren Best Practices. Mit unserer Unterstützung gelingt Ihnen die Einführung in kürzester Zeit.
Klassifizierungsimporter für technische Objekte im SAP
Unser Klassifizierungsimporter für technische Objekte erleichtert Ihnen das Anlegen von Merkmalen für sämtliche technischen Objekte wie Plätze oder Equipments. Dadurch haben Sie die Möglichkeit, auf einfache Weise Merkmale wie den Schaltraum oder Bemerkungen zu importieren & mit einem Klick einzupflegen.