mindsquare.de durchsuchen

Wie funktioniert Machine Learning? – Random Forests

Max-Ludwig Stadler
4. Dezember 2019
Wie funktioniert Machine Learning? – Random Forests

Machine Learning ist ein Teilbereich von Künstlicher Intelligenz und befasst sich mit dem künstlichen Lernen aus historischen Daten. In diesen Daten sollen Muster und Regelmäßigkeiten erkannt werden, um daraus Entscheidungsregeln abzuleiten. Wie das genau funktioniert, kann allerdings von Modell zu Modell stark variieren. Ich möchte in diesem Beitrag auf eines der möglichen Verfahren eingehen: Random Forests. 

Entscheidungsbäume

Grundlage eines Random Forests sind Entscheidungsbäume. Solch ein Baum besteht aus einer Verzweigung von einfachen Regeln zum Einteilen der historischen Datensätze in die jeweiligen Klassen anhand von deren Eigenschaften (siehe Bild). Welche Eigenschaften genau zum Treffen der Entscheidung genutzt werden, ist dabei zufällig bestimmt und daher von Baum zu Baum unterschiedlich.

Entscheidungsbäume als Grundlage für Random Forrests

Bei der Abbildung handelt es sich um ein Beispiel, bei dem ein Baum die Kategorien einer Person erfasst. Hier ist der Ausgangspunkt die Berufstätigkeit, je nach Ergebnis werden weitere Kategorien abgefragt. Bei diesen wird wiederum entschieden, ob die Eigenschaft zutrifft oder nicht. Zum Abschluss wird die Person dann einer Klasse zugeordnet.

Ziel eines einzelnen Baums ist dabei nicht, alle Datensätze korrekt einer Klasse zuzuordnen. Stattdessen wird lediglich versucht, so viele Datensätze wie möglich auf Grundlage der ermittelten Eigenschaften zur Entscheidungsfindung korrekt zu klassifizieren.

Aufbau eines Waldes

Ein einzelner Entscheidungsbaum stößt für komplexere Probleme schnell an seine Grenzen. Der Trick bei Random Forests besteht darin, nicht nur einen, sondern viele solcher Entscheidungsbäume zu generieren. Jeder dieser Bäume nutzt eine unterschiedliche Kombination und Reihenfolge von Entscheidungskriterien.

Für neu zu klassifizierende Daten wird jedem Baum der selbe Datensatz zugeführt. Welcher Klasse der Random Forest den neuen Datensatz zuordnet, hängt dann von den Einzelentscheidungen der Bäume ab. Im Grunde ist ein Random Forest daher ein Mehrheitsentscheid vieler einzelner Entscheidungsbäume.

Unser E-Book zum Thema Wie Ihr Unternehmen von Künstlicher Intelligenz (KI) profitieren kann

E-Book: Wie Ihr Unternehmen von Künstlicher Intelligenz (KI) profitieren kann

In unserem E-Book erfahren Sie die wichtigsten Inhalte rund um das Thema künstliche Intelligenz & wie Sie davon profitieren können!

Vorteile von Random Forests

Das Klassifizieren von Datensätzen mithilfe von Random Forests bietet einige Vorteile:

  • Die Trainingszeit von Random Forests ist im Vergleich zu einigen anderen Machine-Learning-Verfahren sehr gering.
  • Die Entscheidungen der einzelnen Bäume sind voneinander unabhängig. Das führt dazu, dass sich Random Forests sehr gut parallelisieren lassen.
  • Im Gegensatz zu manch anderen Verfahren – wie vor allem neuronalen Netzen – lässt sich das Entscheidungsverhalten von Random Forests verhältnismäßig leicht untersuchen. So können Sie besser nachvollziehen, warum das KI-Modell bestimmte Entscheidungen trifft.
KI - Grundlagen und BP
Sie möchten gerne mehr zum Thema Künstliche Intelligenz erfahren und wie Ihr Unternehmen davon profitieren kann? In unserem Webinar fassen wir Ihnen die wichtigsten Aspekte zusammen!

Fazit

Random Forests sind ein sehr nützliches Tool, um Machine Learning anzuwenden. Es ist jedoch bei weitem nicht die einzige Möglichkeit, um Entscheidungen auf der Grundlage von historischen Daten zu treffen. Möchten Sie mehr erfahren? Schauen Sie doch auch in unsere anderen Beiträge zum Thema Künstliche Intelligenz, wie beispielsweise meinen Beitrag „Wie funktioniert Deep Learning?“.

Sie möchten mehr zu den Einsatzmöglichkeiten von KI in Ihrem Unternehmen erfahren? Haben Sie vielleicht schon konkrete Anwendungsfälle, zu denen Sie Beratung oder Unterstützung in der Umsetzung brauchen? Kontaktieren Sie mich, ich stehe Ihnen gerne zur Verfügung!

Verwandte Beiträge

Das Incidentmanagement ist für viele Menschen im IT-Dienstleisterumfeld ein Begriff. Dass es ein Prozess des ITIL-Frameworks ist, wissen hingegen schon weniger und welche Aufgabe und Ziele es verfolgt, können nur […]
Deep Learning ist eines der großen Buzzwords zum Thema KI und Big Data. Meistens fällt dieser Begriff im Zusammenhang mit hervorragenden Ergebnissen von Künstlicher Intelligenz, sei es in der Bilderkennung […]
In immer mehr Unternehmen spielt Künstliche Intelligenz (KI) eine zunehmend wichtigere Rolle. Bedenkt man, welche Vorteile die Technologie mit sich bringt, ist das nicht weiter verwunderlich. Viele Vorgänge können mit […]
Künstliche Intelligenz (KI) ist eine Zukunftstechnologie, die sich aktuell zu einem immer bedeutsameren Bestandteil der Arbeitswelt entwickelt. Was müssen Unternehmen vor dem Einsatz der Technologie beachten? Bereits in meinem ersten […]