Wie funktioniert Machine Learning? – Random Forests

mindsquare » Fachartikel » Künstliche Intelligenz

4. Dezember 2019

Wie funktioniert Machine Learning? – Random Forests

Machine Learning ist ein Teilbereich von Künstlicher Intelligenz und befasst sich mit dem künstlichen Lernen aus historischen Daten. In diesen Daten sollen Muster und Regelmäßigkeiten erkannt werden, um daraus Entscheidungsregeln abzuleiten. Wie das genau funktioniert, kann allerdings von Modell zu Modell stark variieren. Ich möchte in diesem Beitrag auf eines der möglichen Verfahren eingehen: Random Forests.

Entscheidungsbäume

Grundlage eines Random Forests sind Entscheidungsbäume. Solch ein Baum besteht aus einer Verzweigung von einfachen Regeln zum Einteilen der historischen Datensätze in die jeweiligen Klassen anhand von deren Eigenschaften (siehe Bild). Welche Eigenschaften genau zum Treffen der Entscheidung genutzt werden, ist dabei zufällig bestimmt und daher von Baum zu Baum unterschiedlich.

Bei der Abbildung handelt es sich um ein Beispiel, bei dem ein Baum die Kategorien einer Person erfasst. Hier ist der Ausgangspunkt die Berufstätigkeit, je nach Ergebnis werden weitere Kategorien abgefragt. Bei diesen wird wiederum entschieden, ob die Eigenschaft zutrifft oder nicht. Zum Abschluss wird die Person dann einer Klasse zugeordnet.

Ziel eines einzelnen Baums ist dabei nicht, alle Datensätze korrekt einer Klasse zuzuordnen. Stattdessen wird lediglich versucht, so viele Datensätze wie möglich auf Grundlage der ermittelten Eigenschaften zur Entscheidungsfindung korrekt zu klassifizieren.

Aufbau eines Waldes

Ein einzelner Entscheidungsbaum stößt für komplexere Probleme schnell an seine Grenzen. Der Trick bei Random Forests besteht darin, nicht nur einen, sondern viele solcher Entscheidungsbäume zu generieren. Jeder dieser Bäume nutzt eine unterschiedliche Kombination und Reihenfolge von Entscheidungskriterien.

Für neu zu klassifizierende Daten wird jedem Baum der selbe Datensatz zugeführt. Welcher Klasse der Random Forest den neuen Datensatz zuordnet, hängt dann von den Einzelentscheidungen der Bäume ab. Im Grunde ist ein Random Forest daher ein Mehrheitsentscheid vieler einzelner Entscheidungsbäume.

Vorteile von Random Forests

Das Klassifizieren von Datensätzen mithilfe von Random Forests bietet einige Vorteile:

Die Trainingszeit von Random Forests ist im Vergleich zu einigen anderen Machine-Learning-Verfahren sehr gering.
Die Entscheidungen der einzelnen Bäume sind voneinander unabhängig. Das führt dazu, dass sich Random Forests sehr gut parallelisieren lassen.
Im Gegensatz zu manch anderen Verfahren – wie vor allem neuronalen Netzen – lässt sich das Entscheidungsverhalten von Random Forests verhältnismäßig leicht untersuchen. So können Sie besser nachvollziehen, warum das KI-Modell bestimmte Entscheidungen trifft.

Webinar: Künstliche Intelligenz – Grundlagen und Best Practices

Sie möchten gerne mehr zum Thema Künstliche Intelligenz erfahren und wie Ihr Unternehmen davon profitieren kann? In unserem Webinar fassen wir Ihnen die wichtigsten Aspekte zusammen!

Fazit

Random Forests sind ein sehr nützliches Tool, um Machine Learning anzuwenden. Es ist jedoch bei weitem nicht die einzige Möglichkeit, um Entscheidungen auf der Grundlage von historischen Daten zu treffen. Möchten Sie mehr erfahren? Schauen Sie doch auch in unsere anderen Beiträge zum Thema Künstliche Intelligenz, wie beispielsweise meinen Beitrag „Wie funktioniert Deep Learning?“.

Sie möchten mehr zu den Einsatzmöglichkeiten von KI in Ihrem Unternehmen erfahren? Haben Sie vielleicht schon konkrete Anwendungsfälle, zu denen Sie Beratung oder Unterstützung in der Umsetzung brauchen? Kontaktieren Sie mich, ich stehe Ihnen gerne zur Verfügung!

Xing LinkedIn Facebook E-Mail

Max-Ludwig Stadler

Nach meinem Masterstudium in Informatik habe ich meine Begeisterung für IT zum Beruf gemacht und bin als zertifizierter SAP-Consultant bei der mindsquare im Fachbereich Mission-Mobile tätig. Meine Schwerpunkte liegen vor allem in der UI5- und Neptune-Entwicklung, sowie im Bereich Machine Learning.

Sie haben Fragen? Kontaktieren Sie mich!