Machine Learning ist ein Teilbereich von Künstlicher Intelligenz und befasst sich mit dem künstlichen Lernen aus historischen Daten. In diesen Daten sollen Muster und Regelmäßigkeiten erkannt werden, um daraus Entscheidungsregeln abzuleiten. Wie das genau funktioniert, kann allerdings von Modell zu Modell stark variieren. Ich möchte in diesem Beitrag auf eines der möglichen Verfahren eingehen: Random Forests.
Grundlage eines Random Forests sind Entscheidungsbäume. Solch ein Baum besteht aus einer Verzweigung von einfachen Regeln zum Einteilen der historischen Datensätze in die jeweiligen Klassen anhand von deren Eigenschaften (siehe Bild). Welche Eigenschaften genau zum Treffen der Entscheidung genutzt werden, ist dabei zufällig bestimmt und daher von Baum zu Baum unterschiedlich.
Bei der Abbildung handelt es sich um ein Beispiel, bei dem ein Baum die Kategorien einer Person erfasst. Hier ist der Ausgangspunkt die Berufstätigkeit, je nach Ergebnis werden weitere Kategorien abgefragt. Bei diesen wird wiederum entschieden, ob die Eigenschaft zutrifft oder nicht. Zum Abschluss wird die Person dann einer Klasse zugeordnet.
Ziel eines einzelnen Baums ist dabei nicht, alle Datensätze korrekt einer Klasse zuzuordnen. Stattdessen wird lediglich versucht, so viele Datensätze wie möglich auf Grundlage der ermittelten Eigenschaften zur Entscheidungsfindung korrekt zu klassifizieren.
Ein einzelner Entscheidungsbaum stößt für komplexere Probleme schnell an seine Grenzen. Der Trick bei Random Forests besteht darin, nicht nur einen, sondern viele solcher Entscheidungsbäume zu generieren. Jeder dieser Bäume nutzt eine unterschiedliche Kombination und Reihenfolge von Entscheidungskriterien.
Für neu zu klassifizierende Daten wird jedem Baum der selbe Datensatz zugeführt. Welcher Klasse der Random Forest den neuen Datensatz zuordnet, hängt dann von den Einzelentscheidungen der Bäume ab. Im Grunde ist ein Random Forest daher ein Mehrheitsentscheid vieler einzelner Entscheidungsbäume.
In unserem E-Book erfahren Sie die wichtigsten Inhalte rund um das Thema künstliche Intelligenz & wie Sie davon profitieren können!
Das Klassifizieren von Datensätzen mithilfe von Random Forests bietet einige Vorteile:
Random Forests sind ein sehr nützliches Tool, um Machine Learning anzuwenden. Es ist jedoch bei weitem nicht die einzige Möglichkeit, um Entscheidungen auf der Grundlage von historischen Daten zu treffen. Möchten Sie mehr erfahren? Schauen Sie doch auch in unsere anderen Beiträge zum Thema Künstliche Intelligenz, wie beispielsweise meinen Beitrag „Wie funktioniert Deep Learning?“.
Sie möchten mehr zu den Einsatzmöglichkeiten von KI in Ihrem Unternehmen erfahren? Haben Sie vielleicht schon konkrete Anwendungsfälle, zu denen Sie Beratung oder Unterstützung in der Umsetzung brauchen? Kontaktieren Sie mich, ich stehe Ihnen gerne zur Verfügung!