mindsquare.de durchsuchen

Wie funktioniert Deep Learning?

Wie funktioniert Deep Learning?

Deep Learning ist eines der großen Buzzwords zum Thema KI und Big Data. Meistens fällt dieser Begriff im Zusammenhang mit hervorragenden Ergebnissen von Künstlicher Intelligenz, sei es in der Bilderkennung oder zum Beispiel beim Verstehen und Erzeugen von menschlicher Sprache (Siri, Alexa und Co.). Doch was steckt genau hinter Deep Learning und wie lernt meine KI dabei? Diese Fragen möchte ich in diesem Beitrag auf möglichst einfache Weise beantworten.

Die Ausgangssituation: Wetterdaten

Um den Ablauf hinter dem Aufbau und dem Training eines neuronalen Netzes zu verstehen, bietet sich ein einfaches Beispiel an: Die Vorhersage des Wetters in Bielefeld. Wir veranschaulichen den Fall noch ein bisschen weiter und wollen von unserer KI wissen, ob morgen in Bielefeld die Sonne scheinen wird. Als Grundlage für diese Vorhersage soll unser Modell auf Wetterdaten des Vortages zugreifen.

Nehmen wir einmal an, wir haben uns bereits so weit vorbereitet, dass die Wetterdaten diverser Wetterstationen vorliegen und wir uns um den wichtigen Schritt der Datenbeschaffung und Vorverarbeitung keine Gedanken mehr machen müssen. Unser Ziel ist nun, mithilfe von Deep Learning ein möglichst akkurates Modell zur Vorhersage des morgigen Wetters zu erstellen. Dafür erstellen wir uns ein tiefes Neuronales Netz.

E-Book: Wie Ihr Unternehmen von Künstlicher Intelligenz (KI) profitieren kann

E-Book: Wie Ihr Unternehmen von Künstlicher Intelligenz (KI) profitieren kann

In unserem E-Book erfahren Sie die wichtigsten Inhalte rund um das Thema künstliche Intelligenz & wie Sie davon profitieren können!

Woraus besteht so ein neuronales Netz?

Die Antwort auf diese Frage versteckt sich bereits im Namen: Ein neuronales Netz besteht aus Neuronen. Der Aufbau eines solchen Neurons (in diesem Zusammenhang auch Perzeptron genannt) orientiert sich an dem Aufbau der Neuronen in unserem Gehirn.

Ein Neuron verfügt über Eingänge, über die Signale zum Neuron gelangen und dort zusammengefasst werden. Die Stärke dieser Signale kann unterschiedlich sein. Wenn die Gesamtstärke aller Signale einen gewissen Schwellwert überschreitet, sendet das Neuron selbst ein Signal über seinen Ausgangskanal (der rechte Pfeil).

Was das Neuron dabei vor allem ausmacht, ist die Gewichtung der einzelnen Eingangssignale. So kann es sein, dass es bereits ausreicht, wenn am obersten Eingang ein relativ schwaches Signal ankommt, um das Neuron ein Signal senden zu lassen, während auf den unteren Kanälen recht hohe Signale ankommen müssten, um den gleichen Effekt zu erzielen. Dieses Gewichten der Eingangssignale ist das, was während des Trainings eines Neurons eingestellt wird, um ein Problem zu lösen.

Neuronales Netz

Neuronale Netze anhand unseres Wetter-Beispiels

Nehmen wir an, wir wollen für das Bestimmen unseres Wetters genau ein solches Neuron trainieren. Zur Verfügung stehen uns dabei die Daten von drei Wetterstationen: Eine in Bielefeld, eine in Hannover und eine in Dortmund. Von diesen holen wir uns jeweils die Info, wie viele Sonnenstunden es heute am jeweiligen Ort gab, um unsere Vorhersage für morgen zu treffen. Die Zahlen der Sonnenstunden repräsentieren damit unsere Eingangssignale (mehr Sonnenstunden = stärkeres Signal). Wenn das Neuron für solch eine Eingabe den Schwellwert überschreitet und ein Ausgangsignal ausgibt, zeigt die Vorhersage, dass morgen die Sonne scheinen wird.

Neuronales Netz 2

Aber wie genau wird so ein Neuron trainiert?

Zu Beginn hat das Neuron noch eine voreingestellte oder schlicht zufällig bestimmte Gewichtung der Eingangssignale. Um diese Gewichtung richtig einzustellen, brauchen wir historische Daten unserer Wetterstationen, sowie die Info, ob an den jeweiligen Folgetagen die Sonne schien.

Diese historischen Daten legen wir nun nacheinander an die Eingänge des Neurons und beobachten die Ausgabe. Ist diese falsch (das Neuron sendet Signale, obwohl am nächsten Tag nicht die Sonne schien oder umgekehrt), werden die Gewichtungen der Eingangssignale so angepasst, dass die Ausgabe korrekt ist. Dieser Vorgang wird mit allen Daten durchgeführt. Das Ergebnis ist im besten Fall eine passende Konfiguration der Gewichtungen aller Eingangssignale, sodass das Neuron für alle historischen Daten die korrekte Vorhersage treffen konnte.

Da unser Wetter natürlich sehr viel komplexer ist, als die Daten, die wir zur Verfügung stellen, wird es sehr wahrscheinlich nicht möglich sein, eine Gewichtung der Eingangskanäle zu finden, für die alle Vorhersagen gleichermaßen passend sein werden. Daher wird hier lediglich versucht, so viele korrekte Vorhersagen auf der Basis unserer historischen Daten zu erreichen, wie möglich.

Mehr Neuronen gleich besseres Ergebnis?

Unser Beispiel bestand bisher nur aus einem Neuron. Die Fähigkeiten eines einzelnen Neurons, Probleme zu lösen, sind stark begrenzt. Die wahre Power dieses Konzepts kommt aus der Nutzung sehr viele solcher Neuronen. So können wir unser Beispiel ein wenig anpassen, in dem wir statt einem nun beispielsweise drei Neuronen verwenden.

Neuronales Netz 3

Zwei dieser Neuronen sind genauso aufgebaut, wie im vorigen Beispiel. Alle Eingangskanäle werden mit den Daten der Wetterstationen bespielt, diese Neuronen bilden die Eingangsschicht. Interessant ist vor allem, was wir mit dem dritten Neuron anstellen – das hat nämlich keine direkte Verbindung zu den Wetterdaten. Stattdessen sind deren Eingangskanäle mit den Ausgängen der beiden anderen Neuronen verbunden. Dadurch bekommt dieses Neuron lediglich die Infos, welche der beiden linken Neuronen ein Ausgangssignal produziert haben. Der Ausgang dieses dritten Neurons entspricht nun unserer Vorhersage, ob morgen die Sonne scheint und bildet die Ausgangsschicht.

Dieser Aufbau vervielfacht die Anzahl an Einstellungsmöglichkeiten für unser neuronales Netz. Wir können im Training nun die Gewichtungen beider linker Neuronen unabhängig voneinander und die Gewichtungen des rechten Neurons – also das Gewicht, mit dem die Entscheidung der linken Neuronen das Endergebnis beeinflussen – anpassen. Dadurch sind wir in der Lage, deutliche komplexere Entscheidungen zu treffen und Probleme zu lösen.

Ist das jetzt schon Deep Learning?

Jetzt haben wir zwar schon ein neuronales Netz, doch wie wird daraus ein tiefes neuronales Netz? Die Antwort ist relativ simpel: Wir fügen weitere Schichten hinzu. Wir können zwischen die Eingangs- und Ausgangsschicht beliebig viele weitere Schichten legen. Die Neuronen dieser Schichten erhalten jeweils die Signale der vorherigen Schicht als Eingangssignale und geben ihr Ausgangssignal an die Neuronen der Folgeschicht weiter. Ein Netz, dass über solche versteckten Schichten verfügt, nennt man tiefes neuronales Netz. Die Anzahl an solchen Schichten kann in der Realität übrigens von Fall zu Fall sehr unterschiedlich ausfallen.

KI - Grundlagen und BP
Sie möchten gerne mehr zum Thema Künstliche Intelligenz erfahren und wie Ihr Unternehmen davon profitieren kann? In unserem Webinar fassen wir Ihnen die wichtigsten Aspekte zusammen!

Und was stellt so ein tiefes neuronales Netz mit den ganzen Schichten an?

Das Training eines solchen neuronalen Netzes hat zum Ziel, alle Gewichtungen in diesem Netz optimal einzustellen, sodass unsere Vorhersage auf den historischen Daten möglichst genau wird. Davon erhoffen wir uns auch möglichst gute Vorhersagen für zukünftige Eingaben, von denen wir den tatsächlichen Ausgang noch nicht vorher kennen. Doch welche Rolle spielt dabei ein einzelnes Neuron für das Endergebnis?

Auf diese Frage gibt es keine allgemeingültige Antwort. Die Vorgänge in einem trainierten neuronalen Netz sind – gerade bei größeren Netzen – in der Regel eine Blackbox, bei der wir nicht genau nachvollziehen können, wieso genau eine bestimmte Entscheidung getroffen wurde.

Forschungen zeigen, dass in den vorderen Schichten meist simplere Merkmale in den Daten gesucht werden, die dann in den Folgeschichten zu komplexeren Merkmalen zusammengesetzt werden. In unserem Wetterbeispiel – nehmen wir an, wir hätten nun deutlich mehr Wetterstationen zur Verfügung – könnten das beispielsweise lokale Wetterphänomene, wie Regenfronten oder Ähnliches, sein, die dann in den tieferen Schichten zu komplexeren Bewegungen zusammengesetzt werden. Die endgültige Entscheidung findet dann in den letzten Schichten auf Grundlage dieser komplexeren Merkmale statt.

Fazit

Ich hoffe, ich konnte Ihnen einen ersten Einblick in die Abläufe und die Theorie hinter Deep Learning geben. Um das Ganze besser zu veranschaulichen, habe ich auf einige Details verzichtet (beispielsweise Bias, Overfitting oder Aktivierungsfunktionen). Sollten Sie dazu noch nähere Informationen brauchen, oder auch in anderen Gebieten der KI einen Einblick erhalten wollen, kontaktieren Sie mich gerne.

Kennen Sie schon unseren KI Potenzialworkshop? Hier schaffen wir für Sie einen tieferen Einblick in das Thema KI, zeigen mögliche praktische Anwendungsfälle und gehen auf Voraussetzungen sowie Chancen ein.

Haben Sie weitere Fragen oder Anmerkungen? Gerne stehe ich Ihnen zur Verfügung.

Verwandte Beiträge

Machine Learning befasst sich mit dem künstlichen Lernen von Maschinen aus historischen Daten. In diesen sollen KIs Muster und Regelmäßigkeiten erkennen, um Entscheidungsregeln abzuleiten. Wie genau das abläuft, kann aber […]
In immer mehr Unternehmen spielt Künstliche Intelligenz (KI) eine zunehmend wichtigere Rolle. Bedenkt man, welche Vorteile die Technologie mit sich bringt, ist das nicht weiter verwunderlich. Viele Vorgänge können mit […]
Künstliche Intelligenz (KI) ist eine Zukunftstechnologie, die sich aktuell zu einem immer bedeutsameren Bestandteil der Arbeitswelt entwickelt. Was müssen Unternehmen vor dem Einsatz der Technologie beachten? Bereits in meinem ersten […]
Künstliche Intelligenz (KI) setzt sich in immer mehr Unternehmen durch und sorgt dort für eine Optimierung vieler unterschiedlicher Prozesse. Eine gelungene KI-Einführung erfordert jedoch entsprechendes Knowhow. Damit Sie wissen, was […]

Beratung und Unterstützung für die Unternehmens-IT

  • Individualentwicklung für SAP und Salesforce
  • SAP S/4HANA-Strategieentwicklung, Einführung, Migration
  • Mobile App Komplettlösungen – von der Idee über die Entwicklung und Einführung bis zum Betrieb, für SAP Fiori und Salesforce Lightning
  • Automatisierung von Prozessen durch Schnittstellen, künstliche Intelligenz (KI) und Robotic Process Automation (RPA)
  • Beratung, Entwicklung, Einführung
  • Formular- und Outputmanagement, E-Rechnung & SAP DRC
  • SAP Archivierung und SAP ILM
  • SAP Basis & Security, Enterprise IT-Security & Datenschutz
  • SAP BI & Analytics
  • Low Code / No Code – Lösungen

Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:

Besondere Prozessexzellenz im Bereich Personal / HR

  • Knowhow in Personalprozessen und IT-Technologien verbinden
  • HR-Berater, die IT-ler und Personaler in einer Person sind
  • Beratung zu HR IT Landschafts- & Roadmap sowie HR Software Auswahl
  • Beratung und Entwicklung im SAP HCM, SuccessFactors und der SAP Business Technology Platform
  • HCM for S/4HANA (H4S4) Migration & Support
  • Als Advisory Partner Plattform und Prozessberatung in Workday
  • Mobile Development mit SAP Fiori, SAPUI5, HTML5 und JavaScript
  • Marktführer im Bereich ESS/MSS

Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:

Besondere Prozessexzellenz im Bereich Produktion & Logistik

  • Optimierung und Digitalisierung von Produktions- und Logistikprozessen sowie Einkaufs- und Vertriebsprozessen
  • Einführung mobiler Datenerfassung in Produktion, Lager und Instandhaltung
  • Umfassendes Knowhow in den SAP-Modulen LO, MM, SD, WM, PM und CCS/CCM
  • Modul-Beratung & Einführung, Entwicklung individueller (mobiler) Anwendungen
  • Beratung und Entwicklung in der SAP Freischaltungsabwicklung (SAP WCM, eWCM)
  • Optimierung sämtlicher Prozesse im Bereich der nachträglichen Vergütung (Bonus)

Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:

Besondere Prozessexzellenz im Bereich Vertrieb & Service

  • Vertriebs- & Service-Prozesse auf Basis von Salesforce
  • Beratung, Einführung und Entwicklung für Salesforce-Lösungen: Sales Cloud, Service Cloud, Marketing Cloud inkl. Account Engagement (ehem. Pardot)
  • Salesforce Customizing: Individuelle Lösungen in Salesforce, u.a. für Chemie-Branche
  • Betriebsunterstützung und Service für Salesforce-Kunden
  • Schnittstellen-Entwicklung, besondere Expertise SAP – Salesforce Integration

Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:

msDevSupport

Service / Development Support

  • fester, eingearbeiteter Ansprechpartner als Koordinator
  • kontinuierliche Weiterentwicklung und Digitalisierung Ihres Unternehmens, z.B. Fehlerbehebung, Updates, neue Features implementieren
  • kleinere Entwicklungen realisieren, die kein Projektmanagement erfordern
  • günstige Abrechnungen pro h
  • sehr einfache und schnelle Beauftragung auf Zuruf
  • ständige Verfügbarkeit: (Teil-)Ressourcen geblockt für Sie
  • kurze Reaktionszeiten 2 – 24h
  • Wir halten Wissen vor und stellen Stellvertretung sicher

msSolution

Projekte

  • Projektleitung und Steering inklusive Qualitätssicherung
  • „Wir machen Ihr fachliches Problem zu unserem.“
  • mindsquare steuert IT-Experten selbst
  • Abrechnung pro Tag
  • Längerer Angebots- und Beauftragungsprozess
  • Lieferzeit 6 – 12 Wochen ab Auftragseingang
  • Zum Auftragsende Transition zu einem Service & Support notwendig, um schnell helfen zu können

msPeople

IT-Experten auf Zeit

  • Wir lösen Ihren personellen Engpass, z.B. liefern von IT-Experten für Ihr laufendes Projekt
  • Breites Experten-Netzwerk für praktisch jedes Thema und Budget:
  • interne festangestellte mindsquare Mitarbeiter:innen
  • externe Experten aus unserem Netzwerk von 27.000 Freiberufler:innen aus Deutschland
  • externe Experten im Nearshoring mit derzeit 37 Partnern
  • Verbindliches Buchen der Experten in einem definierten Zeitraum an festen Tagen
  • Ohne Projektleitung und Steering, Sie steuern die Experten
  • Lieferzeit in der Regel 2 – 6 Wochen
  • Nach Auftragsende KEIN Vorhalten von Experten und Knowhow