Datenschutz und Künstliche Intelligenz stehen in einem Spannungsfeld: Sollen KI-Systeme effektiv unterstützen, müssen sie oft mit sensiblen Daten arbeiten. Damit diese beim Training von KI-Modellen optimal geschützt bleiben, wurde Federated Learning oder föderiertes Lernen entwickelt. Bei diesem Ansatz werden die Daten nicht an zentrale Server geschickt, sondern bleiben auf lokalen Systemen. Datenschutz und Vertraulichkeit sind damit jederzeit gewahrt. Dieser Beitrag erklärt, wie Föderiertes Lernen genau funktioniert, welche Formen es gibt und wo es bereits eingesetzt wird.
Föderiertes Lernen ist ein Ansatz des maschinellen Lernens, bei dem Modelle dezentral, also direkt auf den lokalen Geräten oder Servern der Teilnehmer, trainiert werden. Anstatt Daten in einem zentralen Pool oder auf einem Server zu sammeln, verbleiben sie bei den jeweiligen Teilnehmern – etwa auf Unternehmensservern, in Kliniken oder auf mobilen Endgeräten. Nur die trainierten Modellparameter oder Gradienten werden ausgetauscht und anschließend auf einem zentralen Server zu einem globalen Modell zusammengeführt.
Das Verfahren verbindet damit kollaboratives Lernen mit hohen Anforderungen an Datenschutz und Datensicherheit. Verschiedene Unternehmen oder Abteilungen können KI-Modelle über verteilte Datensätze hinweg entwickeln, ohne sensible Informationen weitergeben zu müssen. Dadurch eröffnet Föderiertes Lernen neue Möglichkeiten in Bereichen, in denen klassische Machine-Learning-Methoden durch Datensilos oder rechtliche Einschränkungen an ihre Grenzen kommen.
Der Lernprozess im Federated Learning lässt sich in vier zentrale Phasen gliedern:
Das Verfahren kombiniert damit die Vorteile zentraler Koordination mit der Datensouveränität dezentraler Systeme. Es handelt sich um einen Prozess mit mehreren Durchgängen, bei dem sich das globale Modell schrittweise durch die Rückmeldungen der einzelnen Teilnehmer verbessert.
In diesem kostenlosen E-Book finden Sie konkrete Beispiele, wie KI in den verschiedensten Abteilungen eines Unternehmens Mehrwert schaffen kann.
Föderiertes Lernen kann in verschiedene Typen unterteilt werden, die sich nach der Art der beteiligten Datenquellen und deren Verteilung unterscheiden:
Dieser Ansatz nutzt eine Vielzahl von Endgeräten wie Smartphones oder IoT-Geräte. Da diese Geräte meist nur über kleine Datensätze verfügen und nicht permanent verbunden sind, wird eine große Anzahl von Teilnehmern benötigt, damit das KI-Modell zügig Lernfortschritte erzielt. Ein typisches Einsatzszenario ist die gemeinsame Verbesserung von Sprach- oder Texteingabevorhersagen auf Mobiltelefonen.
Bei siloübergreifendem Federated Learning ist eine kleinere Zahl stabiler und leistungsfähiger Teilnehmer beteiligt, etwa Server von Krankenhäusern, Banken oder Forschungseinrichtungen. Sie verfügen über große, hochwertige Datensätze und eine verlässliche Netzwerkverbindung. Der Fokus liegt auf der Kooperation zwischen den Institutionen, ohne sensible Daten austauschen zu müssen.
Bei horizontalem Föderierten Lernen teilen die beteiligten Datensätze die gleiche Struktur. Sie haben also identische Merkmale. Allerdings unterscheiden sie sich in den Stichproben. Beispiel: Mehrere Banken trainieren ein gemeinsames KI-Modell, weil ihre Daten ähnliche Variablen enthalten, aber unterschiedliche Kundengruppen abdecken.
Im vertikalen Föderierten Lernen beziehen sich die Daten auf dieselben Stichproben, aber die Struktur der Datensätze unterscheidet sich. Beispiel: Zwei Unternehmen besitzen Daten zu denselben Kunden, jedoch mit unterschiedlichen Variablen (Ein Händler kennt das Kaufverhalten, eine Bank kennt die Kreditwürdigkeit). Durch Zusammenführung der Modellinformationen können beide von einem umfassenderen Modell profitieren.
Föderiertes Lernen wird oft mit allgemeinem „verteiltem Lernen“ gleichgesetzt, unterscheidet sich jedoch in einem wesentlichen Punkt: Beim klassischen verteilten Lernen liegen die Daten zentral vor und werden dann auf mehrere Rechenknoten verteilt, um die Trainingslast zu parallelisieren. Ziel ist hier vor allem die Steigerung von Rechenleistung und Effizienz.
Im Föderierten Lernen hingegen verbleiben die Daten dauerhaft bei den Teilnehmern. Das Training findet dezentral statt, und nur Modellaktualisierungen oder Gradienten werden weitergegeben. Damit steht nicht die Verteilung der Rechenlast im Vordergrund, sondern der Schutz sensibler Daten und die Möglichkeit, trotz getrennter Datensilos ein gemeinsames Modell zu entwickeln.
Der Ansatz des föderierten Lernens bringt eine Reihe von Vorteilen mit sich, die ihn insbesondere für datensensible Anwendungsbereiche attraktiv machen:
Trotz seiner Vorteile steht föderiertes Lernen vor mehreren technischen und organisatorischen Hürden.
Diese Herausforderungen machen deutlich, dass föderiertes Lernen nicht nur technisches, sondern auch organisatorisches Vertrauen und klare Standards erfordert.
Föderiertes Lernen wird vor allem dort eingesetzt, wo große Datenmengen entstehen, die jedoch sensibel oder rechtlich geschützt sind.
Damit Föderiertes Lernen nicht nur in der Theorie, sondern auch in der Praxis umgesetzt werden kann, wurden in den vergangenen Jahren spezialisierte Software-Frameworks entwickelt. Sie bieten die notwendige Infrastruktur, um die Kommunikation zwischen Teilnehmern und zentralem Server zu organisieren, Modellparameter sicher zu übertragen und die Trainingsprozesse zu koordinieren.
Einige dieser Frameworks sind speziell für Forschungszwecke konzipiert, andere richten sich an Unternehmen, die föderierte Ansätze in großem Maßstab einsetzen möchten. Zu den bekanntesten Frameworks gehören:
Föderiertes Lernen zeigt, wie sich die Weiterentwicklung leistungsfähiger KI-Modelle mit hohen Anforderungen an Datenschutz und Datensouveränität verbinden lässt. Anstatt Daten zentral zu sammeln, verbleiben sie bei den jeweiligen Teilnehmern, während nur Modellinformationen ausgetauscht werden. Damit wird es möglich, über Unternehmens- oder Institutionsgrenzen hinweg zu kooperieren und maschinelle Lernformen zu optimieren, während gleichzeitig sensible Informationen geschützt bleiben.
Noch ist föderiertes Lernen in der Entwicklung und stellt Unternehmen vor einige Herausforderungen: Sie müssen einen relativ hohen Kommunikationsaufwand einplanen, sich spezifischer Sicherheitsrisiken bewusst sein und den Umgang mit heterogener Technologie bewältigen. Es eröffnet jedoch bereits heute wichtige Chancen für die KI-Entwicklung in besonders datenschutzsensiblen Feldern wie dem Gesundheitswesen, Finanzen und Smart Cities.
Mit der Weiterentwicklung der technischen Standards und geeigneter Frameworks dürfte Föderiertes Lernen künftig eine zentrale Rolle im Bereich des datenschutzbewussten maschinellen Lernens einnehmen.
Föderiertes Lernen ermöglicht das gemeinschaftliche Training eines KI-Modells auf verteilten Datenquellen, ohne dass die Rohdaten zentral zusammengeführt werden. Stattdessen werden nur Modellaktualisierungen geteilt und aggregiert. Im Gegensatz zur klassischen Vorgehensweise, bei der alle Daten an einem Ort zusammenkommen, sind hier die Risiken für den Datenschutz minimiert.
Die Daten verbleiben lokal bei den Teilnehmern, zum Beispiel auf Unternehmensservern oder Endgeräten, und werden nicht zentralisiert. So verringert sich das Risiko von Datenlecks oder Missbrauch deutlich.
Typische Einsatzbereiche umfassen das Gesundheitswesen (z. B. hospitalspezifische Modelle ohne Patientenaustausch), das Finanzwesen (z. B. Betrugserkennung ohne Weitergabe vertraulicher Transaktionsdaten), mobile Anwendungen (wie Tastatur-Optimierung), IoT-Umgebungen und autonome Systeme.
Wenn Sie Unterstützung zum Thema Federated Learning benötigen, stehen Ihnen die Experten der mindsquare AG zur Verfügung. Unsere Berater helfen Ihnen, Ihre Fragen zu beantworten, das passende Tool für Ihr Unternehmen zu finden und es optimal einzusetzen. Vereinbaren Sie gern ein unverbindliches Beratungsgespräch, um Ihre spezifischen Anforderungen zu besprechen.
Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:
Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:
Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:
Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen: