mindsquare.de durchsuchen

Amazon Comprehend – Machine Learning mittels NLP

Amazon Comprehend steht für die Analyse unstrukturierter Textdaten mittels NLP (Natural Language Processing). Verschiedene Analysetools des cloudbasierten Services extrahieren Schlüsselphrasen, erkennen die Tonalität eines Textes hinsichtlich der Stimmung oder filtern im Rahmen der Entitäten-Erkennung Namen oder Orte heraus.

Amazon Comprehend ist ein vollständig verwalteter Service. Server müssen daher genauso wenig bereitgestellt wie Machine Learning Modelle entwickelt werden. Für Gesundheitsdienstleister und Forscher wurde in Form von Amazon Comprehend Medical eine spezielle Version entwickelt.

Textanalyse

Als NLP-Service nutzt Comprehend eine Form des maschinellen Lernens und ermöglicht dadurch die Kommunikation von Maschinen mit in menschlicher Sprache erstellten Textdokumenten. Die Grundlage bilden unstrukturierte Textdaten von Unternehmen, die an verschiedensten Orten gespeichert sind. Durch die Entwicklung von NLP-Services sind Unternehmen nun in der Lage, daraus effizient und gezielt wichtige Informationen zur Entwicklung zielgerichteter Unternehmens-. Produkt-, Kundenorientierungs- und Online- sowie Marketing-Strategien zu gewinnen.

Amazon Comprehend analysiert das bisher brach liegende Potenzial von Produktrezensionen, Kundendienstereignissen, E-Mails, Feeds in Social Media und vielen anderen Textformaten. Dadurch gewinnen Unternehmen wichtige und bisher verborgene Erkenntnisse, die sie zur Entwicklung zielgerichteter Strategien nutzen. Die Analysetools von Comprehend erkennen sogar durch die Tonalität der gewählten Worte die Stimmung eines Textes.

Wie Ihr Unternehmen von Künstlicher Intelligenz (KI) profitieren kann

In unserem E-Book erfahren Sie die wichtigsten Inhalte rund um das Thema künstliche Intelligenz & wie Sie davon profitieren können!

Amazon Comprehend Einsatzmöglichkeiten

Kenntnisse über maschinelles Lernen und das Erstellen von NLP-Lösungen sind beim Einsatz von Amazon Comprehend nicht erforderlich. Denn durch die Fähigkeit des maschinellen Lernens passt sich Comprehend kontinuierlich an die Anforderungen an.

Die Integration von NLP in bestehende Anwendungen erfolgt über spezielle APIs für Schlüsselbegriff-Extraktion, Entitätserkennung, Stimmungsanalyse, Spracherkennung oder Themenmodellierung. Der Nutzer ruft die Comprehend-API in seiner Anwendung auf, gibt den Speicherort der zu analysierenden Dokumente an und erhält die gewünschten Ergebnisse.

Abhängig vom Auftrag liefert Comprehend verschiedenste Erkenntnisse:

  • Objekte in Form einer Liste real existierender Personen-, Orts- oder Produktbezeichnungen (Entität)
  • Schlüsselsätze in Dokumenten (Schlüsselphrasen)
  • Emotionen im Text aufgrund der neutralen, positiven, negativen oder gemischt-emotionalen Formulierung
  • Syntax-Analysen, wobei Comprehend 17 Wortarten identifizieren kann
  • Identifikation der dominierenden Sprache der analysierten Dokumente; Comprehend erkennt aktuell 100 Sprachen.
  • Themenmodellierung

Comprehend nutzt für die Gewinnung der verschiedensten Erkenntnisse bereits fertige Modelle. Diese werden kontinuierlich auf Basis großer Textmengen trainiert, wodurch der Einsatz von Trainingsdaten entfällt.

NLP-Service

Als NLP-Service nutzt Amazon Comprehend die Technologie Machine Learning, um Unternehmen zuverlässige Ergebnisse zu liefern und setzt verschiedenste APIs als Schnittstellen ein. Der Service liefert alle Ergebnisse mit einem Zuversichtlichkeitswert aus. Dieser Wert definiert, wie hoch die Wahrscheinlichkeit ist, dass das ausgelieferte Ergebnis dem Auftrag entspricht. Dieser Wert wird auch als Vertrauenswert bezeichnet.

Schlüsselphrasenextraktion

Die API für Schlüsselphrasenextraktion sucht in den Dokumenten nach Schlüsselsätzen, die eine Nominalphrase enthalten. Jede Schlüsselphrase erhält von Comprehend eine Punkte-Bewertung, anhand der Anwender entscheiden, wie weit das Ergebnis die gestellten Anforderungen erfüllt.

Stimmungsanalyse

Mit der Stimmungsanalyse-API analysiert Amazon Comprehend die Emotionalität eines Textes. Anhand der Formulierung erkennt die API, ob die Grundstimmung im Text neutral, positiv, negativ oder gemischt ist.

Syntaxanalyse

Für die Aufgliederungen eines Textes in Token und Parts of Speech kommt die Syntax-API zum Einsatz. Sie ist in der Lage, Wortgrenzen zu erkennen sowie Substantive und Adjektive im Text von anderen Wortarten zu differenzieren.

Entitätenerkennung

Bei der Entitätenerkennung analysiert die dafür verantwortliche API Texte nach Entitäten, kategorisiert und zählt deren Vorkommen und gibt sie als Zuversichtlichkeitswert aus.

Benutzerdefinierte Entitäten

Vor allem Entitäten können sehr unternehmens- oder branchenspezifisch sein (beispielsweise Polizzen-Nummern in der Versicherungsbranche). Daher erhält der Anwender die Möglichkeit, die Analyse entsprechend anzupassen. Für diesen Zweck nutzt er AutoML und Comprehend lernt anhand eines kleinen privaten Beispielindexes. Diese Informationen werden an ein benutzerdefiniertes Modell weitergegeben, das nun in der Lage ist, die erforderlichen Begriffe in allen anderen Textblöcken zu erkennen. Anwender verwalten dafür weder einen Server noch müssen sie Algorithmen beherrschen.

Spracherkennung

Über die Spracherkennungs-API erkennt Amazon Comprehend die dominante Sprache der Dokumente und liefert das Ergebnis als Zuversichtlichkeitswert aus.

Benutzerdefinierte Klassifizierung

Branchenabhängig sind häufig benutzerdefinierte Klassifizierungen erforderlich. Über die API „Benutzerdefinierte Klassifizierung“ erstellt der Anwender unkompliziert individuelle branchenspezifische Bezeichnungen. Kenntnisse über Machine Learning sind dafür nicht erforderlich. In Form von Textbeispielen wird ein benutzerdefiniertes Modell erstellt, ohne dass dafür nur eine Zeile Code erforderlich ist. Über eine SDK integriert der Nutzer das Modell abschließend in die Anwendung. So ist das Unternehmen in der Lage, beispielsweise Kundenfeedback zu selektieren, Website-Kommentare zu moderieren und vieles mehr.

Topic Modellierung

Über die Topic Modellierung identifizieren Unternehmen alle relevanten Begriffe und Themen aus Dokumenten, die in Amazon S3 gespeichert sind. Bevor der Service die Dokumente zu Themen zuordnet, identifiziert und ordnet er Themen oder Begriffe in Gruppen.

Mehrsprachen-Support

Amazon Comprehend ist in der Lage, Dokumenten in den Sprachen Englisch, Französisch, Deutsch, Italienisch, Portugiesisch und Spanisch zu analysieren. Entwickelt ein Nutzer eine mehrsprachige Anwendung, übersetzt Amazon Translate diese in die gewünschten Sprachen und Comprehend führt die mehrsprachigen Textanalysen durch.

Amazon Comprehend Medical

Eine Variation zu Amazon Comprehend ist Amazon Comprehend Medical. Dieser Service arbeitet zwar nach dem gleichen Prinzip wie die nicht branchenspezifische Comprehend-Version, konzentriert sich jedoch auf komplexe medizinische Informationen. Auch hier bilden unstrukturierte Texte die Grundlage.

Der Service ist in der Lage, verschiedenste medizinische Informationen wie die Dosierung von Medikamenten, den Gesundheitszustand von Patienten und viele andere medizinische Informationen zu analysieren. Für diesen Zweck nutzt es, abhängig von den gewünschten Ergebnissen, unterschiedlichste klinische Studien, ärztliche Informationen wie Notizen oder Patientenakten, die allgemeinen Gesundheitsdaten von Patienten verschiedenster Herkunft und zahlreiche andere Daten.

Als Schnittstelle dient die Medical NERe-API. Sie generiert Ergebnisse in Form von medizinischen Informationen wie Behandlungen und Verfahren, Beschwerden, Medikamente, Anatomie oder Tests sowie Protected Health Information (PHI). Für die reine Extrahierung von PHI wurde die PHId-API (Protected health Information Data Identification) entwickelt.

Comprehend Medical

Ob Amazon Comprehend oder Comprehend Medical: Der Anwendungsbereich sind immer unstrukturierte Texte mit unterschiedlichsten Inhalten und folgenden Zielen.

  • Kundenstimmungsanalyse
  • Semantische Suche
  • Wissensverwaltung

Im Rahmen der Kundenstimmungsanalyse untersucht die Amazon Comprehend Stimmungs-API alle Textdokumente im Zusammenhang mit Kundenreaktionen. Dies können E-Mails, Feedbacks aus Support-Anrufen, in sozialen Medien und anderen Online-Kanälen sein. Die API analysiert, ob der Text neutral, positiv, negativ oder gemischt formuliert ist. Die daraus gewonnenen Erkenntnisse können beispielsweise einen Verbesserungsprozess in Gang setzen oder dienen als Bestätigung, dass die Maßnahmen zur Optimierung der Kundenzufriedenheit Wirkung zeigen.

Amazon Comprehend

Ein wichtiges Thema im Onlinemarketing ist die Indizierung durch Suchmaschinen. Mit Amazon Comprehend optimieren Website- und Onlineshop-Betreiber die Sucherfahrung, indem sie mit Unterstützung von Comprehend die Indizierung von Schlüsselphrasen, Entitäten und Stimmungen durch Suchmaschinen optimieren.

Genauso bedeutend ist die Wissensverwaltung, indem Comprehend alle verfügbaren Dokumente entsprechend den Vorgaben analysiert und sie nach Themen organisiert. Auf diese Weise erhalten Unternehmen eine effiziente Möglichkeit, ihre Kunden mit personalisierten Inhalten zu beliefern.

Beispiele aus der Praxis

  • Sucht ein Anwender Dokumente zu einem bestimmten Thema, startet er die Comprehend-Themenmodellierung. Diese ermittelt alle vorhandenen Themen oder die vorgegebenen Themen und findet die zu jedem Thema passenden Dokumenten.
  • Ein Unternehmen startet ein Event oder eine Aktion an einem Point-of-Sale und erhält entsprechendes Feedback über verschiedenste Online-Kanäle. Die Stimmungs-API analysiert die Kundenmeinung über Unternehmen, Aktivität oder Produkt.
  • Über die Themenmodellierung analysiert ein Unternehmen die von seinen Kunden bevorzugten Themen in den vom Unternehmen betriebenen Foren und Boards. Die Entitäts-Analyse liefert Personen, Orte und Produkte und es erfolgt eine Verknüpfung mit den ausgewählten Themen. Schlussendlich stellt das Unternehmen über die Stimmungs-Analyse die Einstellung der Kunden zum Thema fest und kann seine Strategien entsprechend ausrichten.
  • Nach einer kleinen technischen Veränderung an einem Produkt ändert sich das Kundenfeedback. Mit Amazon Comprehend sind Unternehmen in der Lage, detaillierte Analysen der Kundenmeinungen durchzuführen, indem beispielsweise kanalübergreifend alle Feedbacks nach einem bestimmten Begriff gescannt werden. Alternativ kann auf diese Weise beispielsweise geprüft werden, ob die technische Veränderung Feedbacks provoziert.

Analyse von Textinformationen

Es ist unmöglich, mit herkömmlichen Mitteln alle für ein Unternehmen relevanten Textinformationen zu erfassen und auszuwerten. Automatisierte digitale Dienste wie Amazon Comprehend, die auf maschinellem Lernen basieren, sind dazu in der Lage. Da durch die bereitgestellten Modelle sowie APIs und SDKs keine Kenntnisse über Maschinelles Lernen oder Programmierkenntnisse erforderlich sind, eignet sich Amazon Comprehend für jedes Unternehmen und wirkt sich positiv auf die Personalkosten aus.

  • Aussagekräftige und belastbare Ergebnisse aus gespeicherten Informationen.
  • Themenmodellierung ermöglicht die themenbezogene Organisation von vorhandenem Wissen in Dokumenten.
  • Kunden erhalten personalisierte Inhalte, wodurch sich das Interesse daran erhöht.
  • Individuelle Klassifizierung von Modellen erhöht die Effizienz von Amazon Comprehend im Unternehmen.

Vorteile Amazon Comprehend

Comprehend von Amazon präsentiert sich als wirtschaftlicher und effektiver Service zur Gewinnung neuer Erkenntnisse aus bisher nicht genutzten Textdaten.

  • Komplexität für die Erstellung einer Textanalysefunktion reduziert sich
  • Deep-Learning-Technologie zur detaillierten Textanalyse
  • Domainübergreifendes kontinuierliche Modell-Training zur Verbesserung der Genauigkeit
  • unkomplizierte Zusammenarbeit mit anderen AWS-Diensten wie S3 oder AWS Lambda
  • Analyse von Millionen von Dokumenten für umfassende Erkenntnisse
  • Ausgabeergebnisse und Volumendaten zuverlässig verschlüsselt
  • geringe Kosten

Anwender benötigen keinerlei Kenntnisse zum Thema Textanalyse, da die Prozesse automatisiert ablaufen.

Amazon Comprehend und die Zukunft

Zum aktuellen Zeitpunkt gibt es vier große plattformbasierte Dienste mit verwalteten Plattformen für Maschinelles Lernen. Dazu zählen Amazon mit Comprehend, Google mit Cloud Natural Language, Microsoft mit Azure und IBM mit Natural Language Understanding. Für welchen Anbieter sich ein Unternehmen schlussendlich entscheidet, hängt von den individuellen Bedürfnissen und den allgemeinen Voraussetzungen der eigenen IT-Landschaft ab. Fakt ist, dass die Zukunft Diensten wie Amazon Comprehend gehört. Sie sind unverzichtbar, um das Potenzial der zahlreichen Textinformationen zielgerichtet für den Unternehmenserfolg zu nutzen.

Wie geht es weiter?

Schritt 1

Sie nehmen telefonisch, per Mail oder Formular Kontakt auf und schildern uns Ihr Anliegen.

Schritt 2

Zur Klärung von Rückfragen und von Details zum weiteren Vorgehen melden wir uns telefonisch bei Ihnen.

Schritt 3

Wir unterbreiten Ihnen ein Angebot und unterstützen Sie gerne auch bei der Präsentation für Ihr Management.

Passende Angebote zum Thema

Die Bereinigung von Berechtigungen oder die Optimierung von Benutzer- und Berechtigungsprozessen in einem historisch gewachsenen System wirft erstmal einige Fragen auf. In unserem Strategieworkshop SAP Berechtigungen entwickeln unsere Senior-Architekten für Sie eine Strategie zur Optimierung der SAP Sicherheit und Reduzierung der Betriebsaufwände – gerade auch in Hinblick auf S/4HANA sowie dem Betrieb von SAP Cloud Anwendungen.
Erkennen und prüfen Sie mit unserem Kalkulationsprüfer schnell und automatisch unbeabsichtigte Abweichungen zwischen dem Einkaufs- und dem gleitenden Durchschnittspreis Ihrer Materialien.
Automatische Berechtigungsvergabe
Haben Sie auch ESS/MSS eingeführt und müssen tausende Benutzer mit Berechtigungen ausstatten und dies noch manuell? Automatisieren Sie die Benutzer- & Berechtigungsverwaltung für Ihre Self-Service Nutzer & reduzieren Sie den Aufwand auf 0!