mindsquare.de durchsuchen

So analysieren Sie Sprache mit Named-entity recognition

So analysieren Sie Sprache mit Named-entity recognition

Named-entity recognition (NER) ist ein Schlagwort, das Sie vielleicht schon im Zusammenhang mit Natural Language Processing gelesen haben. Natural Language Processing bezeichnet grundlegend die algorithmische Verarbeitung natürlicher Sprache. Diese Disziplin der Informatik bildet eine besondere Herausforderung, weil menschliche Sprache ein Beispiel für unstrukturierte bzw. schwach strukturierte Information ist – ganz im Gegensatz zu stark strukturierten Daten, wie relationalen Datenbanken. 

Die NER befasst sich damit, in einem Text sogenannte Entitäten zu finden, mithilfe derer Fragen nach dem Wer, Was, Wo und Wann beantwortet werden können. Beispiele für Entitäten sind dabei Namen von Personen und Ländern, aber auch Kontonummern oder Datumsangaben. Zur NER gehört sowohl die Erkennung von Entitäten als auch ihre Kategorisierung.
Aus dem Satz „Max Mustermann wurde am 01.01.2020 von der Sparkasse eingestellt“ lassen sich beispielsweise folgende Entitäten erkennen:

  • Max Mustermann, Person
  • 01.01.2020, Datum
  • Sparkasse, Firma
E-Book: Wie Ihr Unternehmen von Künstlicher Intelligenz (KI) profitieren kann

E-Book: Wie Ihr Unternehmen von Künstlicher Intelligenz (KI) profitieren kann

In unserem E-Book erfahren Sie die wichtigsten Inhalte rund um das Thema künstliche Intelligenz & wie Sie davon profitieren können!

Vor diesen Herausforderungen stehen Sie beim Verständnis der Sprache

Erste Forschungen auf dem Gebiet der Name-entity recognition wurden im Rahmen der 6. Message Unterstanding Conference (kurz MUC-6) der DARPA durchgeführt. Die vorigen fünf MUCs befassten sich primär mit der Extraktion eng definierter Ereignisse aus einem freien Text. Im Rahmen der MUC-6 hingegen wurde das Ziel gesteckt, allgemeinere Entitäten – d.h. Namen, zeitbezogene und numerische Ausdrücke – zu erkennen, ohne dabei eine spezifische Domäne festzulegen.

NER bring verschiedene Herausforderungen mit sich:

  • Erkennung von Varianten: Die Namen „Herr Mustermann“ und „Max Mustermann“ in verschiedenen Stellen eines Textes können sich auf ein und dieselbe Person beziehen. Insbesondere zur Ermittlung der Anzahl verschiedener Entitäten in einem Text oder dem Verfolgen von Ereignissen muss das System erkennen, dass es sich um dieselbe Entität handelt.
  • Normalisierung: Verschiedene Angaben, wie z. B. Zeitangaben, können in mehreren Formaten vorliegen. So beziehen sich die Angaben „der erste Freitag im April“, „03.04.2020“ und „03. April“ auf den gleichen Tag. Durch die Normalisierung kann eine Vergleichbarkeit dieser Angaben geschaffen werden.
  • Entity Boundary Recognition (Erkennung von Entitätsgrenzen): Ist „Doktor Max Mustermann“ die gleiche Entität wie „Max Mustermann, B.Sc.“? Darüber hinaus gibt es oft unklare Fälle: Stellen „Herr und Frau Müller“ beispielsweise eine oder zwei Entitäten dar?

Regelbasierte Extraktion oder supervised Machine Learning?

Es gibt verschiedene Verfahren, die Sie für NER nutzen können. Hauptsächlich wird dabei zwischen zwei Herangehensweisen unterschieden:

Regelbasierte Extraktion

Im Rahmen der regelbasierten Extraktion erstellen Sie ein System von Regeln, das zur Erkennung von Entitäten genutzt werden kann. Ein Beispiel für eine Regel kann dabei sein, dass die Wörter „Frau“ oder „Herr“, gefolgt von weiteren Wörtern und einem Nachnamen aus einer Liste häufiger deutscher Nachnamen, eine Person bezeichnen. Diese Regel würde Beispielsweise „Frau Erika Mustermann“ als Person erkennen.

Regelbasierte Systeme zur NER sind sehr aufwendig in der Erstellung, erzielen aber tendenziell bei einem spezifischen Gebiet und festgelegten Entitätstypen gute Ergebnisse. Allerdings ist ihre Transferierbarkeit auf andere Anwendungsgebiete stark eingeschränkt.

Supervised Machine Learning

Ein weiterer Ansatz ist die Nutzung von supervised Machine Learning. Hier können Sie auf eine große Menge verschiedener Methoden zurückgreifen, wie zum Beispiel Hidden Markov Models (HMM) oder Conditional Random Fields (CRF). Für dieses Verfahren muss zunächst ein Textkorpus annotiert werden, d.h. Sie markieren und kategorisieren die darin vorkommenden Entitäten. Anschließend wird ein Machine-Learning-Modell trainiert, das anhand statistischer Zusammenhänge – beispielsweise im Satzbau – lernt, Entitäten zu erkennen.

Der Nachteil der Nutzung von supervised Machine Learning ist, dass Sie große Mengen annotierter Texte benötigen, um ein Machine-Learning-Modell trainieren zu können. Je größer der vorliegende Datensatz für das Training ist, desto besser funktioniert das damit erstellte Modell. Allerdings können Sie im Gegensatz zu regelbasierten Systemen so angelernte Modelle leichter für andere Anwendungsfälle nutzen.

Aufgrund der Vorteile setzen beispielsweise die beiden Python-Libraries NLTK und spacy Machine-Learning-Modelle zur NER ein.

KI - Grundlagen und BP
Sie möchten gerne mehr zum Thema Künstliche Intelligenz erfahren und wie Ihr Unternehmen davon profitieren kann? In unserem Webinar fassen wir Ihnen die wichtigsten Aspekte zusammen!

In diesen Fällen hilft Ihnen Named-entity recognition

Allgemein finden sich Anwendungsfälle für NER überall dort, wo beispielsweise ihre Kunden die Möglichkeit haben, Freitexte einzugeben. Zwei Anwendungsfälle möchte ich im Folgenden skizzieren:

Kundensupport: Wenn Sie im Kundensupport ein Ticketsystem einsetzen, kennen Sie das Problem, dass eingehende Tickets ggf. erst von einem Mitarbeiter geprüft und etwa anhand betroffener Produkte kategorisiert werden müssen. Bei dieser aufwendigen Arbeit kann ein System mithilfe von NER unterstützen: Der vom Kunden eingegebene Text wird untersucht und mithilfe von NER werden Entitäten erkannt und kategorisiert. Dabei können beispielsweise der Name eines Produktes oder einer Filiale erkannt werden. Anschließend kann das Ticket entsprechend kategorisiert werden, um direkt beim richtigen Supportmitarbeiter zu landen.

Voranalyse von Schadensfällen: Wenn eine Versicherung dem Kunden die digitale Meldung von Schadensfällen erlaubt, kann NER zur Voranalyse dieser Meldungen genutzt werden. Beispiele für Entitäten, die hier erkannt werden können, sind etwa an einem Verkehrsunfall beteiligte Parteien. Geht es um Schadensfälle für Geräteversicherungen, können betroffene Geräte identifiziert werden.

E-Book: KI im Mittelstand

E-Book: KI im Mittelstand

In diesem E-Book erfahren Sie, wie Sie KI in Ihrem Unternehmen einsetzen können.

Noch Fragen?

Haben Sie noch Fragen, wie Sie NER in Ihrem Unternehmen nutzen können? Schreiben Sie mir einfach unter info-ki@mindsquare.de und wir sprechen einmal über Ihre aktuelle Situation.

Verwandte Beiträge

Automatisierung ist in aller Munde. Sie wird als einer der kritischen Erfolgsfaktoren für nachhaltigen Unternehmenserfolg genannt. Festhalten lässt sich auf jeden Fall, dass sich ein jedes Unternehmen mit Automatisierung auseinandersetzen […]
Im Bereich Künstliche Intelligenz (KI) sind Sie mit Sicherheit schon häufig auf den Begriff Machine Learning gestoßen, welcher ein Teilgebiet der KI beschreibt. Das maschinelle Lernen wiederum besteht noch aus vielen Untergebieten […]
Machine Learning ist eines der großen Teilgebiete von Künstlicher Intelligenz. Doch wie funktioniert das überhaupt und welche Methoden gibt es? Was nutze ich, wenn ich das Ergebnis noch gar nicht […]
Machine Learning befasst sich mit dem künstlichen Lernen von Maschinen aus historischen Daten. In diesen sollen KIs Muster und Regelmäßigkeiten erkennen, um Entscheidungsregeln abzuleiten. Wie genau das abläuft, kann aber […]

Beratung und Unterstützung für die Unternehmens-IT

  • Individualentwicklung für SAP und Salesforce
  • SAP S/4HANA-Strategieentwicklung, Einführung, Migration
  • Mobile App Komplettlösungen – von der Idee über die Entwicklung und Einführung bis zum Betrieb, für SAP Fiori und Salesforce Lightning
  • Automatisierung von Prozessen durch Schnittstellen, künstliche Intelligenz (KI) und Robotic Process Automation (RPA)
  • Beratung, Entwicklung, Einführung
  • Formular- und Outputmanagement, E-Rechnung & SAP DRC
  • SAP Archivierung und SAP ILM
  • SAP Basis & Security, Enterprise IT-Security & Datenschutz
  • SAP BI & Analytics
  • Low Code / No Code – Lösungen

Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:

Besondere Prozessexzellenz im Bereich Personal / HR

  • Knowhow in Personalprozessen und IT-Technologien verbinden
  • HR-Berater, die IT-ler und Personaler in einer Person sind
  • Beratung zu HR IT Landschafts- & Roadmap sowie HR Software Auswahl
  • Beratung und Entwicklung im SAP HCM, SuccessFactors und der SAP Business Technology Platform
  • HCM for S/4HANA (H4S4) Migration & Support
  • Als Advisory Partner Plattform und Prozessberatung in Workday
  • Mobile Development mit SAP Fiori, SAPUI5, HTML5 und JavaScript
  • Marktführer im Bereich ESS/MSS

Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:

Besondere Prozessexzellenz im Bereich Produktion & Logistik

  • Optimierung und Digitalisierung von Produktions- und Logistikprozessen sowie Einkaufs- und Vertriebsprozessen
  • Einführung mobiler Datenerfassung in Produktion, Lager und Instandhaltung
  • Umfassendes Knowhow in den SAP-Modulen LO, MM, SD, WM, PM und CCS/CCM
  • Modul-Beratung & Einführung, Entwicklung individueller (mobiler) Anwendungen
  • Beratung und Entwicklung in der SAP Freischaltungsabwicklung (SAP WCM, eWCM)
  • Optimierung sämtlicher Prozesse im Bereich der nachträglichen Vergütung (Bonus)

Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:

Besondere Prozessexzellenz im Bereich Vertrieb & Service

  • Vertriebs- & Service-Prozesse auf Basis von Salesforce
  • Beratung, Einführung und Entwicklung für Salesforce-Lösungen: Sales Cloud, Service Cloud, Marketing Cloud inkl. Account Engagement (ehem. Pardot)
  • Salesforce Customizing: Individuelle Lösungen in Salesforce, u.a. für Chemie-Branche
  • Betriebsunterstützung und Service für Salesforce-Kunden
  • Schnittstellen-Entwicklung, besondere Expertise SAP – Salesforce Integration

Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:

msDevSupport

Service / Development Support

  • fester, eingearbeiteter Ansprechpartner als Koordinator
  • kontinuierliche Weiterentwicklung und Digitalisierung Ihres Unternehmens, z.B. Fehlerbehebung, Updates, neue Features implementieren
  • kleinere Entwicklungen realisieren, die kein Projektmanagement erfordern
  • günstige Abrechnungen pro h
  • sehr einfache und schnelle Beauftragung auf Zuruf
  • ständige Verfügbarkeit: (Teil-)Ressourcen geblockt für Sie
  • kurze Reaktionszeiten 2 – 24h
  • Wir halten Wissen vor und stellen Stellvertretung sicher

msSolution

Projekte

  • Projektleitung und Steering inklusive Qualitätssicherung
  • „Wir machen Ihr fachliches Problem zu unserem.“
  • mindsquare steuert IT-Experten selbst
  • Abrechnung pro Tag
  • Längerer Angebots- und Beauftragungsprozess
  • Lieferzeit 6 – 12 Wochen ab Auftragseingang
  • Zum Auftragsende Transition zu einem Service & Support notwendig, um schnell helfen zu können

msPeople

IT-Experten auf Zeit

  • Wir lösen Ihren personellen Engpass, z.B. liefern von IT-Experten für Ihr laufendes Projekt
  • Breites Experten-Netzwerk für praktisch jedes Thema und Budget:
  • interne festangestellte mindsquare Mitarbeiter:innen
  • externe Experten aus unserem Netzwerk von 27.000 Freiberufler:innen aus Deutschland
  • externe Experten im Nearshoring mit derzeit 37 Partnern
  • Verbindliches Buchen der Experten in einem definierten Zeitraum an festen Tagen
  • Ohne Projektleitung und Steering, Sie steuern die Experten
  • Lieferzeit in der Regel 2 – 6 Wochen
  • Nach Auftragsende KEIN Vorhalten von Experten und Knowhow