mindsquare.de durchsuchen

Amazon Textract

Sie brauchen einen Amazon Textract Berater und/oder möchten, dass wir Ihnen unser Angebot in diesem Umfeld vorstellen?

Max-Ludwig Stadler
25. September 2024

Die Weiterverarbeitung von Dokumenten, die lediglich als Scan oder Fotografie vorliegen, stellt Unternehmen auch heutzutage noch immer vor große Herausforderungen. Dabei werden wichtige Inhalte dieser Dokumente in vielen Unternehmen von Hand abgetippt.

Andere Firmen setzen wiederum auf teure Spezialsoftware, die jedoch vorab konfiguriert und laufend angepasst werden muss, um akzeptable Ergebnisse zu erzielen. Beide Lösungen sind somit zeit- und kostenintensiv und passen so gar nicht in unsere neue digitale Welt, die sich lobt, mühselige Routinetätigkeiten durch Automatisierung zu bewältigen. Ein Ansatz, der verspricht, dieses Problem nachhaltig zu lösen, ist Amazon Textract. Doch ist das smarte AWS-Service wirklich die langersehnte Revolution im Bereich der Zeichenerkennung, wie funktioniert die Software und für wen eignet sich das Tool ganz besonders gut?

KI - Grundlagen und BP
Sie möchten gerne mehr zum Thema Künstliche Intelligenz erfahren und wie Ihr Unternehmen davon profitieren kann? In unserem Webinar fassen wir Ihnen die wichtigsten Aspekte zusammen!

Was ist Amazon Textract?

Bei Textract handelt es sich um ein Amazon Web Service (AWS), mit dessen Hilfe Kunden Texte und Daten aus gescannten Dokumenten extrahieren können. Die Software geht hierbei weit über das klassische OCR (Optical Character Recognition) hinaus, da sie auch Inhalte und Informationen in Formularen und Tabellen sicher erkennen und auslesen kann. Das System unterstützt derzeit sowohl gewöhnliche Scans als auch Dateien im PDF-Format sowie Fotos. Zusätzlich kann Textract mit anderen Services von Amazon kombiniert werden. AWS-Services, die mit Textract zusammenarbeiten, sind beispielsweise Amazon Translate, Amazon Comprehend und Amazon Comprehend Medical.

Voraussetzungen

Um das Service zu nutzen, benötigen interessierte Kunden ein AWS-Konto bei Amazon. Die Registrierung selbst ist kostenfrei, wobei die Preise für die jeweiligen AWS-Services je nach gewähltem Modell und Nutzungsverhalten variieren. So bietet Amazon attraktive Mengenrabatte und die Möglichkeit, zusätzliche Kapazitäten bei Bedarf flexibel zu buchen, sodass auch bei steigendem Bedarf keine Engpässe entstehen.

Preisgestaltung

Mit dem AWS Free Tier haben Kunden die Möglichkeit, in den ersten drei Monaten bis zu 1.000 Seiten mit der Document Text API analysieren zu lassen. Als Zusatz bietet dieses Paket die Option, weitere 100 Seiten mit der Analyze Document API zu nutzen, die speziell für Formulare und Tabellen erstellt wurde. Jegliche weitere Nutzung ist mit Kosten verbunden, die sich je nach Region und gebuchter Kapazität leicht unterscheiden und auch Schwankungen unterworfen sind. So bezahlen Kunden in London für die Analyse von bis zu einer Million strukturierter Texte im Monat derzeit beispielsweise 1,75 US-Dollar für 1.000 Seiten.

Bei einem Volumen von 100.000 Scans belaufen sich die monatlichen Kosten somit auf lediglich 175 US-Dollar. Bei aufwendigen Dokumenten, die Tabellen und Formulare enthalten, steigen die Preise jedoch deutlich an. So müssten Kunden im obigen Beispiel satte 7.500 US-Dollar pro Monat bezahlen, um 100.000 Scans zu digitalisieren, die neben gewöhnlichem Text auch Formulare und Tabellen enthalten. Die aktuellen Preise und Berechnungsbeispiele finden sich klar und übersichtlich aufbereitet auf der Webpräsenz von Textract.

Unser Whitepaper zum Thema Künstliche Intelligenz im Vertrieb

Whitepaper: Künstliche Intelligenz im Vertrieb

In diesem Whitepaper stelle ich Ihnen die wichtigsten Inhalte zum Thema künstliche Intelligenz vor und erkläre Ihnen, wie sie die Arbeitsabläufe im Vertrieb optimieren.

Funktionen und Features

Im Gegensatz zu herkömmlicher OCR-Software setzt das Service auf modernste Technik und auf Erkenntnisse aus dem Bereich der künstlichen Intelligenz. Dieser Ansatz macht es möglich, eingescannte Dokumente ganz ohne vorherige Softwareanpassungen oder zusätzlichen Code zu lesen und die erfassten Daten digital abzuspeichern. So lassen sich Tausende Seiten in nur wenigen Stunden extrahieren und sofort in den notwendigen Geschäftsanwendungen nutzen.

Kunden können die extrahierten Informationen entweder direkt in einer anderen Anwendung nutzen oder die digitalen Informationen in einer Datenbank speichern. Dabei verwendet das System Machine Learning, wodurch es mit der Zeit immer bessere und genauere Ergebnisse liefert. Amazon selbst behauptet, das System mit mehreren Millionen von Dokumenten aus den unterschiedlichsten Bereichen trainiert zu haben. So erkennt Textract selbstständig, ob es sich bei dem Dokument um einen Vertrag, eine Rechnung, ein Anmeldeformular oder um eine Steuerunterlage handelt. Die wichtigsten Features der Software sind:

  • Intelligente Suchindizes
  • Automatisierte Dokumentenverarbeitungs-Workflows
  • Archivierung

Das AWS-Service integriert smarte Suchindizes, die das Auffinden der benötigten Inhalte deutlich beschleunigt. Die gewünschten Indizes können hierbei im sogenannten Amazon Elasticsearch erstellt werden. Dank dieses Features haben Kunden die Möglichkeit, Tausende von Dokumenten innerhalb kürzester Zeit nach den benötigten Schlüsselwörtern zu durchsuchen. Ein mühsames manuelles Suchen und Lesen der Dokumente entfällt somit zur Gänze.

Automatisierte Dokumentenverarbeitungs-Workflows

Textract erlaubt es, die Eingaben für Genehmigungs-Workflows automatisch bereitzustellen und an die notwendigen Workflows weiterzuleiten. So können beispielsweise Workflows, wie die Genehmigung von Reiseanträgen, ohne menschliches Zutun durchgeführt werden. Dabei verwendet das System alle Informationen aus den gescannten Dokumenten, die für eine erfolgreiche Antragsprüfung und Antragsgenehmigung notwendig sind. Der Mitarbeiter erhält so in nur wenigen Minuten die notwendige Reisegenehmigung, ohne die Daten selbst in das System eingeben zu müssen.

Archivierung

Das Dokumentarchiv dient nicht nur als zentrale Speicherstelle, sondern ermöglicht es Nutzern auch, bestimmte Regeln festzulegen und deren Einhaltung automatisch zu überprüfen. Dies ist insbesondere bei Dokumenten, die möglicherweise der Prüfpflicht oder Schwärzungspflicht unterliegen, ein großer Vorteil. Dabei erkennt das System die festgelegten Schlüsselwertpaare selbstständig und wendet die erfassten Regeln automatisch auf die betroffenen Textabschnitte an.

E-Book: Wie Ihr Unternehmen von Künstlicher Intelligenz (KI) profitieren kann

E-Book: Wie Ihr Unternehmen von Künstlicher Intelligenz (KI) profitieren kann

In unserem E-Book erfahren Sie die wichtigsten Inhalte rund um das Thema künstliche Intelligenz & wie Sie davon profitieren können!

Für wen eignet sich Textract ganz besonders gut?

Das Service eignet sich besonders für Unternehmen, die im täglichen Arbeitsalltag mit vielen Scans konfrontiert sind. Besonders kritische Dokumente, wie beispielsweise Verträge, Antragsformulare oder Steuerdokumente, lassen sich mit der Software aus dem Hause Amazon einfach und sicher in digitale Inhalte umwandeln. Das reduziert den Arbeitsaufwand sowie Kosten und ist zusätzlich ein wichtiger Schritt in Richtung Digitalisierung und Industrie 4.0.

Die Stärken

Textract ermöglicht die genaue und zügige Datenextraktion aus gescannten Dokumenten, Tabellen und Formularen. Dabei erkennt die Software das Layout und die Schlüsselelemente des vorliegenden Dokuments automatisch und schafft es, Datenbeziehungen herzustellen. Damit werden die Zeichen nicht losgelöst voneinander digital umgewandelt, sondern in eine Beziehung gesetzt, sodass der Kontext durchgehend ersichtlich ist. Die erfassten Daten können danach sofort weiterverwendet oder bei Bedarf auch in einer Datenbank gespeichert werden. Die intelligente Vorgehensweise machen aufwendige Konfigurationen sowie eine zusätzliche Programmierung und Codepflege obsolet.

Die Schwächen

Auch wenn die Technik hinter dem AWS-Service überaus ausgefeilt ist, hängen die Ergebnisse dennoch stark von den jeweiligen Datentypen ab. Kunden, die das Service beispielsweise für Dokumente nutzen, mit denen das System bereits Erfahrung sammeln konnte, werden mit großer Wahrscheinlichkeit sehr gute Ergebnisse erzielen. Wird das System jedoch mit Typen von Dokumenten gespeist, mit denen das Service noch keine oder nur sehr wenig Erfahrung sammeln konnte, wird das Ergebnis der Digitalisierung womöglich hinter den Erwartungen zurückbleiben. Für den schnellen Test, ob sich die Anwendung für den gewünschten Einsatzbereich lohnt, hat Amazon daher eine Demo-Seite auf der eigenen Webpräsenz bereitgestellt, auf der Dokumente getestet werden können.

Profil Max-Ludwig Stadler

Websession: Amazon Textract

Sie haben Fragen zu KI-Technik oder generell zum Thema Datenstrukturierung? In unserer kostenlosen Websession beantworten wir all Ihre Fragen.

Fazit

Amazon Textract extrahiert strukturierte Daten aus gescannten Dokumenten, Formularen und Tabellen. Dabei werden sämtliche Inhalte immer im Kontext digitalisiert und dem Kunden in strukturierter Form bereitgestellt. Die Strukturierung erlaubt smarte Suchen sowie das Erfassen von individuellen Regeln und die automatische Durchführung von Genehmigungs-Workflows. All diese Features machen das praktische Tool zu einer attraktiven Lösung, die weit mehr Komfort und Möglichkeiten bietet als herkömmliche OCR-Software. Ob sich der Einsatz des AWS-Services lohnt, ist jedoch abhängig von der Art der Dokumente, die digitalisiert werden sollen, wobei aufwendige Dokumente zudem mit nicht unerheblichen Kosten verbunden sind.

Verwandte Know-Hows

Die Optimierung von Hyperparametern ist ein entscheidender Schritt im maschinellen Lernen, da sie die Leistung von KI-Modellen erheblich verbessern kann. Datenwissenschaftler verbringen häufig Zeit damit, die besten Einstellungen manuell zu […]
Künstliche Intelligenz (KI) kann die Prozesse eines Unternehmens enorm optimieren. Damit das gelingt, muss sie jedoch eine große Anzahl an Daten auswerten. Eine Herausforderung dabei sind Grafiken und Bilder. Deren […]
Täglich werden große Mengen an Daten (Big Data) im Internet oder in Unternehmen angesammelt, doch womit werden diese einfach und profitabel verarbeitet? Und warum ist Big Data so wichtig? Das und […]

Passende Angebote zum Thema

Überwachen Sie die Einhaltung Ihres aufgebauten Berechtigungskonzeptes regelmäßig, um Ihr System nachhaltig sicher zu halten. Ein internes Kontrollsystem für Ihr SAP-System unterstützt dabei, indem es Abweichungen von den definierten Regelungen […]
Unser Tool zur Massenaufnahme von Objekten in einen Transport hilft Ihnen, wenn Sie eine große Menge von Objekten in einen Transport (Workbench oder Transport von Kopien) aufnehmen müssen.
Immer mehr Unternehmen sind der Gefahr vor Cyberangriffen ausgesetzt und sind gefährdet durch potenzielle Datenverluste. Denn die IT-Umgebungen verändern sich kontinuierlich und die Bedrohungen für Unternehmen werden immer gefährlicher. Das […]

Beratung und Unterstützung für die Unternehmens-IT

  • Individualentwicklung für SAP und Salesforce
  • SAP S/4HANA-Strategieentwicklung, Einführung, Migration
  • Mobile App Komplettlösungen – von der Idee über die Entwicklung und Einführung bis zum Betrieb, für SAP Fiori und Salesforce Lightning
  • Automatisierung von Prozessen durch Schnittstellen, künstliche Intelligenz (KI) und Robotic Process Automation (RPA)
  • Beratung, Entwicklung, Einführung
  • Formular- und Outputmanagement, E-Rechnung & SAP DRC
  • SAP Archivierung und SAP ILM
  • SAP Basis & Security, Enterprise IT-Security & Datenschutz
  • SAP BI & Analytics
  • Low Code / No Code – Lösungen

Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:

Besondere Prozessexzellenz im Bereich Personal / HR

  • Knowhow in Personalprozessen und IT-Technologien verbinden
  • HR-Berater, die IT-ler und Personaler in einer Person sind
  • Beratung zu HR IT Landschafts- & Roadmap sowie HR Software Auswahl
  • Beratung und Entwicklung im SAP HCM, SuccessFactors und der SAP Business Technology Platform
  • HCM for S/4HANA (H4S4) Migration & Support
  • Als Advisory Partner Plattform und Prozessberatung in Workday
  • Mobile Development mit SAP Fiori, SAPUI5, HTML5 und JavaScript
  • Marktführer im Bereich ESS/MSS

Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:

Besondere Prozessexzellenz im Bereich Produktion & Logistik

  • Optimierung und Digitalisierung von Produktions- und Logistikprozessen sowie Einkaufs- und Vertriebsprozessen
  • Einführung mobiler Datenerfassung in Produktion, Lager und Instandhaltung
  • Umfassendes Knowhow in den SAP-Modulen LO, MM, SD, WM, PM und CCS/CCM
  • Modul-Beratung & Einführung, Entwicklung individueller (mobiler) Anwendungen
  • Beratung und Entwicklung in der SAP Freischaltungsabwicklung (SAP WCM, eWCM)
  • Optimierung sämtlicher Prozesse im Bereich der nachträglichen Vergütung (Bonus)

Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:

Besondere Prozessexzellenz im Bereich Vertrieb & Service

  • Vertriebs- & Service-Prozesse auf Basis von Salesforce
  • Beratung, Einführung und Entwicklung für Salesforce-Lösungen: Sales Cloud, Service Cloud, Marketing Cloud inkl. Account Engagement (ehem. Pardot)
  • Salesforce Customizing: Individuelle Lösungen in Salesforce, u.a. für Chemie-Branche
  • Betriebsunterstützung und Service für Salesforce-Kunden
  • Schnittstellen-Entwicklung, besondere Expertise SAP – Salesforce Integration

Vollumfängliche Implementierungs- und Betriebsunterstützung für führende Softwareprodukte unserer Partnerunternehmen:

msDevSupport

Service / Development Support

  • fester, eingearbeiteter Ansprechpartner als Koordinator
  • kontinuierliche Weiterentwicklung und Digitalisierung Ihres Unternehmens, z.B. Fehlerbehebung, Updates, neue Features implementieren
  • kleinere Entwicklungen realisieren, die kein Projektmanagement erfordern
  • günstige Abrechnungen pro h
  • sehr einfache und schnelle Beauftragung auf Zuruf
  • ständige Verfügbarkeit: (Teil-)Ressourcen geblockt für Sie
  • kurze Reaktionszeiten 2 – 24h
  • Wir halten Wissen vor und stellen Stellvertretung sicher

msSolution

Projekte

  • Projektleitung und Steering inklusive Qualitätssicherung
  • „Wir machen Ihr fachliches Problem zu unserem.“
  • mindsquare steuert IT-Experten selbst
  • Abrechnung pro Tag
  • Längerer Angebots- und Beauftragungsprozess
  • Lieferzeit 6 – 12 Wochen ab Auftragseingang
  • Zum Auftragsende Transition zu einem Service & Support notwendig, um schnell helfen zu können

msPeople

IT-Experten auf Zeit

  • Wir lösen Ihren personellen Engpass, z.B. liefern von IT-Experten für Ihr laufendes Projekt
  • Breites Experten-Netzwerk für praktisch jedes Thema und Budget:
  • interne festangestellte mindsquare Mitarbeiter:innen
  • externe Experten aus unserem Netzwerk von 27.000 Freiberufler:innen aus Deutschland
  • externe Experten im Nearshoring mit derzeit 37 Partnern
  • Verbindliches Buchen der Experten in einem definierten Zeitraum an festen Tagen
  • Ohne Projektleitung und Steering, Sie steuern die Experten
  • Lieferzeit in der Regel 2 – 6 Wochen
  • Nach Auftragsende KEIN Vorhalten von Experten und Knowhow
Kontakt aufnehmen
Ansprechpartner
Laura Feldkamp mindsquare Kundenservice
Laura Feldkamp Kundenservice