Automatisierung der Verarbeitung des Produkts ist die Dokumentation über die AWS AI-Lösungen

Diese Fallstudie beschreibt die Umsetzung von serverlosen AWS-Lösungen zur automatisierten Verarbeitung von technischen Unterlagen (Datenblätter, Kataloge, Zertifizierung) für den Leiter des slowakischen distributor Kraft des Materials und industrial automation. Die Lösung erlaubt die dramatische Beschleunigung der Verarbeitung der Produkte an den B2B-Katalog, die Datenqualität verbessern und die Betriebskosten senken.

07. jul 2025 ┃ 6 minút čítania

aspecta logo

Herausforderung

Im segment der Verteilung Verdrahtung und industrielle Komponenten jährlich verarbeitet Zehntausende von produktdatenblättern und technischen Dokumenten von vielen verschiedenen Herstellern. Die meisten Unternehmen verlassen sich immer noch auf manuell überschreiben die Daten, die ist langsam, ineffizient und ausgesetzt, die ein hohes Risiko von Fehlern. Die Dynamik des Marktes, die häufigen änderungen in die Produkt Parameter und die Druck auf den raschen Einstieg der Elemente in den B2B-Portale unter Druck, Automatisierung und die Genauigkeit der Daten.

  • Datenmenge und Heterogenität der Dokumente: Hunderte von Lieferanten und mehrere Formate (PDF, DOCX, XLS) in verschiedenen Sprachen.

  • Manuelle Datenerfassung: 15–20 Minuten pro Dokument, hohes Fehlerrisiko beim manuellen Übertragen technischer Parameter.

  • Verzögerte Produkteinführung: Längere Time-to-Market für neue Artikel im B2B-Portal.

 

Die Ziele des Projekts

  • Zur Beschleunigung der Verarbeitung von Dokumenten, die für mindestens 80 %.

  • Reduzieren die manuelle Arbeit bei der data-team von 50 %.

  • Zur Erreichung der Genauigkeit der extrahierten Daten von ≥ 98 %.

  • Die Einführung einer skalierbaren, pay-per-use-architektúuru integriert mit ERP-und B2B-system.

aspecta logo

Die Lösung

Die entworfene Lösung basierte auf einer serverlosen AWS-Architektur mit Fokus auf AI/ML und NLP zur Verarbeitung unstrukturierter Dokumente. Dieser Ansatz wurde als optimal in Bezug auf Flexibilität, Zuverlässigkeit und betriebliche Effizienz gewählt. Das serverlose Modell ermöglicht eine schnelle Skalierung je nach Dokumentenvolumen, ohne dass eine Infrastrukturverwaltung erforderlich ist, während die nativen AWS-AI-Dienste geprüfte Genauigkeit und eine schnelle Integration mit bestehenden ERP- und B2B-Systemen bieten.

 

Wichtige Komponenten:

  • Amazon S3 – Eingangsspeicher für hochgeladene Dokumente.

  • Amazon Textract – automatische Extraktion von Texten, Tabellen und Schlüssel-Wert-Paaren.

  • Amazon Comprehend + benutzerdefiniertes NLP (SageMaker) – Identifizierung und Klassifizierung technischer Parameter (Spannung, Leistung, Abmessungen, Normen, IP-Schutzklasse).

  • AWS Lambda – Orchestrierung der Workflows und Transformation in strukturierte JSON-Daten.

  • Amazon DynamoDB – Speicherung der extrahierten Daten und Metadaten.

  • API Gateway – Integration mit ERP-Systemen und dem B2B-Portal.

  • Amazon CloudWatch – Überwachung von KPIs, Latenz, Fehlern und Modellqualität.

 

Prozess:

  1. Die supply-Datei in S3 hochgeladen (batch-oder Ereignis-gesteuert).

  2. Textract extrahiert text-und-Tabellen, die das Ergebnis übergeben Sie einen Lambda-Funktion.

  3. SageMaker NLP-Modell und zu Verstehen, identifizieren Sie die Parameter und ordnen Sie Sie den internen Feldern.

  4. Die Lambda schließt die Validierung des erstellten JSON und speichert den Datensatz zu DynamoDB.

  5. API-Gateway ermöglicht den export zu ERP-und publishing im B2B-Katalog; manuelle Validierung unterstützt auditnými logmi.

aspecta logo

Implementierung

Die Projekt-phase (3-6 Monate):

  • Analyse und PoC (4 Wochen): Prüfung der Dokumente, die definition der Taxonomie der Parameter, einen PoC auf einer Stichprobe von 500 Dokumente.

  • Entwicklung und training (6-10 Wochen): Bereitstellung von Textract, training, custom NLP-Modell in SageMaker, Entwicklung Lambd und integration.

  • Integration und Test (4-6 Wochen): eine Verknüpfung mit ERP, testing, end‑to‑end-security-review.

  • Bereitstellung und tuning (2-4 Wochen): überwachung des Feedbacks der Benutzer, der die Kalibrierung der Modelle.

 

Die wichtigsten Beschlüsse:

  • Die Wahl der serverlosen AWS-solutions durch die Skalierbarkeit und die Zahlung nach Verbrauch.

  • Hybrid-Ansatz: die automatische Verarbeitung der + menschliche überprüfung in Ausnahmefällen.

aspecta logo

Ergebnisse und Vorteile

Erste Bewertung bestätigt, dass die bereitgestellte Lösung ergab sich eine messbare Auswirkungen nicht nur auf die betriebliche Effizienz, sondern auch auf die Qualität der Daten und die Geschwindigkeit der Platzierung von Produkten auf dem Markt. Die Kombination von AI und serverlose Ansatz erwies sich als entscheidend im Umgang mit der hohen Volumen von Dokumenten, und das system ist angepasst an die tatsächlichen Bedürfnisse und bietet eine zuverlässige, skalierbare Ergebnisse auch mit der wachsenden Last.

KPI-1 – Speed-Verarbeitung

  • Baseline: 15-20 Minuten/Dokument.

  • Ergebnis: der Durchmesser der 1:45 min/Dokument.

  • Auswirkung: ~90% von der Beschleunigung; eine erhebliche Beschleunigung der Aufnahme der Produkte im Katalog.

KPI-2 – die Richtigkeit der Daten

  • Baseline: 93-95 % (manuell).

  • Das Ergebnis: 98,6% nach der Validierung.

  • Auswirkungen: weniger Beschwerden, desto höher ist die Qualität eines full‑text-Suche.

KPI-3 – Kosten-Wirksamkeit

  • Ergebnis: ~40 % der Kosten sparen, um die data-team.

  • Wirkung: geringere Betriebskosten, die Möglichkeit, Mittel für die Entwicklung der Katalog-und UX.

Betriebliche Vorteile:

  • Skalierbare Verarbeitung, die Tausende von Dokumenten in parallel.

  • Bessere Versionierung und Datenprüfung (DynamoDB + CloudWatch-Logs).

  • Die Förderung der Mehrsprachigkeit (de/EN/DE), Dank Verstehen + custom NLP.

 

"Die automatisierte Verarbeitung von Dokumenten in die USA, nimmt die routine-Aufgaben und ermöglichen das team um den Fokus auf die Qualität der Katalog. Schnellere Aufnahme Produkte direkt unterstützen unsere business-Ziele zu erreichen.“ 

aspecta logo

Fazit

Das Projekt hat bestätigt, dass die Automatisierung auf Basis von KI und serverloser Architektur ein effektiver Weg ist, um die Verarbeitung von Produktdokumentationen in technisch anspruchsvollen Segmenten zu beschleunigen und zu präzisieren. Die Lösung ermöglichte es dem Kunden, einen zeitaufwändigen manuellen Prozess in ein agiles und genau messbares System umzuwandeln, das sich je nach Bedarf skalieren lässt. Die bewährte Kombination von AWS-Diensten schuf eine solide Grundlage für die weitere Ausweitung der Automatisierung und intelligenten Datenverwaltung im gesamten Unternehmen.

Abonnieren Sie und verpassen Sie keinen Artikel

Wenn Sie den Artikel gefallen hat, teilen Sie es