Automatisierung der Verarbeitung des Produkts ist die Dokumentation über die AWS AI-Lösungen
07. jul 2025 ┃ 6 minút čítania
Herausforderung
Im segment der Verteilung Verdrahtung und industrielle Komponenten jährlich verarbeitet Zehntausende von produktdatenblättern und technischen Dokumenten von vielen verschiedenen Herstellern. Die meisten Unternehmen verlassen sich immer noch auf manuell überschreiben die Daten, die ist langsam, ineffizient und ausgesetzt, die ein hohes Risiko von Fehlern. Die Dynamik des Marktes, die häufigen änderungen in die Produkt Parameter und die Druck auf den raschen Einstieg der Elemente in den B2B-Portale unter Druck, Automatisierung und die Genauigkeit der Daten.
Datenmenge und Heterogenität der Dokumente: Hunderte von Lieferanten und mehrere Formate (PDF, DOCX, XLS) in verschiedenen Sprachen.
Manuelle Datenerfassung: 15–20 Minuten pro Dokument, hohes Fehlerrisiko beim manuellen Übertragen technischer Parameter.
Verzögerte Produkteinführung: Längere Time-to-Market für neue Artikel im B2B-Portal.
Die Ziele des Projekts
Zur Beschleunigung der Verarbeitung von Dokumenten, die für mindestens 80 %.
Reduzieren die manuelle Arbeit bei der data-team von 50 %.
Zur Erreichung der Genauigkeit der extrahierten Daten von ≥ 98 %.
Die Einführung einer skalierbaren, pay-per-use-architektúuru integriert mit ERP-und B2B-system.
Die Lösung
Die entworfene Lösung basierte auf einer serverlosen AWS-Architektur mit Fokus auf AI/ML und NLP zur Verarbeitung unstrukturierter Dokumente. Dieser Ansatz wurde als optimal in Bezug auf Flexibilität, Zuverlässigkeit und betriebliche Effizienz gewählt. Das serverlose Modell ermöglicht eine schnelle Skalierung je nach Dokumentenvolumen, ohne dass eine Infrastrukturverwaltung erforderlich ist, während die nativen AWS-AI-Dienste geprüfte Genauigkeit und eine schnelle Integration mit bestehenden ERP- und B2B-Systemen bieten.
Wichtige Komponenten:
Amazon S3 – Eingangsspeicher für hochgeladene Dokumente.
Amazon Textract – automatische Extraktion von Texten, Tabellen und Schlüssel-Wert-Paaren.
Amazon Comprehend + benutzerdefiniertes NLP (SageMaker) – Identifizierung und Klassifizierung technischer Parameter (Spannung, Leistung, Abmessungen, Normen, IP-Schutzklasse).
AWS Lambda – Orchestrierung der Workflows und Transformation in strukturierte JSON-Daten.
Amazon DynamoDB – Speicherung der extrahierten Daten und Metadaten.
API Gateway – Integration mit ERP-Systemen und dem B2B-Portal.
Amazon CloudWatch – Überwachung von KPIs, Latenz, Fehlern und Modellqualität.
Prozess:
Die supply-Datei in S3 hochgeladen (batch-oder Ereignis-gesteuert).
Textract extrahiert text-und-Tabellen, die das Ergebnis übergeben Sie einen Lambda-Funktion.
SageMaker NLP-Modell und zu Verstehen, identifizieren Sie die Parameter und ordnen Sie Sie den internen Feldern.
Die Lambda schließt die Validierung des erstellten JSON und speichert den Datensatz zu DynamoDB.
API-Gateway ermöglicht den export zu ERP-und publishing im B2B-Katalog; manuelle Validierung unterstützt auditnými logmi.
Implementierung
Die Projekt-phase (3-6 Monate):
Analyse und PoC (4 Wochen): Prüfung der Dokumente, die definition der Taxonomie der Parameter, einen PoC auf einer Stichprobe von 500 Dokumente.
Entwicklung und training (6-10 Wochen): Bereitstellung von Textract, training, custom NLP-Modell in SageMaker, Entwicklung Lambd und integration.
Integration und Test (4-6 Wochen): eine Verknüpfung mit ERP, testing, end‑to‑end-security-review.
Bereitstellung und tuning (2-4 Wochen): überwachung des Feedbacks der Benutzer, der die Kalibrierung der Modelle.
Die wichtigsten Beschlüsse:
Die Wahl der serverlosen AWS-solutions durch die Skalierbarkeit und die Zahlung nach Verbrauch.
Hybrid-Ansatz: die automatische Verarbeitung der + menschliche überprüfung in Ausnahmefällen.
Ergebnisse und Vorteile
Erste Bewertung bestätigt, dass die bereitgestellte Lösung ergab sich eine messbare Auswirkungen nicht nur auf die betriebliche Effizienz, sondern auch auf die Qualität der Daten und die Geschwindigkeit der Platzierung von Produkten auf dem Markt. Die Kombination von AI und serverlose Ansatz erwies sich als entscheidend im Umgang mit der hohen Volumen von Dokumenten, und das system ist angepasst an die tatsächlichen Bedürfnisse und bietet eine zuverlässige, skalierbare Ergebnisse auch mit der wachsenden Last.
KPI-1 – Speed-Verarbeitung
Baseline: 15-20 Minuten/Dokument.
Ergebnis: der Durchmesser der 1:45 min/Dokument.
Auswirkung: ~90% von der Beschleunigung; eine erhebliche Beschleunigung der Aufnahme der Produkte im Katalog.
KPI-2 – die Richtigkeit der Daten
Baseline: 93-95 % (manuell).
Das Ergebnis: 98,6% nach der Validierung.
Auswirkungen: weniger Beschwerden, desto höher ist die Qualität eines full‑text-Suche.
KPI-3 – Kosten-Wirksamkeit
Ergebnis: ~40 % der Kosten sparen, um die data-team.
Wirkung: geringere Betriebskosten, die Möglichkeit, Mittel für die Entwicklung der Katalog-und UX.
Betriebliche Vorteile:
Skalierbare Verarbeitung, die Tausende von Dokumenten in parallel.
Bessere Versionierung und Datenprüfung (DynamoDB + CloudWatch-Logs).
Die Förderung der Mehrsprachigkeit (de/EN/DE), Dank Verstehen + custom NLP.
"Die automatisierte Verarbeitung von Dokumenten in die USA, nimmt die routine-Aufgaben und ermöglichen das team um den Fokus auf die Qualität der Katalog. Schnellere Aufnahme Produkte direkt unterstützen unsere business-Ziele zu erreichen.“
Fazit
Das Projekt hat bestätigt, dass die Automatisierung auf Basis von KI und serverloser Architektur ein effektiver Weg ist, um die Verarbeitung von Produktdokumentationen in technisch anspruchsvollen Segmenten zu beschleunigen und zu präzisieren. Die Lösung ermöglichte es dem Kunden, einen zeitaufwändigen manuellen Prozess in ein agiles und genau messbares System umzuwandeln, das sich je nach Bedarf skalieren lässt. Die bewährte Kombination von AWS-Diensten schuf eine solide Grundlage für die weitere Ausweitung der Automatisierung und intelligenten Datenverwaltung im gesamten Unternehmen.
Abonnieren Sie und verpassen Sie keinen Artikel
Wenn Sie den Artikel gefallen hat, teilen Sie es
Mehr Artikel Sie könnte genießen
-
FallstudienDie Digitalisierung der Personalakten für das retail business -
FallstudienGestaltung des Informationssystems für SAŽP -
FallstudienDie Digitalisierung der Betriebsanleitung, die in der Produktion eines führenden Innovator in elektromobilite -
Digitale TransformationEin moderner digital workplace Strategie, trends und best practices