Umwandlung historischer E-Mail-Archive in eine Generative-AI-Wissensdatenbank

Eine große Einzelhandelskette im Bereich Bürobedarf, Elektronik und Druckdienstleistungen hat ihre historischen E-Mail-Archive in eine durch Generative AI unterstützte, durchsuchbare Wissensdatenbank transformiert. Die implementierte Lösung (AWS Bedrock + OpenSearch Vector Engine) hat die Bearbeitung von Kundenanfragen deutlich beschleunigt, die Servicequalität verbessert und die Grundlage für weitere datengetriebene Initiativen geschaffen.

16. september 2025 ┃ 4 minút čítania

aspecta logo

Herausforderung

Im Laufe der Jahre sammelte der Kunde eine große Menge an Kundene-Mails, die in PST-Archiven und anderen schwer zugänglichen Altsystemen gespeichert waren. In diesen unstrukturierten Daten verbargen sich wertvolle Informationen über Kundenbedürfnisse, wiederkehrende Anfragen und Nachfragetrends. Herkömmliche Suchmethoden waren jedoch langsam und lieferten häufig irrelevante Ergebnisse.

 

Wichtigste Herausforderungen:

  • Ineffizienter Kundensupport – lange Suchzeiten nach historischer Kommunikation.
  • Verpasste Geschäftschancen – Muster in historischen Daten wurden nicht genutzt.
  • Betriebliche Engpässe – die manuelle Verarbeitung von PST-Dateien war aufwendig.
  • Wissensverlust – organisatorisches Wissen war an Personen statt an Systeme gebunden.
  • Wettbewerbsrisiko – Notwendigkeit, Datenprozesse zu beschleunigen, um wettbewerbsfähig zu bleiben.
aspecta logo

Die Lösung

In Zusammenarbeit mit einem Implementierungspartner wurde ein generativer KI-Smart-Assistent für die semantische Suche in E-Mail-Archiven und die Extraktion geschäftsrelevanter Muster entwickelt und eingesetzt.
 
Wichtige Komponenten:
  • Foundation Modelle, die über Amazon Fundament für die NLU und generieren Antworten.
  • Amazon OpenSearch-Service (Vector-Motor) wie der index/Vektor-Datenbank für die semantische Suche.
  • Amazon S3 für die Materialbereitstellung und Lagerung von Archiven.
  • API Gateway, AWS Lambda für die Orchestrierung Abfragen.
  • Amazon DynamoDB zu verwalten, den status der Konversation und die Metadaten.
 
Die Funktionalität der Lösungen:
  • Semantische Suche (Bedeutung > Schlüsselwörter) in zehntausenden historischen Berichten.
  • Generierung kontextbezogener Antworten und Zusammenfassungen für Support-Mitarbeitende.
  • Identifikation von Geschäftsmodellen, die wiederholen Aufträge, wiederholt Fragen, die potenzielle Nachfrage nach Produkten).

 

Architektur (kurz)

  • Ingest-pipeline: PST → parser (extern) → S3 (staging) → text-Reinigung → vectorizer → OpenSearch - (Vektor-Indizes).
  • AI-pipeline: API-Gateway → Lambda → Grundgebirge (Modell) + OpenSearch (retrieval) → DynamoDB (session state) → UI.
  • Sicherheit & Beobachtbarkeit: VPC-Endpunkte, CloudTrail, CloudWatch, GuardDuty, Verschlüsselung im S3 -, TLS-API.
  • CI/CD-und lifecycle-Modell: repo in Git, CodePipeline/CD (oder ein ähnliches CI), die Prüfungen für die Eingabeaufforderung ändert.

aspecta logo

Implementierung

Implementierung

Phasen des Projekt:
  1. Analyse & design-Daten-Ströme, die Regeln der Sicherheit, multi-account AWS-Architektur.
  2. Ingest & Reinigung – externe PST-Analyse, Normalisierung des Textes, das hochladen auf S3.
  3. Vektorisierung & Indexierung – Erstellung von Embeddings und Befüllung von OpenSearch.
  4. KI-Orchestrierung – Bedrock + Lambda + OpenSearch-integration, Einstellung promptov, und human-in-the-loop-Tests.
  5. UI & Verabschiedung – eine einfache Benutzeroberfläche für die Agenten + training.
  6. Sicherheit & überwachung – VPC, IAM least-privilege, CloudWatch, CloudTrail, GuardDuty.
 
Bereitstellung in die Produktion erfolgte in den einschlägigen: der pilot (support-team) → Erweiterung → Stabilisierung.
Zeitraum (ab dem ersten sprintu, nachdem der pilot): ~4 Monate (ein iterativer Ansatz).

aspecta logo

Ergebnisse und Vorteile

Die Implementierung der Lösung brachte messbare Verbesserungen in der Effizienz und Qualität der Anfragenbearbeitung. Wichtige Kennzahlen bestätigen eine deutliche Verkürzung der Zeit zur Lösung von Tickets sowie eine höhere Genauigkeit bei der Informationssuche. Neben den unmittelbaren Ergebnissen zeigte sich auch ein langfristiger Nutzen im Bereich des Wissensmanagements und der Entwicklung fortgeschrittener Analysefunktionen.

  1. Zeit Auflösung (Unterstützung)
    • Vor der Bereitstellung: 10-15 Minuten mit der manuellen Suche der historischen Kommunikation.
    • Nach der Bereitstellung: 2-3 Minuten (≈70 % reduction).
  2. Suche Erfolgsquote (Relevanz der Ergebnisse)
    • Vorher: ~55% der relevanten Erkenntnisse in die Schlüsselwort-Suche.
    • Nach: >90% der relevanten Ergebnisse in vektorovom sémantickom suchen.
 
Zusätzliche Vorteile:
  • Reduzieren Sie den manuellen Aufwand bei der Verarbeitung von Archiven.
  • Eine bessere Kontinuität des Wissens in der Organisation.
  • Die Grundlage für die weiteren Funktionen: - Verarbeitung Anlagen (OCR), predictive analytics, sales insights.

 

"Das Projekt sich in der archivierten Kommunikation ein praktisches Werkzeug, das täglich verbessert die Qualität unserer Antworten für unsere Kunden."
— client

aspecta logo

Fazit

Das Projekt bestätigte, dass auch umfangreiche, lange ungenutzte Archive einen sofortigen geschäftlichen Mehrwert bringen können, wenn sie mit modernen KI-Tools verknüpft werden. Der Wechsel vom manuellen Arbeiten zum intelligenten Suchen verringerte Betriebsausfälle, beschleunigte Entscheidungsprozesse und schuf eine verlässliche Grundlage für datengesteuerte Innovationen. Die Lösung beweist, dass die Transformation von Wissen weder riskant noch kostspielig sein muss, wenn sie auf einer skalierbaren und sicheren Cloud-Architektur basiert.

Abonnieren Sie und verpassen Sie keinen Artikel

Wenn Sie den Artikel gefallen hat, teilen Sie es