Transformácia historických e-mailových archívov na Generative AI znalostnú bázu

Veľký retailový reťazec v segmente kancelárskych potrieb, elektroniky a tlačových služieb transformoval svoje historické e-mailové archívy do vyhľadateľnej znalostnej databázy postavenej na Generative AI. Implementované riešenie (AWS Bedrock + OpenSearch Vector Engine) umožnilo výrazné zrýchlenie riešenia požiadaviek zákazníkov, zlepšenie kvality podpory a vytvorenie základu pre ďalšie dátovo riadené iniciatívy.

16. september 2025 ┃ 4 minút čítania

aspecta logo

Výzva

Klient za roky nahromadil rozsiahle množstvo zákazníckych e-mailov uložených v PST archívoch a ďalších legacy systémoch, ktoré boli ťažko prístupné. V týchto neštruktúro-vaných dátach sa skrývali informácie o potrebách zákazníkov, opakujúcich sa požiadavkách a trendoch v dopyte. Tradičné vyhľadávanie však fungovalo pomaly a často vracalo irelevantné výsledky.

 

Hlavné výzvy:

  • Neefektívna podpora zákazníkov – dlhé časy hľadania historickej komunikácie.
  • Premeškávanie obchodných príležitostí – vzory v historických dátach neboli využité.
  • Prevádzkové úzke hrdlá – manuálne spracovanie PST súborov bolo náročné.
  • Strata znalostí – organizačná pamäť viazaná na ľudí, nie na systém.
  • Konkurenčné riziko – potreba zrýchliť dátové procesy kvôli konkurencii.
aspecta logo

Riešenie

V spolupráci s implementačným partnerom bol navrhnutý a nasadený Generative AI Smart Assistant pre sémantické vyhľadávanie v e-mailových archívoch a extrakciu obchodne relevantných vzorov.
 
Kľúčové komponenty:
  • Foundation models via Amazon Bedrock pre NLU a generovanie odpovedí.
  • Amazon OpenSearch Service (Vector Engine) ako index/vektorová databáza pre sémantické vyhľadávanie.
  • Amazon S3 na staging a skladovanie surových archívov.
  • API Gateway, AWS Lambda pre orchestration dotazov.
  • Amazon DynamoDB na správu stavu konverzácií a metadát.
 
Funkčnosť riešenia:
  • Sémantické vyhľadávanie (význam > kľúčové slová) v desaťtisícoch historických správ.
  • Generovanie kontextových odpovedí a sumarizácií pre agentov podpory.
  • Identifikácia obchodných vzorov (opakované objednávky, opakované otázky, potenciálny dopyt po produktoch).

 

Architektúra (v stručnosti)

  • Ingest pipeline: PST → parser (externý) → S3 (staging) → text cleaning → vectorizer → OpenSearch (vector indices).
  • AI pipeline: API Gateway → Lambda → Bedrock (model) + OpenSearch (retrieval) → DynamoDB (session state) → UI.
  • Security & observability: VPC endpoints, CloudTrail, CloudWatch, GuardDuty, šifrovanie v S3, TLS pre API.
  • CI/CD a model lifecycle: repo v Git, CodePipeline/CD (alebo ekvivalentný CI), human checks pre prompt changes.

aspecta logo

Implementácia

Implementácia

Fázy projektu:
  1. Analýza & návrh – dátové toky, bezpečnostné pravidlá, multi-account AWS architektúra.
  2. Ingest & čistenie – externý PST parsing, normalizácia textu, nahratie do S3.
  3. Vektorizácia & indexácia – vytvorenie embeddingov a naplnenie OpenSearch.
  4. AI orchestration – Bedrock + Lambda + OpenSearch integrácia, nastavenie promptov a human-in-the-loop testovania.
  5. UI & adopcia – jednoduché rozhranie pre agentov + školenia.
  6. Bezpečnosť & monitoring – VPC, IAM least-privilege, CloudWatch, CloudTrail, GuardDuty.
 
Nasadenie do produkcie prebehlo v iteráciách: pilot (support tím) → rozšírenie → stabilizácia.
Časový rámec (od prvého sprintu po pilot): ~4 mesiace (iteratívny prístup).

aspecta logo

Výsledky a benefity

Nasadenie riešenia prinieslo merateľné zlepšenia v efektivite a kvalite spracovania požiadaviek. Kľúčové ukazovatele potvrdzujú výrazné skrátenie času potrebného na vyriešenie ticketov aj vyššiu presnosť pri vyhľadávaní informácií. Okrem okamžitých výsledkov sa ukázal aj dlhodobý prínos v oblasti znalostného manažmentu a rozvoja pokročilých analytických funkcií.

  1. Time to Resolution (podpora)
    • Pred nasadením: 10–15 minút pri manuálnom vyhľadávaní historickej komunikácie.
    • Po nasadení: 2–3 minúty (≈70 % redukcia).
  2. Search Success Rate (relevancia výsledkov)
    • Pred: ~55 % relevantných nálezov pri keyword search.
    • Po: >90 % relevantných výsledkov pri vektorovom sémantickom vyhľadávaní.
 
Ďalšie prínosy:
  • Zníženie manuálnej záťaže pri spracovaní archívov.
  • Lepšia kontinuita znalostí v organizácii.
  • Základ pre ďalšie funkcie: spracovanie príloh (OCR), prediktívna analytika, sales insights.

 

„Projekt premenil archivovanú komunikáciu na praktický nástroj, ktorý denno-denne zlepšuje kvalitu našich odpovedí zákazníkom.“
— klient

aspecta logo

Záver

Projekt potvrdil, že aj rozsiahle, dlhodobo nevyužívané archívy môžu priniesť okamžitú biznisovú hodnotu, ak sa prepoja s modernými AI nástrojmi. Zmena prístupu od manuálneho spracovania k inteligentnému vyhľadávaniu znížila prevádzkové straty, zrýchlila rozhodovanie a vytvorila spoľahlivý základ pre dátovo riadené inovácie. Riešenie je dôkazom, že transformácia znalostí nemusí byť riziková ani nákladná, ak je postavená na škálovateľnej a bezpečnej cloudovej architektúre.

Prihláste sa na odber a neunikne vám žiadny článok

Ak sa vám článok páčil, zdieľajte ho