Zadání znělo jasně: Potřeba vyhledat desítky kombinací slov v tisícovkách dokumentů a emailů. A to vše s omezeným rozpočtem. Zprvu jsme se nechali strhnout módní vlnou a šli cestou ChatuGPT, co jiného by také člověka napadlo, když na něj AI buzzwordy skáčí už i z ledničky. Záhy jsme ale zjistili, že toto řešení připomíná spíše chytání sardinek sítí na žraloky a vydali se konzervativnější, a hlavně efektivnější, cestou.
Analýza 12 tisíc dokumentů a 2000 emailů pro advokátní kancelář

Země klientaČeská republika
- Typ klientaMalý nebo střední podnik
- OdvětvíPrávo a justice
- Oblast nasazeníPrávo, compliance a řízení rizik
- AI technologieGenerativní AI, Zpracování přirozeného jazyka (NLP)
- Přínos pro byznysEfektivita provozu a úspory nákladů, Produktivita a podpora zaměstnanců
- Typ datDokumenty / semistrukturovaná data, Obrazová data, Textová data
- Model dodáníProdukt / Licencovaný software
- NasazeníBez nasazení
- Klíčové schopnostiKonverzační a jazyková interakce
- Fáze projektuOvěření konceptu (prototyp / PoC / pilot)
- Formy řešeníAnalýza, doporučení nebo report
Popis řešení
Obchodní problém
Řešení
Zpracovali jsme přes 12 tisíc dokumentů a 2 tisíce e-mailových řetězců s cílem vyhledat klíčová slova a snížit počet dokumentů k ručnímu čtení. Text jsme nahráli do databáze a dotazovali se nad ní pomocí SQL (BigQuery). Skenované PDF soubory bylo nutné převést pomocí OCR, rozsáhlé dokumenty rozdělit. Každý hledaný řetězec měl varianty díky synonymům, což vedlo k desítkám kombinací. Zavedli jsme dvě úrovně hledání – obecnou a detailní. Obecná pomohla odhalit zavádějící stopy, detailní naopak zpřesnila výsledky tam, kde bylo shod příliš mnoho.
Hlavní uživatelé řešení
Právní koncipienti, Advokáti
Použité technologie
Document AI, Google Cloud Databases, Vertex AI, Google Workspace, ML & ML APIs, Productivity,
Použití osobních údajů / regulovaných dat
Implementace
Vlastník projektu na straně klienta
Vrcholové vedení (C‑level)
Forma zapojení dodavatele
Kompletní realizace
Dopad a výsledky
Kvalitativní přínosy
Finálním výstupem se na základě tohoto řešení stala jednoduchá tabulka, v níž byl u každé varianty slovního řetězce uvedený počet nalezených shod a seznam konkrétních dokumentů k prozkoumání. Díky převedení všech dokumentů na prostý text se pak přesná pozice slova v konkrétním dokumentu dala najít už klasicky přes fulltextové vyhledávání.
Kvantitativní výsledky
Naše řešení klientovi ušetřilo stovky hodin mravenčí práce bez jistého výsledku.
Poučení a doporučení
Klíčové faktory úspěchu
Při takovýchto projektech je potřeba předvídat, jaký typ výstupu bude pro klienta nejužitečnější. Někdy není potřeba hledat nejvíc trendy technologii, ale osvědčené řešení. V tomto případě tabulku coby rozcestník s výstupy.
Doporučení pro ostatní
Nespoléhat se na první řešení ovlivněné trendy, ale hledat to opravdu nejefektivnější
Propagace
Demo / veřejné výstupy
- SpolečnostRevolt BI
- KontaktBarbora Kalačová
- Emailmarketing@revolt.bi
- Webhttps://www.revolt.bi
- AdresaVoctářova 2449, 180 00 Praha