Analýza 12 tisíc dokumentů a 2000 emailů pro advokátní kancelář

Země klientaČeská republika

  • Typ klientaMalý nebo střední podnik
  • OdvětvíPrávo a justice
  • Oblast nasazeníPrávo, compliance a řízení rizik
  • AI technologieGenerativní AI, Zpracování přirozeného jazyka (NLP)
  • Přínos pro byznysEfektivita provozu a úspory nákladů, Produktivita a podpora zaměstnanců
  • Typ datDokumenty / semistrukturovaná data, Obrazová data, Textová data
  • Model dodáníProdukt / Licencovaný software
  • NasazeníBez nasazení
  • Klíčové schopnostiKonverzační a jazyková interakce
  • Fáze projektuOvěření konceptu (prototyp / PoC / pilot)
  • Formy řešeníAnalýza, doporučení nebo report

Popis řešení

Obchodní problém

Zadání znělo jasně: Potřeba vyhledat desítky kombinací slov v tisícovkách dokumentů a emailů. A to vše s omezeným rozpočtem. Zprvu jsme se nechali strhnout módní vlnou a šli cestou ChatuGPT, co jiného by také člověka napadlo, když na něj AI buzzwordy skáčí už i z ledničky. Záhy jsme ale zjistili, že toto řešení připomíná spíše chytání sardinek sítí na žraloky a vydali se konzervativnější, a hlavně efektivnější, cestou.

Řešení

Zpracovali jsme přes 12 tisíc dokumentů a 2 tisíce e-mailových řetězců s cílem vyhledat klíčová slova a snížit počet dokumentů k ručnímu čtení. Text jsme nahráli do databáze a dotazovali se nad ní pomocí SQL (BigQuery). Skenované PDF soubory bylo nutné převést pomocí OCR, rozsáhlé dokumenty rozdělit. Každý hledaný řetězec měl varianty díky synonymům, což vedlo k desítkám kombinací. Zavedli jsme dvě úrovně hledání – obecnou a detailní. Obecná pomohla odhalit zavádějící stopy, detailní naopak zpřesnila výsledky tam, kde bylo shod příliš mnoho.

Hlavní uživatelé řešení

Právní koncipienti, Advokáti

Použité technologie

Document AI, Google Cloud Databases, Vertex AI, Google Workspace, ML & ML APIs, Productivity,

Použití osobních údajů / regulovaných dat

Ano

Implementace

Vlastník projektu na straně klienta

Vrcholové vedení (C‑level)

Forma zapojení dodavatele

Kompletní realizace

Dopad a výsledky

Kvalitativní přínosy

Finálním výstupem se na základě tohoto řešení stala jednoduchá tabulka, v níž byl u každé varianty slovního řetězce uvedený počet nalezených shod a seznam konkrétních dokumentů k prozkoumání. Díky převedení všech dokumentů na prostý text se pak přesná pozice slova v konkrétním dokumentu dala najít už klasicky přes fulltextové vyhledávání.

Kvantitativní výsledky

Naše řešení klientovi ušetřilo stovky hodin mravenčí práce bez jistého výsledku.

Poučení a doporučení

Klíčové faktory úspěchu

Při takovýchto projektech je potřeba předvídat, jaký typ výstupu bude pro klienta nejužitečnější. Někdy není potřeba hledat nejvíc trendy technologii, ale osvědčené řešení. V tomto případě tabulku coby rozcestník s výstupy.

Doporučení pro ostatní

Nespoléhat se na první řešení ovlivněné trendy, ale hledat to opravdu nejefektivnější

Propagace

Buďte v obraze s CNAIP. Přihlašte se k pravidelnému mediamonitoru a nemine vás žádná novinka v oblasti AI. Pravidelně dostanete do svých schránek přehled toho nejdůležitějšího.

Odběrem souhlasíte se Zásadami ochrany soukromí

Chcete se stát součástí České AI?

Podělte se o svůj příběh a ukažte, co vše s umělou inteligencí dokážete. Vaše zapojení inspiruje ostatní a pomůže nám zmapovat českou AI scénu v celém jejím rozsahu.