Newton Media zpracuje měsíčně přes dva miliony článků v šesti jazycích. Aby mohly z článků vzniknout kvalitní data, musí být otagovány – a v oblasti media intelligence je kvalitní a podrobný tagging nezbytný. Manuální tagování je ale zdlouhavé, drahé, náchylné k lidským chybám a nedostatečně granulární při identifikaci specifických entit (osob, organizací, míst atd.). Aby tedy mohl Newton Media nabídnout svým zákazníkům rychlejší, podrobnější a kvalitnější monitoring, bylo potřeba proces automatizovat.
Podrobný mediální monitoring poháněný AI

Jméno klientaNewton Media
Země klientaČeská republika
- Typ klientaMalý nebo střední podnik
- OdvětvíMarketing a média
- Oblast nasazeníVývoj produktů, inovace a VaV
- AI technologiePokročilá analytika / Data Science, Strojové učení, Zpracování přirozeného jazyka (NLP)
- Přínos pro byznysInovace produktů a služeb, Zákaznická zkušenost a růst trhu
- Typ datDokumenty / semistrukturovaná data, Textová data
- Model dodání Služba / Předplatné
- NasazeníCloudové řešení
- Klíčové schopnostiInteligentní vyhledávání a získávání znalostí, Rozpoznávání, klasifikace a tracking
- Fáze projektuŠkálování / rozšířená implementace
- Formy řešeníPlugin / rozšíření pro existující systém
Popis řešení
Obchodní problém
Řešení
Do Newton Media jsme implementovali naše NLP řešení. To dokáže v první řadě správně rozpoznat entity, a detekovat tak v textech osoby, místa, organizace ad. Tyto entity jsme také obohatili o další informace, například CEO pro organizaci, region pro město nebo roli pro osobu, a také je propojili, aby bylo možné mezi subjekty sledovat mediální interakci. Řešení umí také analyzovat kontext pro určení sentimentu textů a relevance jednotlivých entit. Pro analýzu milionů článků jsme zajistili i škálovatelnost pro zpracování velkých objemů dat v reálném čase.
Hlavní uživatelé řešení
Datoví analytici, marketingoví specialisté, PR specialisté, mediální analytici, novináři
Časový rámec projektu (měsíce)
3
Dodatečné služby
- Anotace / syntetická data / rozšíření datasetu
- Průběžná údržba a retraining modelu
Implementace
Vlastník projektu na straně klienta
Vrcholové vedení (C‑level)
Participace na straně klienta
- Data & ML specialisté
- Softwarové & datové inženýrství / IT Ops
- Projektové a change řízení
Forma zapojení dodavatele
Společná implementace s klientem
Provoz a údržba
Provozní model
Relevanci a aktuálnost entit zajišťuje Geneea Analytics prostřednictvím Geneea Knowledge Base.
Dopad a výsledky
Kvalitativní přínosy
Díky zapojení NLP systému Geneey se značně rozšířil analytický potenciál textových dat, které Newton Media nabízí, čímž se razantně zvýšila konkurenční výhoda Newtonu v oblasti Media Intelligence. Hlavním přínosem je rapidní zlepšení uživatelské zkušenosti zákazníků Newton Media, především díky pokročilým možnostem analýzy textových dat a kvalitě a granularitě tagovaných entit.
Kvantitativní výsledky
Zvýšení efektivity – čas potřebný pro zpracování a klasifikaci mediálních výstupů klesl o 67 % Zlepšení přesnosti – přesnost identifikace relevantních entit vzrostla o 43 % ve srovnání s předchozími metodami
Poučení a doporučení
Klíčové faktory úspěchu
Zásadním faktorem je kvalita znalostní báze, ve které jsou entity uloženy (Geneea Knowledge Base), a dlouhodobě vyvíjené a neustále zdokonalované NLP řešení zaměřené specificky na média.
Doporučení pro ostatní
Tagging a automatické rozpoznání entit je (nejen) ve světě médií a media intelligence čím dál důležitější. A jestli pracujete s jakýmkoliv obsahem a ještě tagging nepoužíváte, je nejvyšší čas začít, protože vaše konkurence už to dávno dělá. Udržovat data aktuální a zajistit vysokou úspěšnost taggingu je ale úkol, na který většina firem nemá kapacitu. I proto teď ve světě trenduje přístup “buy, don’t build”, tedy raději koupit hotové, prověřené a vybalancované řešení než se pouštět do vývoje vlastního s nejistým výsledkem. Při implementaci externího řešení dávejte pozor, jestli zvládne rozpoznat všechny entity, které se ve vašem obsahu vyskytují (například lokální fotbalové kluby), případně jestli pro vás dodavatel takové entity doplní. Důležitým prvkem je i relevance entit, tedy jestli je v textu zmíněna jen okrajově nebo je to hlavní téma (například článek o instagramu versus odkaz na instagram nějaké celebrity v závěru článku), i tu musí výsledné řešení umět odhalit. A pozor na ty, kteří by vám chtěli namluvit, že takovou věc dnes zvládne velký jazykový model. Jistě, nějak to zvládne, ale zabere vám to věčnost, bude vás to stát majlant a výsledek bude stále mnohem horší než u speciálně uzpůsobeného řešení s kombinací NLP přístupů.
Propagace
Demo / veřejné výstupy
- https://demo.geneea.com/
- https://geneea.com/cs/case-studies/newton/
- https://www.newtonmedia.cz/entity-prinasi-rychlou-orientaci-v-medialnich-datech/
- https://www.idnes.cz/zpravy/mediahub/newton-media-entity-geneea-medialni-data.A211112_082650_mediahub_jpl
- https://www.mam.cz/novinky/2021-11/newton-media-zlepsil-orientaci-v-medialnich-datech/

- Společnostict; marketing-media; creative-gaming
- KontaktPetr Hamerník
- Emailpetr.hamernik@geneea.com
- Webhttps://geneea.com
- AdresaOstrovní 2064/5, 110 00 Praha