Jaká je vaše datová strategie pro AI?

5. 9. 2024

Doba čtení: 3 minuty

Umělá inteligence postupně transformuje podnikové procesy. Přístup k dostatečným, spolehlivým a aktuálním datům bude proto v nadcházejících letech klíčovým faktorem úspěchu.

Stále výraznější orientace na data v podnikové sféře potvrzuje aktuálnost starého moudra o tom, že analytické výstupy jsou pouze tak dobré jako vstupní data.

Aplikace umělé inteligence v mnoha různých podnikových procesech pouze zdůrazňuje potřebu zajistit přesnost a včasnost užívaných dat, ať jsou generována interně nebo získávána z vnějších zdrojů.

Náklady na špatná data

Výzkumná a poradenská organizace Gartner odhaduje, že podniky kvůli používání nekvalitních dat přicházejí v průměru o 12,9 milionu dolarů ročně. A společnost IBM spočítala, že špatná data ročně stojí americkou ekonomiku více než tři biliony dolarů.

Chcete dostávat do mailu týdenní přehled článků z CIO Business Worldu? Objednejte si náš mailový servis a žádná důležitá informace vám neuteče. Objednat si lze také newsletter To hlavní, páteční souhrn nejdůležitějších článků ze všech našich serverů. Newslettery si můžete objednat na této stránce.

Většina těchto nákladů souvisí s kontrolou a opravou dat při jejich předávání mezi různými složkami podniku. IBM se domnívá, že polovina času znalostních pracovníků je promrhána těmito činnostmi.

Kromě těchto interních nákladů však existuje větší problém – podnikům, které na základě špatných nebo zavádějících dat učiní chybná rozhodnutí, hrozí poškození pověsti u zákazníků a dodavatelů nebo přímo postih ze strany regulačních orgánů.

Například časopis Sports Illustrated to zjistil, když vyšlo najevo, že otiskl články napsané falešnými autory a s obrázky generovanými umělou inteligencí. Zatímco generální ředitel přišel o práci, mateřská společnost Arena Group ztratila 20 % své tržní hodnoty.

Došlo také k několika významným případům, kdy se advokátní kanceláře dostaly do problémů tím, že v právních sporech předložily falešné precedenty vygenerované umělou inteligencí.

AI jako černá skříňka

I když je kontrola a oprava dat užívaných při rozhodování a v podnikových procesech nákladná, stala se pro většinu podniků zavedenou praxí. Avšak rostoucí míra halucinací u některých velkých jazykových modelů (LLM) vyvolává otázky ohledně toho, jak byly tyto modely trénovány, na jakých datech a zda lze výstupům vůbec věřit.

Například nově zvolený hejtman jednoho australského okresu pohrozil společnosti OpenAI žalobou za nepravdivé tvrzení jejího nástroje ChatGPT, že si odpykal trest odnětí svobody za úplatkářství, zatímco ve skutečnosti to byl on, kdo na trestnou činnost upozornil.

Trénování LLM na důvěryhodných datech a osvojení přístupů, jako je iterativní dotazování, generování rozšířené o dodatečné zdroje (RAG) a další, jsou dobrým způsobem, jak výrazně snížit nebezpečí halucinací, avšak nemohou zaručit, že k nim nedojde.

Učení ze syntetických dat

Ve snahách o získání konkurenční výhody zaváděním systémů umělé inteligence mohou uspět ti, kdo mají přístup k dostatečnému objemu relevantních proprietárních dat k trénování svých modelů. Ale co podniky, které k takovým datům nemají přístup a jichž je většina?

Výzkumníci předpovídají, že za předpokladu, že budou současné trendy pokračovat, dojdou vysoce kvalitní textová data užívaná k trénování modelů LLM ještě před rokem 2026.

Jednou z možných odpovědí na tento hrozící problém bude širší užívání syntetických tréninkových dat. Společnost Gartner odhaduje, že do roku 2030 v modelech umělé inteligence převáží syntetická data nad reálnými. Vrátíme-li se však k varování z úvodu, přílišné spoléhání se na syntetická data zvyšuje riziko nepřesných výstupů a špatných rozhodnutí.

Taková data jsou totiž jen tak dobrá, jak dobré jsou modely, které je vytvořily. Dlouhodobější nebezpečí může vyplývat z „příbuzenského křížení dat“, kdy jsou modely umělé inteligence trénovány na podřadných syntetických datech, jež produkují výstupy, které se pak vracejí zpět do pozdějších modelů.

Postupujte obezřetně

Džin umělé inteligence je venku z láhve, a přestože bude trvat déle, než dojde k rozsáhlé digitální revoluci, kterou slibují někteří až příliš nadšení dodavatelé technologií a konzultanti, umělá inteligence bude i nadále transformovat podniky způsoby, které si zatím nedokážeme představit.

Přístup ke spolehlivým a důvěryhodným datům, jež jsou k dispozici v potřebném rozsahu, je však již nyní překážkou, se kterou si musejí CIO a další podnikoví manažeři poradit, než bude příliš pozdě.

Článek vyšel v magazínu CIO BW 4/2024, který si i s dalšími zajímavými články můžete koupit zde.

CIO Business World si můžete objednat i jako klasický časopis (v tištěné i v digitální podobně) Věnujeme se nejnovějším technologiím a efektivnímu řízení podnikové informatiky. Přinášíme nové ekonomické trendy a analýzy a zejména praktické informace z oblasti podnikového IT se zaměřením na obchodní a podnikatelské přínosy informačních technologií. Nabízíme možná řešení problémů spojených s podnikovým IT v období omezených rozpočtů. Naší cílovou skupinou je vyšší management ze všech odvětví ekonomiky.

Našli jste v článku chybu?

Martin De Saulles

Témata:

6. 11. Výhra Trumpa vytvořila nové milionáře díky BTC

Vítězství Donalda Trumpa vyvolalo výrazný nárůst hodnoty bitcoinu (BTC). Výzkum společnosti Finbold zjistil, že za posledních 30 dní vzniklo 11 487 nových bitcoinových adres, které drží 1 milion dolarů nebo více, a to především díky 7,5% růstu BTC od doby, kdy se náskok Donalda Trumpa ve volbách stal drtivým.
Nyní drží 132 842 adres v bitcoinech více než milion dolarů: 121 126 adres drží od 1 do 9,99 milionu dolarů, zatímco 11 697 adres drží 10 milionů dolarů a více. Analýza využila historické údaje a porovnávala předvolební údaje ze 7. října 2024, získané pomocí webového archivačního nástroje Wayback Machine, s nejnovějšími povolebními statistikami k 6. listopadu 2024.
6. 11. První akvizice EET v Česku

Strategickou akvizici divize náhradních dílů společnosti Moravia Consulting, která se specializuje především na obchod s náhradními díly k produktům Hewlett Packard a Hewlet Packard Enterprise uskutečnila distribuční společnost EET Group. Upevňuje tak svou pozici předního poskytovatele náhradních dílů pro IT po celé Evropě. Zároveň jde o první akvizici firmy z České republiky po vstupu EET Group na český trh.
30. 10. Miliony pro start-upy

Agentura CzechInvest otevírá další výzvu projektu Technologická inkubace. V pořadí již pátá výzva s alokací 104,8 milionu korun bude spuštěna v pravé poledne 30. října a potrvá do 29. listopadu 2024. Program, který podporuje startupové prostředí prostřednictvím sedmi specializovaných technologických hubů, nabízí podnikatelům pomoc s jejich inovativním produktem či službou. Nyní spolupracuje s téměř 180 firmami z plánovaných 250, projekt se tak již přehoupl přes svou symbolickou polovinu.
Více informací o programu a nové výzvě naleznete zde.
30. 10. Rozšiřující se DIA

Vzhledem ke sjednocování souvisejících agend přechází kompletní správa, rozvoj a financování registru obyvatel a registru osob od 1. listopadu 2024 z Ministerstva vnitra, resp. Českého statistického úřadu na Digitální a informační agenturu (DIA).
V době samotného převodu obou registrů od 31. října 20:00 do 1. listopadu 04:00 se může projevit snížená dostupnost jejich služeb, jinak by se podle tvrzení DIA dostupnost služeb nijak měnit neměla.
29. 10. Apple Tap to Pay už i v ČR

Apple počínaje dneškem podporuje Tap to Pay na iPhonu v Rakousku, České republice, Irsku, Rumunsku a Švédsku, čímž dává milionům obchodníků možnost využívat iPhone k plynulému a bezpečnému přijímání bezkontaktních plateb.
Tap to Pay na iPhonu pomáhá podnikům všech velikostí přijímat bezkontaktní platby kreditními a debetními kartami, pomocí Apple Pay a pomocí dalších digitálních peněženek za použití pouze iPhonu a partnerských aplikací pro iOS, což v praxi znamená, že nemusí pracovat s žádným dalším hardwarem.

Sdílet

Náklady na špatná data

Nové letní číslo CIO Business World 4/24 je v prodeji. Co v něm najdete?

AI jako černá skříňka

Máme zajímavá čísla o využívání AI v českých firmách

Učení ze syntetických dat

Tajemství úspěšných hackathonů

Postupujte obezřetně

Autor článku

Martin De Saulles

Témata:

Mohlo by vás zajímat

Businessworld Newsletter

HP Knowledge HUB
pro moderní firemní IT

Krátce

6. 11. Výhra Trumpa vytvořila nové milionáře díky BTC

6. 11. První akvizice EET v Česku

30. 10. Miliony pro start-upy

30. 10. Rozšiřující se DIA

29. 10. Apple Tap to Pay už i v ČR

Anketa

Je pro váš podnik umělá inteligence vhodným řešením některých požadavků?

SPECIÁLNÍ PROJEKTY

Gmail chystá dočasné „štítové“ e-mailové adresy proti spamu

HPE ocenilo partnery roku 2024, nejlepším distributorem je DNS

Třetí čtvrtletí letošního roku ryze českých investic

Sledují vás přes HDMI? Revoluční útok využívá AI a elektromagnetické záření

IDC: Dodávky průmyslových továren stagnují, výkonnost segmentů se ale liší

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

O2 nasazuje proti telefonním šmejdům „AI babču“

ComSource: Čtyři z pěti organizací kritické infrastruktury čelily phishingu

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Jaká je vaše datová strategie pro AI?

Sdílet

Náklady na špatná data

Nové letní číslo CIO Business World 4/24 je v prodeji. Co v něm najdete?

AI jako černá skříňka

Máme zajímavá čísla o využívání AI v českých firmách

Učení ze syntetických dat

Tajemství úspěšných hackathonů

Postupujte obezřetně

Autor článku

Mohlo by vás zajímat

Kvíz týdne

6. 11. Výhra Trumpa vytvořila nové milionáře díky BTC

6. 11. První akvizice EET v Česku

30. 10. Miliony pro start-upy

30. 10. Rozšiřující se DIA

29. 10. Apple Tap to Pay už i v ČR

Anketa

Je pro váš podnik umělá inteligence vhodným řešením některých požadavků?

SPECIÁLNÍ PROJEKTY

Z našich webů

Gmail chystá dočasné „štítové“ e-mailové adresy proti spamu

HPE ocenilo partnery roku 2024, nejlepším distributorem je DNS

Třetí čtvrtletí letošního roku ryze českých investic

Sledují vás přes HDMI? Revoluční útok využívá AI a elektromagnetické záření

IDC: Dodávky průmyslových továren stagnují, výkonnost segmentů se ale liší

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

O2 nasazuje proti telefonním šmejdům „AI babču“

ComSource: Čtyři z pěti organizací kritické infrastruktury čelily phishingu

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Dále u nás najdete

Nitroděložní tělíska jsou spolehlivá a hodí se i pro mladé ženy

Jak Mikýř vyděsil Novu, ale nakonec vydělaly obě strany

Vyznejte se v kuřatech. Takhle se liší selské od venkovského

Osvědčené způsoby, jak snížit vysoký krevní tlak

Stříteský: Obchodníci dostávají v zahraničí vyšší sankce a slevy mají omezené

Papírové letáky budou zpoplatněny, může jít o desetník za kus

Jak českým firmám pomáhá digitální transformace?

World of Warcraft slaví 20 let a stále se hraje

Temný rekord, počet kyberútoků dosáhl historického maxima

Dávají práci lidem na Valašsku a předávají dál folklor

Správná péče o bércové vředy může zabránit zanícení

Bolest prsu nemusí hned značit vážné onemocnění

Od pokeru do dílny: Vyrábí v ní nábytek z ohýbaného betonu

Nevyžádané marketingové hovory přísnější zákon nevymýtil

Prokletí slavného spisovatele: duševní poruchy a sebevraždy

Svařák bez alkoholu je skvělá varianta pro těhotné či abstinenty

Obsah vytvořený pomocí AI vidíte každý den. Jen to nevíte

První pacientka podstoupila genovou terapii bránící slepotě

10 tradičních českých vánočních značek. Znáte jejich příběh?

Šlamastika kolem pozastavené výplaty důchodu