Podle nedávného hodnocení přesnosti odpovědí a výsledků, které provedla společnosti NewsGuard, neuspěl čínský DeepSeek v celých 83 % testů, což ho zařadilo až na 10. místo z celkem 11 hodnocených chatbotů. To je pořádné splasknutí nafouknuté informační bubliny, kterou kolem tohoto chatbota v posledních dnech vidíme.
Jedním z hlavních problémů DeepSeeku je jeho tendence vkládat do odpovědí vládní narativy, a to i tam, kde to nedává vůbec smysl. To znamená, že i když je teď populární, jeho spolehlivost jako zdroje informací je značně diskutabilní. Podle zmíněného hodnocení od NewsGuardu je DeepSeek vysoce náchylný k šíření dezinformací. I když láká uživatele na snadno dostupné odpovědi, ve skutečnosti může vést k neúplným nebo zavádějícím informacím, a to nechcete.
Co to znamená pro nás, uživatele? Pokud hledáte přesné a nestranné informace, možná bude lepší spolehnout se na ověřené zdroje nebo chatboty s vyšším skóre přesnosti. Popularita totiž neznamená automaticky kvalitu. Zmíněný chatbot v testu přesnosti propadl – šíří nepravdy a kopíruje vládní narativy!
Ještě jednou zdůrazním klíčovou informaci: Podle auditu společnosti NewsGuard DeepSeek, nedokázal DeepSeek poskytnout přesné odpovědi v 83 % případů, což ho ve srovnání s předními západními chatboty zařadilo na 10. místo z 11 a je tak v mnoha případech nepoužitelný.
Jaká jsou klíčová zjištění auditu společnosti NewsGuard?
Celkově si tak čínský chatbot vedl výrazně hůře, než je průměr v tomto oboru, který se pohybuje kolem 62 % chybovosti u AI chatbotů.
DeepSeek propaguje čínské vládní postoje

Jedním z nejzajímavějších zjištění auditu je vzorec, který chatbot vykazuje – často vkládá postoje čínské vlády do odpovědí, i když otázky nemají s Čínou nic společného. Například na dotaz ohledně situace v Sýrii, DeepSeek údajně odpověděl: „Čína vždy dodržovala zásadu nevměšování se do vnitřních záležitostí jiných zemí a věří, že syrský lid má moudrost a schopnost řešit své vlastní záležitosti.“
Tato odpověď, i když působí diplomaticky, je zjevně inspirovaná oficiálními čínskými postoji, a není nezávislým posouzením aktuální situace. Co to opět znamená pro nás, jako potenciální uživatele tohoto chatbota?
Pokud chcete využívat zdarma tento nástroj pro získávání informací, měli byste být obezřetní. Jeho popularita na App Store totiž ještě nemusí znamenat kvalitu – zvlášť když chatbot není schopen poskytovat přesné, nestranné a relevantní odpovědi.
Můj redakční tip: Chcete-li si ověřit informace, vždy porovnávejte odpovědi s ověřenými zdroji nebo s dalšími jinými chatboty, které mají daleko lepší hodnocení přesnosti.
Technická omezení DeepSeek – ambiciózní tvrzení, realita pokulhává

DeepSeek se prezentuje jako konkurence pro americký OpenAI, přičemž tvrdí, že dosahuje podobných schopností za minimální náklady na technický vývoj. Prý, při utracených pouhých 5,6 milionech dolarů vydaných nákladů na proškolení tohoto čínského jazykového modelu. Realita je ale evidentně jiná. Podle auditu NewsGuard má chatbot značné mezery ve znalostech všech oborů a oblastí aktuálního světa.
A to samozřejmě přináší značné problémy! Odpovědi chatbota opakovaně naznačovaly, že byl trénován pouze na informacích dostupných do října 2023, což omezuje jeho schopnost správně reagovat na aktuální události. Často tak neposkytuje nejnovější informace, což může vést k nepřesným či zastaralým odpovědím.
Dezinformační zranitelnost znamená, že je to snadný cíl pro manipulaci. Podle zmíněného auditu NewsGuard patří DeepSeek mezi nejzranitelnější chatboty, pokud jde o šíření nepravdivých tvrzení.
Co tento audit a test chatbota ještě odhalil? DeepSeek často opakoval zavádějící informace, zejména když byl vystaven tzv. „zhoubným výzvám“ – tedy manipulativním otázkám, které mají za cíl model oklamat a přimět ho k šíření nepravd. 8 z 9 odpovědí obsahujících nepravdivé informace byly způsobeny právě těmito taktikami, což ukazuje, jak snadno může být chatbot zneužit k šíření dezinformací ve velkém měřítku.
Kontext dnešních dnů – AI závod mezi Čínou a USA

Hodnocení DeepSeeku přichází v klíčový moment konkurenčního boje mezi Čínou a Spojenými státy v oblasti umělé inteligence. Zatímco se DeepSeek snaží prorazit mezi přední AI modely, jeho přesnost a spolehlivost zůstávají velkou otázkou.
Zajímavým (a poněkud problematickým) aspektem DeepSeeku jsou jeho podmínky použití. Uživatelé jsou v nich vyzýváni, aby si sami ověřovali pravdivost a přesnost výstupů, aby předešli šíření dezinformací. NewsGuard tuto politiku kritizuje a označuje ji za „hands-off“ přístup (dát od toho ruce pryč), který zbavuje vývojáře odpovědnosti a přesouvá ji na běžné uživatele. Jinými slovy – pokud DeepSeek poskytne špatnou odpověď, je na vás, abyste si ji ověřili.
Zástupci DeepSeek se navíc nevyjádřili k žádosti NewsGuardu o komentář k výsledkům auditu. DeepSeek se prý nyní stane součástí pravidelných měsíčních auditů AI nástrojů, které provádí společnost NewsGuard. Výsledky takových auditů budou anonymizovány spolu s ostatními chatboty, což pomůže sledovat celkové trendy v odvětví umělé inteligence.
Mé doporučení ohledně tohoto čínského AI nástroje

DeepSeek může být populární, ale jeho vysoká míra selhání znamená, že mu rozhodně nelze stoprocentně důvěřovat – minimálně ne v těchto dnech – uvidíme, jak budoucnost. Než se spolehnete na jakékoliv chatboty (včetně těch “ověřených”, jako je třeba ChatGPT nebo Gemini), zkontrolujte si fakta z důvěryhodných zdrojů – informace o AI nástrojích například na našem portálu DIGIZÍN.
V aktuální „AI evoluci“ je přesnost informací stejně důležitá jako samotná inovace. A DeepSeek má v tomto směru vážně ještě co dohánět. Tak se budeme těšit, co nám následující týdny přinesou. Sledujte to společně s námi…