Истражувањето открива: Кои четботови со вештачка интелигенција најчесто „халуцинираат“ одговори

popara28 април, 20261min00
1310059_shutterstock-2244714585_m

Анализата на Legal Guardian Digital откри значајни разлики помеѓу популарните чет-ботови.

Големите јазични модели работат со анализа на шеми во јазикот и предвидување на следните зборови, наместо всушност да ги разбираат фактите. Проблемот се јавува кога нема доволно јасни податоци, па моделите „ги пополнуваат празнините“, што може да доведе до неточни одговори.

Google Gemini има највисока стапка на грешки, околу 32%, додека ChatGPT бележи околу 30%. Perplexity AI е најточна со околу 13% неточни одговори, додека DeepSeek и Grok имаат малку пониски стапки на грешки од околу 14–15%.

Кога станува збор за задоволството на корисниците, DeepSeek и ChatGPT го делат највисокиот резултат (4,7), додека Perplexity следи со 4,6. Генерално, Perplexity AI го зазема првото место, додека ChatGPT е на средината на листата, а Gemini и Meta AI се на дното.