ЕС и мир

Microsoft обнаружила снижение надежности ChatGPT и Gemini в долгих диалогах

Чат-боты на основе искусственного интеллекта демонстрируют меньшую надежность и чаще ошибаются во время длительных разговоров. Об этом свидетельствуют результаты совместного исследования Microsoft Research и Salesforce, обнародованные Windows Central.

В рамках исследования было проанализировано более 200 тысяч диалогов с современными языковыми моделями, в том числе GPT-4, Gemini, Claude и DeepSeek.

По результатам анализа, при выполнении единичного запроса модели показывают успеваемость на уровне 90%. В то же время, в многоэтапных диалогах этот показатель снижается до 65%.

Несмотря на то, что общая функциональность моделей сокращается примерно на 15%, уровень их ненадежности возрастает на 112%. Даже модели с расширенными возможностями для дополнительного мышления, такие как o3 и DeepSeek R1, также сталкиваются с подобными трудностями.

Исследователи назвали несколько причин снижения качества ответов:

  1. Предварительная генерация ‒ модели пытаются сформулировать ответ еще до завершения пользователем объяснения задачи.

2. Эффект «фундамента» ‒ система опирается на первый ответ как базу для дальнейших, даже если она содержала ошибки.

3. Расширение ответов – в длинных диалогах объем текста растет на 20–300%, что увеличивает количество предположений и так называемых галлюцинаций, которые впоследствии закрепляются как часть контекста.

В то же время технологии искусственного интеллекта все более активно влияют на сферу безопасности и глобальную политику.

Ранее сообщалось, что Пентагон призывает разработчиков создавать системы ИИ без «нравственных ограничений», чтобы не потерять позиции в технологическом соперничестве.

Также обостряется конкуренция между США и Китаем в сфере развития нейросетей. Обе страны не поддержали международную декларацию по ответственному применению ИИ в военной отрасли.

Отдельное внимание уделяется и практическому использованию технологий, в частности в военных конфликтах. В частности, Пентагон анализирует украинский опыт применения дронов с поддержкой искусственного интеллекта на поле боя.

ПОСМОТРИТЕ ЕЩЕ:  OpenAI позволит взрослым пользователям применять ChatGPT для эротических сценариев

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Похожие статьи

Вернуться к началу