Благодаря новой функции chatgpt теперь «видит» и «слышит» в режиме реального времени

Компания OpenAI объявила о запуске новой функции для ChatGPT, значительно расширяющей возможности голосового режима. Новая опция, названная Advanced Voice, позволяет чат-боту работать с изображениями, видео и реагировать на голосовые команды в режиме реального времени.
Пользователи теперь смогут активировать камеру своего устройства и показывать объекты или события вокруг ChatGPT. Это открывает возможность задавать вопросы или получать пояснения на основе того, что бот «видит» в кадре.
В ходе презентации OpenAI продемонстрировала функционал новой опции. К примеру, на стол поставили набор для приготовления кофе, а ChatGPT пошагово объяснил процесс приготовления, предоставляя подробные инструкции. В ходе демонстрации бот также отвечал на уточняющие вопросы.
Еще одна интересная новинка – возможность делиться экраном устройства. ChatGPT теперь может анализировать информацию на экране и помогать конкретным задачам. К примеру, если пользователь откроет мессенджер, бот сможет предложить ответы на сообщения или помочь с редактированием текста.
Нововведение будет доступно для пользователей платных тарифных планов ChatGPT Plus и Pro на следующей неделе. Для бизнеса и образовательных учреждений функция станет доступна с начала 2025 года.
Расширение функций ChatGPT значительно повышает удобство его использования как для бытовых, так и для профессиональных задач. Способность бота реагировать на визуальную и голосовую информацию делает его более интерактивным и полезным в ситуациях, где важна быстрая реакция на контекст.