OpenAI запускає безплатний генератор зображень в ChatGPT

OpenAI запускає нову безплатну функцію створення зображень безпосередньо в ChatGPT на базі моделі GPT-4o, яка стане доступною для всіх користувачів найближчим часом.
Ліміт безплатного використання залишиться на рівні DALL-E, однак компанія не уточнила конкретну кількість генерацій, оскільки вона залежатиме від навантаження. За інформацією з FAQ ChatGPT, раніше безплатним користувачам дозволялося створювати три зображення на день за допомогою DALL-E 3. При цьому генерація через DALL-E залишиться доступною окремо через відповідний GPT.
Оскільки GPT-4o є омніомодальною моделлю, здатною працювати з текстом, зображенням, аудіо та відео, вона краще розпізнає складні запити, наприклад, коли потрібно зобразити кілька об’єктів на одному зображенні. Крім того, покращилася якість тексту, який система генерує безпосередньо на зображеннях.
Новий підхід ґрунтується на авторегресійній моделі — зображення створюється поступово, зліва направо і зверху вниз, подібно до написання тексту. Це відрізняє її від більшості інших моделей, зокрема DALL-E, які застосовують дифузійну техніку й генерують усе зображення одночасно. Хоча нова система працює повільніше, OpenAI вважає таку затримку виправданою.
У компанії підкреслюють, що система оснащена ефективними механізмами захисту від зловживань: блокується видалення водяних знаків, забороняється створення сексуальних підробок і відхиляються запити на генерування CSAM.
Зображення, створені новою системою OpenAI, не міститимуть візуальних водяних знаків чи спеціальних маркерів, які б прямо вказували на їхнє походження. Водночас усі файли матимуть стандартні метадані C2PA, які підтверджуватимуть їх створення за допомогою OpenAI.