Компанії не відмовляються від ШІ, але більше не готові оплачувати його як безлімітний офісний бонус
Корпоративний ШІ починався як обіцянка безкоштовного прискорення для всіх, а закінчується тим, що працівникам доводиться пояснювати, чому саме їхній запит до моделі вартий грошей.
Business Insider описав цю зміну як нові офісні “голодні ігри” за токени: ще недавно компанії заохочували працівників користуватися нейромережами майже в кожному завданні, а тепер вводять стелі витрат, прибирають внутрішні рейтинги “активних користувачів” і змушують команди доводити, навіщо їм доступ до потужніших моделей.
У матеріалі згадуються Pylon, Coinbase, Amazon та інші компанії, які переглядають підхід до витрат на ШІ, бо з модного показника активності токени перетворилися на цілком реальний бюджетний рядок.
Безлімітний ШІ закінчився там, де почалися реальні рахунки
Це не історія про те, що бізнес розчарувався в ШІ. Навпаки, рахунок став болючим саме тому, що інструменти почали використовувати масово. Amazon, Walmart, Cisco, Uber і Meta вже обмежують або переосмислюють використання інструментів ШІ, бо витрати почали рости швидше, ніж очікували фінансові директори.
Uber запровадив місячний ліміт у $1 500 на користувача після того, як компанія надто швидко вичерпала бюджет на ШІ. У тій самій логіці Walmart, Cisco та інші великі гравці почали відмовлятися від марнотратного використання, переводити частину задач на дешевші моделі й будувати внутрішні системи маршрутизації запитів.
У цій новій економіці головною одиницею стає токен – фрагмент тексту, який модель отримує на вході або генерує у відповіді. Токен може бути частиною слова, цілим словом або символом, а приблизно 100 токенів англійською відповідають 75 словам. На папері це звучить майже непомітно. На практиці короткий запит до чатбота, аналіз великого контракту, пошук помилки в коді, юридична довідка й багатокрокова сесія агента – це вже різні за ціною обчислювальні операції. Компанія платить не за магію “штучного інтелекту взагалі”, а за обсяг тексту, коду, документів і дій, які проходять через модель.
Особливо швидко витрати ростуть там, де ШІ перестає бути співрозмовником і стає виконавцем. Звичайний чат відповідає на запит. Агент може читати файли, викликати інструменти, переписувати код, запускати перевірку, отримувати помилку, знову переписувати код і повторювати це багато разів.
Нещодавнє дослідження про агентне програмування показало, що такі задачі можуть споживати у 1000 разів більше токенів, ніж короткий діалог про код; при цьому витрати можуть сильно коливатися між запусками однієї й тієї самої задачі, а більша кількість токенів не гарантує кращого результату.
Саме тому GitHub із 1 червня перевів Copilot на оплату за фактичне використання через GitHub AI Credits: кредити витрачаються залежно від вхідних, вихідних і кешованих токенів. Це важливий сигнал для всього ринку. Навіть продукт, який довго продавався як зручний помічник для розробників, тепер тарифікується не просто за місце в команді, а за реальне споживання машинного інтелекту.
У подібній же логіці працює Microsoft Copilot Studio: пакет на 25 000 Copilot Credits коштує $200 на місяць, а складні дії агентів і моделі глибшого міркування мають окрему тарифікацію. Підписка дедалі частіше стає не повною ціною ШІ, а лише входом у систему, де справжній рахунок залежить від того, що саме працівники роблять усередині.
Не кожен запит створює вартість
Перша хвиля корпоративного ШІ була про впровадження. Хто вже користується? Скільки працівників відкрили Copilot, ChatGPT або Claude? Скільки команд запустили пілоти? Скільки запитів зробили інженери? Друга хвиля буде набагато менш святковою: чи справді все це окупається.
Сам факт активного використання більше нічого не доводить. Працівники можуть генерувати десятки чернеток, просити підсумки зустрічей, переписувати листи, тестувати код і робити вигляд, що продуктивність зросла. Але якщо після цього процес не став дешевшим, продаж не став вищим, помилок не стало менше, а рішення не ухвалюються швидше, компанія отримала не трансформацію, а гарний шар над старою рутиною.
Дані показують не провал ШІ, а його дуже нерівномірну користь. Національне бюро економічних досліджень США вивчило 5179 агентів клієнтської підтримки й виявило, що доступ до генеративного помічника підвищив продуктивність у середньому на 14%, а для новачків і менш досвідчених працівників – на 34%.
Для найсильніших і найдосвідченіших працівників ефект був мінімальним. Це ключ до розуміння окупності: ШІ найкраще працює там, де він стандартизує повторювану експертизу, скорочує час навчання й підтягує слабших працівників ближче до рівня сильніших.
Дослідження Harvard Business School і Boston Consulting Group додало важливе застереження. У межах задач, які модель добре “бачить”, консультанти з доступом до GPT-4 виконували на 12,2% більше завдань і працювали на 25,1% швидше. Але за межами можливостей моделі результат міг погіршуватися: у складній управлінській задачі користувачі ШІ були на 19% менш схильні дати правильне рішення, ніж контрольна група без нього.
Тобто одна й та сама технологія може пришвидшити типову аналітичну роботу й одночасно підштовхнути до хибної впевненості там, де потрібні контекст, судження і перевірка припущень.
На рівні компаній цей розрив між використанням і результатом видно ще краще. McKinsey у State of AI 2025 пише, що 88% організацій регулярно використовують ШІ хоча б в одній бізнес-функції, але лише 39% бачать вплив на прибуток до сплати відсотків і податків на рівні всієї компанії. Іншими словами, інструмент уже є майже всюди, але фінансовий ефект поки що з’являється лише там, де компанії змінюють процеси, а не просто додають модель поверх старої роботи.
Звідси й різкий тон звіту MIT NANDA про GenAI Divide. Автори оцінюють корпоративні інвестиції в генеративний ШІ у $30–40 млрд і стверджують, що лише 5% інтегрованих пілотів приносять мільйони доларів вимірюваної вартості, тоді як більшість не має помітного ефекту на фінансовий результат. Причина не в тому, що моделі “погані”. Частіше проблема в крихких робочих процесах, поганій інтеграції й нездатності систем навчатися на контексті конкретної організації.
Це не скасовує сильних кейсів. У великому польовому експерименті в онлайн-ритейлі, проведеному у 2023–2024 роках, генеративний ШІ інтегрували в 7 клієнтських робочих процесів – від сервісу до реклами, підбору товарів і підтримки продавців. В одних сценаріях ефект був нульовим, в інших продажі зростали до 16,3%, переважно через вищу конверсію. Саме так виглядає реальна окупність: не більше текстів, не більше “активності”, а нижча вартість операції або краща поведінка клієнта.
Тому компанії не відмовлятимуться від ШІ. Вони відмовлятимуться від декоративного ШІ. Від автоматичних підсумків заради них самих. Від дорогих моделей для дрібних задач. Від агентів, які бігають колами без чіткого критерію завершення. Від чернеток, які ніхто не використовує. Бізнес поступово переходить від питання “чи ми користуємося ШІ?” до питання “який процес став дешевшим, швидшим або якіснішим?”.
…Наступного разу ми розглянемо, як токени змінюють не лише бюджети компаній, а й саму офісну ієрархію. Бо коли бізнес починає рахувати запити до моделей, він рахує не тільки гроші – він вирішує, хто отримає доступ до найсильнішого інструмента продуктивності, а хто працюватиме з дешевшою версією й вимогою “бути ефективнішим”.
Це вже не технічна деталь, а нова політика праці: кому дадуть автономного агента, кому – базовий чат, хто зможе довести цінність свого AI-бюджету, а хто залишиться покупцем чужого інтелекту через підписку. І саме тут офісна історія про ліміти на токени переходить у більшу тему – хто контролює інфраструктуру машинного інтелекту, той контролює швидкість, вартість і майбутню конкурентоспроможність.
Тетяна Вікторова




