Створення національного штучного інтелекту LLM: технологічна інвестиція чи сумнівне рішення

Міністерство цифрової трансформації спільно з мобільним гігантом країни “Київстар” взялися за масштабну справу створення першої в Україні великої мовної моделі (LLM). Йдеться не про державний проєкт, який на думку чиновників, має стати корисним для вирішення локальних потреб. На перший погляд ця ініціатива зі створення власного штучного інтелекту здається цілком корисною та актуальною у вирі подій сучасного світу. Однак дивує той факт, що у країні, в якій йде тривала війна, а бюджет ледь зводить кінці з кінцями, держава несподівано береться за створення свого штучного інтелекту. І саме тут починається найцікавіше. Разом з оголошенням про запуск національної мовної моделі на поверхню спливають певні суперечливі моменти.
Майбутнє ШІ в Україні: від ідеї до державного проєкту
В Україні планується запуск першої великої мовної моделі (LLM), яка позиціонується як загальнонаціональний проєкт. Йдеться не про ініціативу приватного бізнесу чи академічного кола, а спробу держави створити інструмент штучного інтелекту, який функціонуватиме на основі української мови. Ключовою особливістю ініціативи є масштабний корпус даних, який планують залучити для навчання моделі: у нього мають увійти різноманітні джерела — від літературних текстів, перекладених або створених українською, до офіційних нормативно-правових актів, адміністративних документів, новинного контенту й матеріалів зі сфери освіти. Участь держави в реалізації такого проєкту, за задумом ініціаторів, дозволить не лише створити технічно повноцінну модель, а й закласти її національну мовну й змістову специфіку, з орієнтацією на українське суспільство, законодавство й інформаційне середовище.
Цей проєкт не має аналогів у країні, а його реалізацію взялися тягнути Мінцифра та “Київстар”. І ось ми маємо гучну ініціативу, за фасадом техно-оптимізму якої криються як великі сподівання, так і справедливі сумніви. Ідея, на перший погляд, є цілком логічною. Світ рухається в бік суверенних ШІ-рішень, і Україна, яка переживає технологічний ривок на тлі війни, не хоче залишатися осторонь. Мовні моделі вже працюють на держсектор в Албанії, Болгарії, Швеції, Франції. Тож власна LLM для українського контексту вже є питанням не стільки іміджу, скільки реальної технологічної незалежності.
Мета полягає в тому, щоб адаптувати відкриту модель, навчивши її на великому масиві українськомовних текстів. Замість повного навчання з нуля обрали більш практичний підхід fine-tuning (процес донавчання вже існуючої моделі штучного інтелекту на нових, специфічних даних, аби адаптувати її до конкретного завдання, мови або контексту – ред.), адже в України бракує необхідних обчислювальних ресурсів. Водночас навіть цей спрощений варіант вимагає чималих коштів, наявності якісної інфраструктури, значних людських зусиль, ретельного етичного нагляду та уважного підбору даних.
Взагалі урядові амбіції щодо штучного інтелекту в Україні вражають, адже за словами прем’єр – міністра Дениса Шмигаля, країна до 2030 року хоче увійти в світову трійку лідерів за рівнем впровадження ШІ-рішень. Це вже не просто гасла про “цифрову трансформацію” чи чергову інноваційну стратегію на папері. У планах державних діячів криється глибоке вшивання ШІ у систему державного управління: від освіти до медтеху, від агросектору до оборони, при цьому особливу ставку роблять на військовий напрямок. І мова не лише про дрони, які сьогодні стали буденністю фронту, а про цілі “рої” безпілотників, автономні системи ведення бою та аналітику, здатну читати поле бою в режимі реального часу. По суті, йдеться про створення цифрової армії, яка працює паралельно з фізичною.
Одночасно запускаються процеси в інших сферах: український EdTech намагається осучаснити шкільну освіту, MedTech розробляє біонічні протези для поранених, а в аграрному секторі штучний інтелект обіцяє “зцілити” розміновані поля і вивести агровиробництво на новий рівень переробки.
Однак обрана для реалізації компанія “Київстар” ніколи раніше не працювала з такими проєктами, тому її залучення викликає сумніви щодо реального технічного потенціалу. Планується сформувати три ради: координаційну, технічну й етичну. Мінцифра шукає корпуси українських текстів, які досі не були зібрані системно. “Київстар” відведена роль спонсора, який забезпечує команду, інфраструктуру й шукає на все це гроші. У проєкті навіть є чіткі терміни, адже першу версію нам обіцяють, як новонародженого малюка, уже за дев’ять місяців. При цьому слід зазначити, що Україна досі не запускала LLM такого рівня, а отже, немає перевірених рішень і шаблонів. “Київстар” важко сприймати в якості класичного гравця на ШІ-ринку, тому інтерес мобільного оператора до національного проєкту виглядає скоріше стратегічною інвестицією у власний бренд, а не лише жестом громадянської відповідальності.
Не менш неоднозначним є й те, що приватний бізнес береться фінансувати ініціативу, з якої найбільше виграє держава, а не комерційні клієнти. Все це відбувається на тлі доволі жорсткої реальності: більшість українців зосереджені не на перспективах штучного інтелекту, а на щоденних викликах — збереженні доходів, доступі до медицини, безпеці та елементарній стабільності. Тож за фасадом гучного анонсу про “український ШІ” насправді ховається непроста гра між амбіціями, інтересами, ризиками та великим запитанням про те, що буде в підсумку: прорив у майбутнє чи чергова складна схема з туманним результатом.
На папері все виглядає ідеально: інновації, екосистеми, прориви. Але під цією обкладинкою лишаються старі виклики. Ресурсна обмеженість, ризики безпеки, хаотична бюрократія, яка часто вбиває найкращі ініціативи ще до запуску. І, зрештою, залишається сумнів, чи перетворяться ці амбітні плани на реальні зміни, що відчують не лише в міністерських звітах, а й в реальному житті, скажімо, пацієнт в лікарні, вчитель в селі чи фермер після розмінування поля.
Український уряд зробив вибір на користь високих ставок, і штучний інтелект стає не доповненням до держуправління, а його ключовою опорою. Втім, для того, щоб це не перетворилось на дорогу, але порожню декорацію, потрібне не лише бажання “бути в трійці”, а щоденна робота над тим, щоб ШІ дійсно працював.
Ну і просто не можуть не турбувати технічні й правові виклики, пов’язані зі збором даних. Поки що держава не має чіткого механізму, як домовитися з авторами текстів, медіа чи науковими установами. Неясно також, як вирішуватимуть питання авторських прав та ліцензування відкритих моделей.
Оптимістичний сценарій справляє враження: мовна модель, яка здатна точно й чутливо обробляти українську з усіма її особливостями, відкриває шлях до використання її у судах, медичних закладах, освітній сфері та державних реєстрах. Вона повинна допомогти і громадянину, який подає документи в “Дії”, і чиновнику, що обробляє запити.
У кращому випадку така модель може стати двигуном нової хвилі українського ШІ-бізнесу, якого нині дуже бракує. Але варто визнати, що на практиці велика частина суспільства досі не має рівного доступу до базових цифрових сервісів, а сам цифровий розрив між селом і містом, між освіченим користувачем і цифровим аутсайдером залишається значним. Якщо держава не подбає про доступність та застосування моделі поза межами держорганів і ІТ-компаній, проєкт ризикує стати ще одним красивим, але відірваним від життя інструментом.
Національний ШІ за кордоном: уроки для України
Оскільки для України подібний процес є зовсім новим полем, тож цілком доречно звернути увагу на досвід зарубіжних країн щодо створення національного штучного інтелекту, який демонструє, що цей процес спирається на масштабну комплексну ініціативу, що торкається культури, економіки та безпеки країни.
Болгарія та Греція, наприклад, розробляють власні мовні моделі BgGPT та Meltemi, які вже успішно використовують у шкільній освіті. Ці системи не лише допомагають генерувати завдання й пояснювати складні теми, а й демонструють ефективність на рівні державних іспитів, іноді випереджаючи популярні світові аналоги. Це яскравий приклад того, як локалізований ШІ здатен глибше розуміти мову та контекст, що особливо важливо для освіти.
Швеція створює GPT-SW3 з метою автоматизації текстової роботи в держсекторі, аби компенсувати дефіцит робочої сили через старіння населення. Тут штучний інтелект стає інструментом підтримки суспільних процесів, що має не лише економічний, а й соціальний ефект.
Албанія впровадила віртуального асистента для спрощення подання заявок на державні послуги, а в планах є створення національної моделі для перекладу юридичних документів у рамках підготовки до вступу в ЄС. Це приклад того, як ШІ сприяє інтеграції країни в міжнародні структури і підвищує ефективність державного управління.
Інші країни також рухаються у напрямку створення суверенних ШІ-систем, які враховують локальні мови, культурні особливості та економічні виклики. Ці проєкти часто підтримуються державною політикою, інвестиціями у науку та інфраструктуру, а також об’єднують експертів із різних галузей — від лінгвістів і програмістів до етичних консультантів.
Такий підхід дає змогу не лише зменшити залежність від іноземних технологій, але й створити ШІ, який справді розуміє національний контекст, допомагає у важливих сферах життя. Цей досвід показує, що національний ШІ варто сприймати не просто як технологію, а як стратегічний ресурс, який може стати драйвером розвитку країни.
Як бачимо, проєкт створення національної великої мовної моделі в Україні є не просто технологічною ініціативою, а складною, багатовимірною історією, яка розгортається на тлі реальних викликів і суперечностей. З одного боку, ми маємо амбіції держави, яка прагне не відстати у глобальній гонці штучного інтелекту, і прагматична потреба у власних рішеннях, адаптованих до української мови та контексту. З іншого — обмежені ресурси, сумніви щодо вибору партнера, ризики пов’язані з даними та етичним контролем, а також суспільна нерівність у доступі до цифрових технологій.
За прогнозами аналітиків, масштаб української LLM буде відносно скромним, до 16 млрд параметрів, але це не мінус. Менші моделі з правильною архітектурою та навчанням здатні ефективно працювати в локалізованих сценаріях, витрачаючи менше ресурсів. Питання не в розмірі, а точності й доцільності. Критично важливо, аби модель не стала надто централізованою. Вона має бути справді відкритою, зручним інструментом і для викладача, і для лікаря, і для фермерського кооперативу.
Очевидно, що власний ШІ дає можливість посилити національну безпеку, модернізувати медицину, освіту, державне управління. Проте без системної роботи над інфраструктурою, нормативним полем і культурою використання технологій, цей проєкт ризикує залишитися дорогим експериментом, далеким від повсякденних потреб більшості людей. А сам досвід інших країн показує: національний штучний інтелект не варто сприймати як простий код і сервери, бо це довга, комплексна робота, яка зачіпає всю структуру суспільства.
Зараз Україна стоїть перед вибором: зробити цю технологію справжнім інструментом розвитку або повторити помилки минулого, коли амбіції залишались на папері, а реальні зміни не відчувалися. В реальності все вирішується не тільки ресурсами, а й тим, наскільки країна в сучасних умовах готова до відповідальності й відкритості, щоб штучний інтелект став дійсно українським, а не просто красивою обгорткою на фоні викликів сьогодення.