В Україні представили першу національну ШІ-модель Lapa LLM
На конференції IT Arena 2025 українські науковці представили Lapa LLM — першу велику мовну модель штучного інтелекту, створену спеціально для роботи з українською мовою та контекстом.
Презентацію моделі провів аспірант Українського католицького університету та спеціаліст з даних компанії Nortal Юрій Панів. Він зазначив, що Lapa LLM покликана розв’язувати критичні проблеми, які залишаються поза увагою глобальних відкритих LLM-моделей, особливо в питаннях національної безпеки, культури та мовної точності. Модель розробляється з урахуванням потреб національної безпеки та конфіденційності, щоб працювати з чутливими даними в оборонному секторі та великих компаніях без залучення хмарних провайдерів.
Lapa LLM орієнтована на культурну узгодженість, навчаючись з фокусом на українських цінностях і контексті, із застосуванням автоматичної фільтрації даних для запобігання російській пропаганді, дезінформації та «галюцинацій» щодо знань про Україну. Окрім цього, проєкт спрямований на підвищення продуктивності для української мови, що залишається проблемою багатьох відкритих LLM.
Базою для Lapa LLM стала модель Gemma від Google на 12 мільярдів параметрів, що забезпечує оптимальний баланс між продуктивністю та ресурсними вимогами. Серед технічних новацій розробників — український токенізатор, який дозволяє скоротити кількість токенів на 50% при обробці українського тексту. Випуск моделі разом з навчальними скриптами та наборами даних запланований на початок жовтня, причому команда планує опублікувати Lapa LLM під відкритою ліцензією MIT.




