Національну велику мовну модель “Сяйво” тренуватимуть на текстах Укрдержархіву
Національну велику мовну модель”Сяйво” тренуватимуть на текстах Укрдержархіву. Як повідомляє Міністерство цифрової трансформації, Державна архівна служба України передала 10 терабайтів даних для навчання національної LLM “Сяйво”, що має стати основою для розвитку державних цифрових сервісів і штучного інтелекту.
Йдеться про масштабний масив історичних матеріалів, державних документів і наукових текстів, який за обсягом прирівнюють приблизно до 70 тисяч книжок. У відомстві наголошують, що це перший випадок, коли Укрдержархів надає свої дані для тренування великої мовної моделі.
“Уявіть масив інформації, що дорівнює 70 тисячам книжок. Саме стільки – 10 терабайтів унікальних історичних матеріалів, державних документів та наукових текстів – Державна архівна служба України вперше передає для тренування національної мовної моделі “Сяйво”, – йдеться в повідомленні.
Також зазначається, що до кінця року обсяг цифрових копій державних архівів планують збільшити зі 150 млн до понад 200 млн одиниць, що є одним із найшвидших темпів оцифрування архівної спадщини у світі.
Навчання моделі охоплюватиме роботу з історичними джерелами, рукописами, законами, судовими рішеннями, медіаматеріалами та словниками. Наразі до ініціативи долучилися понад 50 партнерів Міністерства цифрової трансформації, серед яких медіа, університети та бібліотеки.
Як повідомлялося, раніше Міністерство цифрової трансформації України та компанія “Київстар” підписали меморандум про співпрацю щодо створення національної великої мовної моделі, яка стане основою для інтеграції ШІ в державний сектор, оборону та бізнес. Бета-тестування “Сяйва” заплановане на весну 2026 року.




