Алгоритм у кімнаті для нарад: як ШІ змінює логіку ядерного стримування
Світ, у якому рішення про війну ухвалюються швидше, ніж людина встигає засумніватися, вже не виглядає фантастикою. Саме в такому контексті з’явилося дослідження британського професора стратегії Кеннета Пейна – у час, коли уряди одночасно нарощують інвестиції у військовий ШІ й сперечаються про межі його регулювання. У симуляційній кризовій грі моделі на кшталт GPT, Claude та Gemini виконували роль лідерів ядерних держав і в 95 відсотках сценаріїв переходили до ескалації – від демонстративних сигналів до тактичних ударів.
Але сенсація не в тому, що “машини хочуть війни”. Вона в іншому: алгоритми, позбавлені історичної пам’яті та морального табу, раціонально обирають ескалацію там, де правила гри винагороджують перемогу за будь-яку ціну. І це змушує дивитися не на свідомість моделей, а на те, як держави дедалі більше покладаються на машинну логіку у сфері, де ціна помилки вимірюється стратегічною стабільністю.
Класична теорія стримування, яку розвивали Томас Шеллінг і його сучасники, була грою про управління ризиком і сприйняттям. У логіці взаємного гарантованого знищення важливо не лише мати ракети, а переконати опонента, що ескалація не принесе виграшу і що у вас є контрольований спосіб зупинитися. Людські лідери працювали в полі страху, репутації, внутрішньої політики й історичної пам’яті. Саме тому в реальній історії сумнів іноді буквально рятував світ.
У вересні 1983 року радянський офіцер Станіслав Петров не прийняв сигнал системи раннього попередження за достовірний пуск і не запустив ланцюг рішення, що міг призвести до відповіді. У січні 1995 року російська система раннього попередження сприйняла норвезький науковий запуск як потенційну атаку, і процедури дійшли до активації “ядерної валізи”. Обидва випадки доводять, що стримування працює не лише через техніку, а через здатність людини затриматися.
Саме цю паузу і ставить під сумнів епоха алгоритмів.
Гонка швидкості як новий вимір стримування
Сучасна конкуренція між великими державами дедалі більше вимірюється не кількістю платформ, а темпом циклу “сприйняти – вирішити – діяти”. Національна оборонна стратегія США 2022 року називає Китай “pacing challenge” (“Виклик темпу”) і прив’язує ядерний вимір до ширшої технологічної конкуренції. Коли обидві сторони підозрюють, що суперник отримує перевагу через швидший аналіз і прийняття рішень, кожна має стимул скорочувати власний цикл. Саме тут ШІ дає найбільший приріст.
Пентагон у 2020 році закріпив п’ять принципів етичного застосування ШІ – Responsible, Equitable, Traceable, Reliable, Governable. У січні 2023 року оновлено директиву 3000.09 щодо автономії у системах озброєнь, яка встановлює вимоги до тестування та зменшення ризиків відмов у реалістичних умовах. Паралельно запущено програму Replicator, що передбачає розгортання тисяч автономних систем протягом 18–24 місяців. Це означає, що американський військовий ШІ виходить із лабораторій і стає елементом масштабної стратегії.
Європейський підхід інший за архітектурою, але не менш амбітний. Регламент ЄС 2024 року про ШІ виключає військову сферу зі своєї прямої дії, проте Європейський оборонний фонд на 2021–2027 роки має бюджет близько 7,3 млрд євро, з яких 2,7 млрд спрямовано на дослідження і 5,3 млрд на розвиток спроможностей.
НАТО з 2022 року керує Innovation Fund обсягом 1 млрд євро, інвестуючи у технології подвійного призначення. Китай, своєю чергою, ще у 2017 році в “New Generation Artificial Intelligence Development Plan” поставив ціль до 2030 року сформувати ядро індустрії ШІ на понад 150 млрд юанів і суміжні індустрії на понад 1 трлн юанів.
У короткій перспективі це означає пришвидшення аналізу й планування. У середній – ризик “гонки автоматизації”, якщо сторони не довірятимуть одна одній. У довгій – появу нового параметра репутації: не лише розмір арсеналу, а й керованість систем управління кризами.
Ринок, де алгоритм стає інфраструктурою
Економіка військового штучного інтелекту сьогодні крутиться не навколо “роботів на полі бою”, а навколо обчислювальної інфраструктури, даних і відповідності регуляторним вимогам. У липні минулого року Міноборони США оголосило про контракти до 200 млн доларів кожен для OpenAI, Google, Anthropic і xAI для масштабування advanced artificial intelligence для нацбезпеки. Окремо OpenAI отримала контракт на 200 млн доларів для розробки прототипів рішень до липня цього року.
Це означає, що держава купує штучний інтелект як інфраструктуру. Паралельно цивільні гіганти різко нарощують інвестиції у обчислювальні потужності. Alphabet, Amazon, Meta і Microsoft можуть цьогоріч інвестувати близько 650 млрд доларів у ШІ проти 410 млрд у минулому році. Оборона користується цією хвилею.
Окремий сегмент – тестування і валідація. Експерти оцінюють зростання ринку AI testing and validation на 806,7 млн доларів у 2024–2029 роках із середньорічним темпом 18,3 відсотка. На рівні стандартів з’явилися AI Risk Management Framework від Національного інституту стандартів і технологій США 2023 року та міжнародний стандарт ISO 42001:2023 для систем управління ШІ. У Європі набрав чинності AI Act.
Чим ближче ШІ до критичних рішень, тим більша частка бюджету йде не на сам “інтелект”, а на аудит, трасованість і відповідність. У середньостроковій перспективі це означає розшарування ринку: окремо моделі, окремо assurance і комплаєнс, окремо інтегратори для секретних мереж. Алгоритмічне моделювання дедалі більше виглядає як оборонний актив рівня супутників – не тому, що воно саме стріляє, атому, що визначає швидкість навчання і планування.
Дизайн гри як джерело ескалації
Симуляції на кшталт експерименту Пейна часто сприймаються як моральний тест моделей. Насправді це тест середовища. У підсилювальному навчанні функція винагороди визначає, що є “краще”. Якщо гра описана як zero-sum, де виграш одного автоматично означає програш іншого, а дедлайн обмежує горизонт, раціональна стратегія тяжіє до жорстких кроків. Скінченний горизонт і зворотна індукція зменшують простір для довгих траєкторій співпраці.
Дедлайни радикалізують поведінку, бо зростає цінність рішень із миттєвим ефектом. У реальному світі ж контури командування і контролю побудовані так, щоб сповільнювати дію через процедури аутентифікації і двоособові механізми. Саме тому важливо розрізняти симуляційну поведінку і реальні системи nuclear command, control and communications.
Ризик помилкової ескалації історично пов’язаний із крихкістю сигналу. 9 листопада 1979 року тестова стрічка з симуляцією нападу була помилково сприйнята системою NORAD як реальна атака. У червні 1980 року збої спричинила 46-центовa мікросхема. В умовах launch-on-warning на рішення може залишатися близько 10 хвилин. Прискорення аналітики штучним інтелектом не гарантує приросту правильності, але майже гарантовано скорочує час на людське осмислення.
Додатковий шар ризику додають кіберзагрози і data poisoning. Торік Національний інститут стандартів і технологій систематизував таксономію adversarial machine learning. Австралійський центр кібербезпеки зазначав, що кожна четверта організація стала жертвою отруєння даних. У кризі спотворений сигнал може виглядати переконливим.
Відповідальність без делегування
Політичний сенс тут простий: машина не може відповідати за рішення. Вона може прорахувати варіанти, показати ризики, видати прогноз, але відповідальність усе одно лежить на людях і державах. Саме тому в оновленій стратегії НАТО 2024 року йдеться про принципи відповідальності, підзвітності, пояснюваності та відстежуваності, щоб було зрозуміло, хто ухвалює рішення і як його можна перевірити.
США просувають свою Political Declaration про відповідальне військове використання AI, до неї вже приєдналися понад 50 держав. Це не договір із санкціями, а політична домовленість: рішення про застосування сили має залишатися за людиною. У березні 2024 року Генасамблея ООН ухвалила першу резолюцію щодо штучного інтелекту, закликавши до безпечних і надійних систем. А у вересні 2024 року на саміті REAIM у Сеулі близько 60 країн підтримали план дій щодо відповідального військового AI.
Це означає, що тема вже не технічна і не суто військова – вона стала політичною. Держави намагаються зафіксувати правило гри наперед: AI може допомагати, але не може підміняти собою політичне рішення. І чим більше оборонні системи залежать від приватних технологічних компаній, тим важливіше чітко визначити, хто відповідає за наслідки.
Культура табу і мова ескалації
Соціально-психологічний шар не менш важливий. Ніна Танненвальд у своїй праці “The Nuclear Taboo” пояснювала, що після 1945 року невикористання ядерної зброї стало культурною нормою, а не лише страхом відплати. Опитування YouGov у США в червні 2024 року показало, що 69 відсотків респондентів вважають перше застосування неприйнятним і лише 16 відсотків – прийнятним. У Британії лише 6 відсотків вважають перше застосування прийнятним. В Австралії торік дві третини опитаних підтримали ратифікацію Договору про заборону ядерної зброї.
Водночас глобальне опитування KPMG і University of Melbourne 2024–2025 років серед 48 тис. респондентів показало, що 58 відсотків не довіряють ШІ. Дослідженням зафіксовано розрив між експертами і громадськістю щодо користі і ризиків технології.
Коли ядерний сценарій дедалі частіше подається як опція у симуляції, він переходить із морального поля в поле менеджменту ризику. Дослідження Jacquelyn Schneider у журналі International Organization 2023 року показало, що спосіб моделювання кібер і ядерних загроз впливає на схильність учасників до ескалації. Мова змінює поріг сприйняття.
Швидкість як стратегічний ризик
Історія холодної війни доводить, що кожна технологія, що скорочує час між сигналом і рішенням, одночасно підсилює стримування і підвищує ризик помилки. BMEWS із 1960 року і супутникова програма DSP з початку 1970-х дали раннє попередження, але зробили стабільність залежною від точності сенсорів. Інцидент із підводним човном B-59 у жовтні 1962 року, коли Василь Архипов заблокував застосування ядерної торпеди, нагадує, що іноді пауза важливіша за швидкість.
Алгоритми не змінюють цієї логіки, а лише стискають її в часі. Якщо ШІ працює як додатковий канал перевірки, ризик може зменшитися. Якщо ж він скорочує дискусію до хвилин і підміняє сумнів впевненістю, ризик стає структурним.
Холодна війна вижила не тому, що сторони були добрими, а тому, що гра тривала довго. Репутація мала значення, наступний раунд завжди був попереду. Це була повторювана стратегічна взаємодія, а не одноразова дилема. У короткій грі часом буває раціонально зрадити, а у довгій вигідніше не зривати правила.
Небезпека в тому, що системи, натреновані на короткий горизонт і жорстку функцію винагороди, мислять одноразовими раундами. І якщо прийняття рішень почне жити в цій логіці, стримування перетвориться з гри про передбачуваність на гру про швидкість.
У ядерному світі вирішує не той, хто швидший, а той, хто здатен зберегти контроль над темпом, коли система показує червоний сигнал.
Тетяна Вікторова




