Експертна думка

ШІ під впливом пропаганди: дослідники попереджають про нову форму інформаційної зброї Росії

За останні роки штучний інтелект став важливою складовою інформаційного простору, і разом з цим з’явилися нові ризики, пов’язані з його використанням у політичних та пропагандистських цілях. Зокрема, поширення автоматизованих систем, які генерують відповіді на запитання користувачів, створює можливість для втручання у процес формування громадської думки. На це звернули увагу британські аналітики з Інституту стратегічного діалогу, які виявили, що популярні чат-боти у своїх відповідях часто використовують матеріали російських державних медіа, включених до санкційних списків ЄС. Це дослідження окреслює проблему, яка стосується не лише технологій, а й інформаційної безпеки — як у Європі, так і в Україні.

Що встановили дослідники ISD і чому це важливо

Висновки британського аналітичного центру Інститут стратегічного діалогу свідчать про те, що в світі виникла нова інформаційна загроза з боку РФ – маніпуляції штучним інтелектом.

Перевіряючи відповіді чотирьох поширених чат-ботів п’ятьма європейськими мовами на теми, пов’язані з російською агресією проти України, аналітики, зафіксували значний масив матеріалів, у яких боти прямо або опосередковано покладалися на російські державні джерела, причому значна частина таких майданчиків перебуває під санкціями в Європейському Союзі.

Додатково з’ясувалося, що питання, сформульовані з наперед заданою прихильністю до російського погляду, підвищували ймовірність появи таких посилань у відповідях, а запити про мобілізацію, внутрішньоукраїнську повістку чи ставлення до НАТО особливо часто «підтягували» саме ці джерела.

Дослідники також відзначили, що чат-боти регулярно не розпізнають державну афілійованість контенту, якщо він перенадруковується агрегаторами, мовними дзеркалами або сайтами-посередниками, через що спрацьовує механізм контентного «відмивання», який пом’якшує видиму токсичність первинного джерела.

Як працює уразливість: технічна та мовна складові

На думку експертів, помилки не зводяться до «лінощів» алгоритмів, адже моделі залежні від навчальних корпусів, процедур налаштування безпеки та механізмів отримання довідкової інформації. Через це зміна формулювань у запиті або перемикання мови здатні обійти фільтри, які були розраховані на інші патерни поведінки користувачів.

ПОДИВІТЬСЯ ЩЕ:  Як діяти під час вибуху: пояснюють інструктор з домедичної допомоги, фахівці МВС та МОЗ

До цього додається проблема багатомовності, оскільки контроль якості для англійської зазвичай суворіший, ніж для іспанської, французької, німецької чи італійської, а також брак стабільних маркерів державної афілійованості в текстах, що з’являються на дзеркалах або в републікаціях.

Розробники зіштовхуються з дилемою: надто жорсткі блокування породжують ризики помилкових спрацьовувань і скарги на цензуру, тоді як м’які обмеження дозволяють підсанкційним пропагандистським структурам постачати «очищений» контент, який ховається за фасадами сторонніх сайтів.

Регуляторний контекст у Європі і наявні орієнтири для платформ

Як зазначать експерти, Європейський Союз ще 2022 року обмежив діяльність низки російських державних ЗМІ на території Співтовариства, що потягло за собою деіндексацію і видиме зниження присутності RT та Sputnik у сервісах пошуку й відеоплатформах. Пізніше правила про цифрові послуги зобов’язали великі онлайн-платформи системно зменшувати ризики, пов’язані з дезінформацією, прозорістю рекомендацій і доступом дослідників до даних.

Ці норми стосувалися передусім соціальних мереж і пошуку, проте їхня логіка — маркування державної афілійованості, пріоритизація достовірних джерел і підзвітність щодо модерації — природним чином поширюється і на діалогові системи. Фахівці це пояснюють тим, що користувачі схильні наділяти відповіді чат-ботів більшою довірою, ніж звичайні посилання в стрічці пошуку, а отже наслідки похибок тут відчутніші.

Після початку повномасштабного вторгнення Європейський Союз офіційно обмежив мовлення і монетизацію низки російських державних майданчиків, а великі платформи заявили про зниження їхньої видимості в пошуку та рекомендаціях. Проте численні «дзеркала» й мережі сайтів-ретрансляторів забезпечили обхід цих рішень, що зумовило хвилі блокувань та видалень у 2022–2024 роках.

Міжнародні дослідницькі групи регулярно описували операції з поширення підроблених новин і симуляцій «місцевих» медіа, які повторювали прокремлівські меседжі різними мовами, а технологічні компанії повідомляли про спроби використання генеративних інструментів для прискорення виробництва таких матеріалів і маскування їхнього походження. Це пояснює, чому чат-боти, зустрічаючи подібні тексти в інтернеті, іноді оцінюють їх як нейтральні й придатні для цитування.

Експерти наголошують, що додатково уряди окремих країн неодноразово вказували на потребу прозорішого маркування медіа з державною афілійованістю та оперативного оновлення переліків підсанкційних ресурсів, оскільки назви, домени та візуальні атрибути таких майданчиків постійно змінюються, що ускладнює автоматичне розпізнавання.

Чому сама архітектура діалогових систем ускладнює фільтрацію

На думку дослідників, сучасні моделі поєднують статистичні закономірності з процедурами керування відповідями, через що одні й ті самі знання можуть виглядати безпечними у загальних формулюваннях і проблемними у конкретизованих сюжетах. До того додається те, що системи, які намагаються бути корисними, звично наводять приклади й джерела, а отже неправильна оцінка походження матеріалу в довідковій базі призводить до виведення небажаних посилань.

ПОДИВІТЬСЯ ЩЕ:  Неадекватне оподаткування гемблінгу позбавило бюджет мільярдів гривень: Вікторія Закревська

Важливим чинником виступає імовірнісний характер відповіді: якщо користувач стимулює модель підбіркою підказок, що підштовхують до певної рамки, то механізми безпеки мають бути достатньо стійкими, аби не поступитися тиску наративу, який виглядає послідовним, проте підживлюється неприйнятними джерелами.

Що варто робити розробникам: практична програма мінімізації шкоди

Компаніям, які розгортають чат-боти, експерти рекомендують синхронізувати списки заборонених і підсанкційних доменів з офіційними реєстрами та громадськими базами, налаштовуючи автоматичне оновлення і багатомовні відповідники назв.

Крім того, у відповідях, що стосуються війни, фахівці радять обмежити цитування анонімних і непрозорих сайтів, віддаючи пріоритет відомим міжнародним і національним установам, прес-релізам урядів-партнерів та перевіреним дослідницьким центрам. При цьому важливо інвестувати у багатомовні «ред-тимінг» сценарії, які імітують маніпулятивні підказки, а також у системи маркування походження контенту і прозорі журнали посилань, де користувач зможе побачити, чому модель спиралася саме на ці джерела, і подати обґрунтоване зауваження, якщо побачить порушення.

На думку аналітиків, державні органи можуть забезпечити відкриті інтерфейси доступу до актуальних санкційних списків і переліків афілійованих медіа з урахуванням мовних дзеркал, а також підтримати програми незалежного аудиту моделей, які матимуть доступ до методологій відбору джерел і тестових вибірок. Водночас громадський сектор і медіаосвітні ініціативи здатні розробляти довідники з типових ознак маніпулятивних матеріалів, які застосовуються саме в діалогових інтерфейсах, де користувач схильний приймати відповідь як персональну консультацію, а не як один з багатьох результатів пошуку.

Редакції, що працюють з міжнародними читачами, можуть пропонувати короткі багатомовні зведення з перевірених джерел, аби зменшити спокусу у користувачів звертатися до сумнівних сайтів за браком зрозумілої інформації їхньою мовою.

Як зазначають експерти, запит, який стосується конфліктів, санкцій або військових злочинів, варто формулювати з вимогою вказати незалежні джерела та первинні документи. Після чого слід перевіряти, кому належать згадані сайти і чи не є вони ретрансляторами; корисно зіставляти відповіді різними мовами, оскільки невідповідності нерідко виявляють схеми локалізованих маніпуляцій, а також використовувати кілька непов’язаних один з одним довідкових ресурсів, щоби підвищити шанси на отримання коректної картини.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *

Схожі статті

Кнопка "Повернутися до початку