Google створив модель ШІ для спілкування з дельфінами

Google створив штучний інтелект для розшифрування мови дельфінів. Модель під назвою DolphinGemma вже влітку цього року буде випробувана в реальних умовах. Її головна мета — допомогти науковцям краще зрозуміти складну вокалізацію морських ссавців і визначити, чи має вона риси, схожі на людську мову. Про це повідомляє Popular Science.
Дельфіни давно вважаються одними з найінтелектуальніших тварин на планеті. Вони виявляють здатність до навчання, співпраці, впізнають себе в дзеркалі та демонструють складну соціальну поведінку. Їхня мова — це система різноманітних звуків, включно зі свистами, клацаннями та навіть звуками, схожими на “крякання”, — залишалась до сьогодні майже нерозгаданою.
Основне завдання дослідників — зрозуміти, як саме дельфіни використовують звуки у соціальних взаємодіях. Частину вокалізацій вже вдалося пов’язати з конкретною поведінкою. Наприклад, дельфіни видають індивідуальні “іменні” свисти для впізнавання один одного, а звуки, які вчені описують як “крякання”, зазвичай супроводжують конфліктні ситуації. Однак, щоб з’ясувати, чи їхня комунікація дійсно має характеристики мови, потрібен глибший аналіз.
У цьому контексті на допомогу приходить DolphinGemma — модель, побудована на базі відкритих AI-моделей Google Gemma, які використовують ту ж архітектуру, що й комерційні моделі Gemini. DolphinGemma застосовує технологію SoundStream, яка дає змогу перетворювати звуки дельфінів у формат, придатний для обробки штучним інтелектом. Модель аналізує звукові повідомлення дельфінів і передбачає наступний “токен” — акустичну одиницю, яка може мати значення у їхньому спілкуванні. Її робота нагадує принцип функціонування LLM, які генерують текст у відповідь на запит.
Очікується, що DolphinGemma допоможе ідентифікувати складні звукові патерни, які можуть стати основою для створення умовного “словника” спілкування між людьми й дельфінами. У Google зазначають, що без залучення ШІ такий аналіз зайняв би десятиліття.
Ще одна перевага DolphinGemma — її оптимізація для роботи на смартфонах Pixel. Уже кілька років команда WDP використовує у польових умовах пристрій CHAT (Cetacean Hearing Augmentation Telemetry), зібраний на базі Pixel 6. Ця система не лише записує дельфінячі звуки, а й дозволяє відтворювати синтетичні вокалізації — потенційні “слова”, що можуть сприяти встановленню контакту між дослідниками та дельфінами.