В Microsoft испугались собственной разработки генератора языка на основе ИИ
Категория
Технологии
Дата публикации

В Microsoft испугались собственной разработки генератора языка на основе ИИ

Microsoft
Источник:  arXiv.org

Разработчики генератора языка VALL-E 2 из Microsoft боятся выпускать собственное творение в массовый доступ из-за слишком совершенной генерации человеческого языка и возможных злоупотреблений.

Главные тезисы

  • Разработчики генератора языка VALL-E 2 из Microsoft опасаются возможных злоупотреблений из-за слишком высокого уровня совершенства в воспроизведении человеческого голоса.
  • Технология генератора VALL-E 2 превосходит предыдущие системы по надежности, естественности и сходству с дикторами, отмечаясь человеческим уровнем воспроизведения голосов.
  • Качество результатов VALL-E 2 зависит от качества речевых подсказок и факторов окружающей среды, что подчеркивает важность контроля над использованием этой технологии.
  • Microsoft пока не планирует делать VALL-E 2 доступным широкой публике из-за опасений по утечкам данных и возможным злоупотреблениям, однако намекает на практическое применение данной технологии в будущем.
  • Несмотря на ограничения по доступу, разработка искусственного интеллекта в области генерации языка от Microsoft отмечается как важный шаг в развитии синтеза текста в речь.

Почему у Microsoft испугались собственной разработки генератора человеческого языка

По словам разработчиков, VALL-E 2 убедительно воспроизводит человеческие голоса даже с помощью нескольких секундных аудиозаписей.

Разработчики заявляют, что их разработка достигла человеческого уровня воспроизведения голосов.

Генератор голоса с помощью ИИ достаточно убедителен, чтобы не отличить его от человеческого.

Microsoft научила ИИ полностью воспроизводить человеческий язык и голоса
Искусственный интеллект

По мнению разработчиков, это открывает множество возможностей для мошенников и других недобросовестных лиц.

VALL-E 2 – это последнее достижение в языковых моделях нейронных кодеков, знаменующее собой важную веху в синтезе текста в речи (TTS). [...] VALL-E 2 последовательно синтезирует высококачественную речь, даже для предложений, традиционно вызывающих трудности из-за своей сложности или повторяющихся фраз, - объясняют разработчики.

Мы уже видели примеры нейросетей, умеющих клонировать голоса на основе несколько секундной записи, но Microsoft говорит, что ее технология превосходит все, что до сих пор выходило на рынок.

Чем отличается новая технология Microsoft

Наши эксперименты, проведенные на наборах данных LibriSpeech и VCTK, показали, что VALL-E 2 превосходит предыдущие TTS-системы [...] по надежности, естественности и сходству с дикторами. Это первая в своем роде система, достигшая паритета с человеком по этим показателям, – цитирует издание заявления разработчиков.

Качество результатов VALL-E 2 зависит от длины и качества речевых подсказок, а также от факторов окружающей среды, таких как шум фона.

Однако в Microsoft отказываются выпускать VALL-E2 в широкий доступ.

VALL-E 2 – это чисто исследовательский проект. Мы не планируем включать VALL-E 2 в продукт или расширять доступ к нему для общественности. Это может нести потенциальные риски злоупотребления моделью, например, подделка голосовой идентификации или выдавание себя за конкретного говорящего, - объясняют разработчики.

Но они предполагают, что разработка искусственного интеллекта может отыскать практическое применение в дальнейшем.

Оставаясь на онлайне вы даете согласие на использование файлов cookies, которые помогают нам сделать ваше пребывание здесь более удобным.

Based on your browser and language settings, you might prefer the English version of our website. Would you like to switch?