Разработчики генератора языка VALL-E 2 из Microsoft боятся выпускать собственное творение в массовый доступ из-за слишком совершенной генерации человеческого языка и возможных злоупотреблений.
Главные тезисы
- Разработчики генератора языка VALL-E 2 из Microsoft опасаются возможных злоупотреблений из-за слишком высокого уровня совершенства в воспроизведении человеческого голоса.
- Технология генератора VALL-E 2 превосходит предыдущие системы по надежности, естественности и сходству с дикторами, отмечаясь человеческим уровнем воспроизведения голосов.
- Качество результатов VALL-E 2 зависит от качества речевых подсказок и факторов окружающей среды, что подчеркивает важность контроля над использованием этой технологии.
- Microsoft пока не планирует делать VALL-E 2 доступным широкой публике из-за опасений по утечкам данных и возможным злоупотреблениям, однако намекает на практическое применение данной технологии в будущем.
- Несмотря на ограничения по доступу, разработка искусственного интеллекта в области генерации языка от Microsoft отмечается как важный шаг в развитии синтеза текста в речь.
Почему у Microsoft испугались собственной разработки генератора человеческого языка
По словам разработчиков, VALL-E 2 убедительно воспроизводит человеческие голоса даже с помощью нескольких секундных аудиозаписей.
Разработчики заявляют, что их разработка достигла человеческого уровня воспроизведения голосов.
Генератор голоса с помощью ИИ достаточно убедителен, чтобы не отличить его от человеческого.

По мнению разработчиков, это открывает множество возможностей для мошенников и других недобросовестных лиц.
VALL-E 2 – это последнее достижение в языковых моделях нейронных кодеков, знаменующее собой важную веху в синтезе текста в речи (TTS). [...] VALL-E 2 последовательно синтезирует высококачественную речь, даже для предложений, традиционно вызывающих трудности из-за своей сложности или повторяющихся фраз, - объясняют разработчики.
Мы уже видели примеры нейросетей, умеющих клонировать голоса на основе несколько секундной записи, но Microsoft говорит, что ее технология превосходит все, что до сих пор выходило на рынок.
Чем отличается новая технология Microsoft
Наши эксперименты, проведенные на наборах данных LibriSpeech и VCTK, показали, что VALL-E 2 превосходит предыдущие TTS-системы [...] по надежности, естественности и сходству с дикторами. Это первая в своем роде система, достигшая паритета с человеком по этим показателям, – цитирует издание заявления разработчиков.
Качество результатов VALL-E 2 зависит от длины и качества речевых подсказок, а также от факторов окружающей среды, таких как шум фона.
Однако в Microsoft отказываются выпускать VALL-E2 в широкий доступ.
VALL-E 2 – это чисто исследовательский проект. Мы не планируем включать VALL-E 2 в продукт или расширять доступ к нему для общественности. Это может нести потенциальные риски злоупотребления моделью, например, подделка голосовой идентификации или выдавание себя за конкретного говорящего, - объясняют разработчики.
Но они предполагают, что разработка искусственного интеллекта может отыскать практическое применение в дальнейшем.
Больше по теме
- Категория
- Технологии
- Дата публикации
- Додати до обраного
- Категория
- Технологии
- Дата публикации
- Додати до обраного
- Категория
- Украина
- Дата публикации
- Додати до обраного