Искусственный интеллект в аудио. Новейшая технология.

AI уже лет пять активно используется в фотографии.

Традиционные фильтры без AI работают сразу по всему объекту. Искусственный интеллект может различать множественные детали объектов, и применять к ним различные алгоритмы обработки.

Пример работы алгоритма. AI определяет объекты. Например это женщина. Далее она разделяет объект на лицо, губы, глаза, ресницы и т.д.

Вплоть до самых мелких деталей. AI применяет для каждого фрагмента (детали) объекта свою обработку.

Если требуется сделать лицо красивее, основным из критериев будет симметричность всего.

Создание и набор параметров красоты в ручную потребует огромного количества трудозатрат. Задача находится на уровне невозможности.

На несколько тысяч порядков проще «скормить» нейросети млн. фото женщин, и AI сам станет понимать, что является красивым, а что нет.

Можно ставить абсолютно любые задачи.

Например, если «скормить» нейросети прохождение техпроцесса варки стали за десятки лет… AI с высокой точностью может задавать режимы техпроцесса. Лучше любого технолога с многолетним стажем.

При этом AI никогда не учился институте, и даже понятия не имеет, что такое сталь. Ему это для получения результата не нужно.

В вот 2023 году искусственный интеллект стал обрабатывать аудио.

Adobe Enhance Speech – нейросеть для автоматического улучшения записи голоса.

Более точно, — исключение из сигнала переотражений звука и интершумов.

Бесплатное решение для радикального улучшения звуковых файлов. Для блогеров и продакшен компаний.

Нет смысла описывать словами результат работы AI.

Лучше сами смотрите и слушайте.

Первое видео больше для профессиональной аудитории:

Судя по всему это только начало.

При желании, экспериментируйте сами — Adobe Enhance Speech – нейросеть.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Комментарии: 1

Денис Н. 24.01.2023 в 00:14
Надеялся, что удастся почистить от шумов записи судебных заседаний. Но похоже, этот сервис чистит шумы на основе распознавания речи (но не целых слов, а их частей) и с распознаванием русского пока проблемы. Особенно, в тихих местах записи. В таких местах речь звучит, как от иностранца, который знает по-русски мало слов, но делает вид, что умеет бегло говорить.
Я уверен, что очень скоро этот сервис очень улучшится.
Нет ли подобного сервиса у Яндекса?
Войдите, чтобы ответить

Добавить комментарий

Для отправки комментария вам необходимо авторизоваться.

Искусственный интеллект в аудио. Новейшая технология.

Спасибо!

Теперь редакторы в курсе.