Искусственный интеллект в аудио. Новейшая технология.

AI уже лет пять активно используется в фотографии.

Традиционные фильтры без  AI работают сразу по всему объекту. Искусственный интеллект может различать множественные детали объектов, и применять к ним различные алгоритмы обработки.

Пример работы алгоритма. AI определяет объекты. Например это женщина.  Далее она разделяет объект на лицо, губы, глаза, ресницы и т.д.

Вплоть до самых мелких деталей. AI применяет для каждого фрагмента (детали) объекта свою обработку.

Если требуется сделать лицо красивее, основным из критериев будет симметричность всего.

Создание и набор параметров красоты в ручную потребует огромного количества трудозатрат.  Задача находится на уровне невозможности.

На несколько тысяч порядков проще «скормить» нейросети  млн. фото женщин, и AI сам станет понимать, что является красивым, а что нет.

Можно ставить абсолютно любые задачи.

Например, если «скормить» нейросети  прохождение техпроцесса варки стали за десятки лет…  AI с высокой точностью может задавать режимы техпроцесса. Лучше любого технолога с многолетним стажем.

При этом AI  никогда не учился институте, и даже понятия не имеет, что такое сталь. Ему это для получения результата не нужно.

Увеличение резкости и деталировки.

В вот 2023 году искусственный интеллект стал обрабатывать аудио.

Adobe Enhance Speech – нейросеть для автоматического улучшения записи голоса.

Более точно, — исключение из сигнала переотражений звука и интершумов.

Бесплатное решение для радикального улучшения звуковых файлов. Для блогеров и продакшен компаний.

Нет смысла описывать словами результат работы AI.

Лучше сами смотрите и слушайте.

Первое видео больше для профессиональной аудитории:

 

Судя по всему это только начало.

 

При желании, экспериментируйте сами — Adobe Enhance Speech – нейросеть.

 

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Рейтинг
( 2 оценки, среднее 5 из 5 )
AudioArt.ru
Комментарии: 1
  1. Денис Н.

    Надеялся, что удастся почистить от шумов записи судебных заседаний. Но похоже, этот сервис чистит шумы на основе распознавания речи (но не целых слов, а их частей) и с распознаванием русского пока проблемы. Особенно, в тихих местах записи. В таких местах речь звучит, как от иностранца, который знает по-русски мало слов, но делает вид, что умеет бегло говорить.
    Я уверен, что очень скоро этот сервис очень улучшится.
    Нет ли подобного сервиса у Яндекса?

Добавить комментарий

Спасибо!

Теперь редакторы в курсе.

© При использовании материалов AudioArt.ru обязательным условием является наличие открытой гиперссылки на исходную страницу