AI уже лет пять активно используется в фотографии.
Традиционные фильтры без AI работают сразу по всему объекту. Искусственный интеллект может различать множественные детали объектов, и применять к ним различные алгоритмы обработки.
Пример работы алгоритма. AI определяет объекты. Например это женщина. Далее она разделяет объект на лицо, губы, глаза, ресницы и т.д.
Вплоть до самых мелких деталей. AI применяет для каждого фрагмента (детали) объекта свою обработку.
Если требуется сделать лицо красивее, основным из критериев будет симметричность всего.
Создание и набор параметров красоты в ручную потребует огромного количества трудозатрат. Задача находится на уровне невозможности.
На несколько тысяч порядков проще «скормить» нейросети млн. фото женщин, и AI сам станет понимать, что является красивым, а что нет.
Можно ставить абсолютно любые задачи.
Например, если «скормить» нейросети прохождение техпроцесса варки стали за десятки лет… AI с высокой точностью может задавать режимы техпроцесса. Лучше любого технолога с многолетним стажем.
При этом AI никогда не учился институте, и даже понятия не имеет, что такое сталь. Ему это для получения результата не нужно.
В вот 2023 году искусственный интеллект стал обрабатывать аудио.
Adobe Enhance Speech – нейросеть для автоматического улучшения записи голоса.
Более точно, — исключение из сигнала переотражений звука и интершумов.
Бесплатное решение для радикального улучшения звуковых файлов. Для блогеров и продакшен компаний.
Нет смысла описывать словами результат работы AI.
Лучше сами смотрите и слушайте.
Первое видео больше для профессиональной аудитории:
Судя по всему это только начало.
При желании, экспериментируйте сами — Adobe Enhance Speech – нейросеть.
Надеялся, что удастся почистить от шумов записи судебных заседаний. Но похоже, этот сервис чистит шумы на основе распознавания речи (но не целых слов, а их частей) и с распознаванием русского пока проблемы. Особенно, в тихих местах записи. В таких местах речь звучит, как от иностранца, который знает по-русски мало слов, но делает вид, что умеет бегло говорить.
Я уверен, что очень скоро этот сервис очень улучшится.
Нет ли подобного сервиса у Яндекса?