Используя машинное зрение, можно улучшать фотографии в один клик — Александр Савсуненко, руководитель AI Lab в Skylum Software Используя машинное зрение, можно улучшать фотографии в один клик — Александр Савсуненко, руководитель AI Lab в Skylum Software

Систему, которая работает только с помощью нейросети, пока невозможно создать, считает руководитель AI Lab в Skylum Software Александр Савсуненко. 14 ноября эксперт выступит на AI Conference Kyiv с докладом «ИИ для визуального контента. Как это работает и где используется».

В интервью для AI Conference Kyiv специалист рассказал о своих проектах с машинным обучением и поделился, как ИИ используется для улучшения качества фотографий.

Интервьюер: AI Conference Kyiv (AICK).

Респондент: Александр Савсуненко, руководитель AI Lab в Skylum Software (AC).


AICK: Расскажите о своем проекте в области ML — Let’s Enhance. Как улучшали качество фото и с какими трудностями столкнулись во время проекта?

АС: Для тренировки нейросети мы использовали качественные изображения, из которых мы получили сжатые и шумные. Задача нейросети состояла в том, чтобы восстановить картинку в хорошем качестве. Результат был успешным: нейросеть научилась убирать пикселизацию, артефакты сжатия и другие дефекты.

Используя машинное зрение, можно улучшать фотографии в один клик — Александр Савсуненко, руководитель AI Lab в Skylum Software - 1

Самым сложным была поддержка этой системы в produсtion. После публикации статей о нашем сервисе в TechCrunch и Mashable к нам полилось большое количество трафика, и за сутки пришлось обработать около 200 тысяч изображений.


AICK: В прошлом году вышла версия Let’s Enhance 2.0. Чем она отличается от предыдущей и как сервис выглядит сегодня?

АС: Во второй версии Let’s Enhance изменилась методика тренировки, loss-функция, архитектура сети. Это те аспекты, которые необходимо менять постоянно, чтобы повышать качество продукта.

После моего ухода из Let’s Enhance.io в июле 2018 года стартап прошел в программу Techstars London и получил инвестиции, монетизировался и вышел в прибыль.


AICK: Поделитесь самыми интересными и запомнившимися ИИ-разработками, в которых вы участвовали.

АС: Я работал над одним из первых проектов по нутригенетике — Titanovo. С помощью ML мы с коллегами пытались предсказать физиологические предрасположенности, основываясь на полногеномном анализе и чиповом генотипировании.

Мы собирали информацию из статей, создавали дата-сеты и обучали модели. На их основе мы создавали рекомендации для людей и предсказывали состояние их здоровья в будущем.


AICK: Какие функции выполняют нейросети в сервисах редактирования фотографий, над которыми вы работаете сейчас?

АС: Главную роль ИИ исполняет в программе Photolemur от Skylum Software: используя машинное зрение, программа улучшает изображения в один клик.

Сначала программа распознает тип изображения, а также определяет людей, здания и время суток. После производится сегментация изображения, выделяются соответствующие зоны.

Улучшается изображение уже без ИИ. Это происходит с использованием зашитых алгоритмов так, как фотографии обрабатываются фотографами.


AICK: С помощью каких баз данных и алгоритмов обучалась эта система?

АС: Что касается фреймворка для разработки нейросетей, я предпочитаю необычный, но набирающий популярность MXNet.

Главный плюс — быстрота вычислений. То, как называются дата-сеты и алгоритмы, не могу сказать, — коммерческая тайна.


AICK: С какими сложностями пришлось столкнуться, создавая интеллектуальный графический редактор?

АС: Если изображение сложное, нейросети часто ошибаются, распознавая образы или делая сегментацию. Поэтому нужно было проводить анализ результатов и исправлять ошибки, используя традиционные методы и стандартные алгоритмы.

Системы, которая полностью все делает только с помощью нейросети, еще не существует.


AICK: Расскажите об аудитории этих продуктов. Получается ли «переманивать» пользователей Adobe?

АС: Продукт Luminar служит альтернативой Adobe Lightroom. Новые технологии внедряются в продукт быстрее за счет маленькой и сплоченной команды, а также постоянно привлекаются новые пользователи.

Используя машинное зрение, можно улучшать фотографии в один клик — Александр Савсуненко, руководитель AI Lab в Skylum Software - 2

Luminar — подходящее решение как для начинающих, так и для профессиональных фотографов: продукт включает инструменты, чтобы редактировать изображения в один клик, и набор функций, позволяющий более детально работать с фото.

А вот продукт Photolemur был создан чуть более года назад. Им активно пользуются, так как его ЦА — люди, не желающие изучать Photoshop. Он подходит для тех, кто просто хочет, чтобы фотографии выглядели красиво.


AICK: Расскажите о своих проектах, развивающих нейронные сети, чтобы оптимизировать целевые страницы.

АС: Это стандартная задача, когда необходимо A/B-тестирование лендинг-страницы. При генерировании отдельных страниц для всех возможных вариантов в результате возможны миллионы версий. Для получения значимого результата нужно провести попарное A/B-тестирование всех версий. Для этого необходимо большое количество трафика. Такое крупное тестирование подходит только крупным компаниям.

А если маленькая компания планирует проверку большого количества вариантов, то можно делать A/B-тестирование, используя нейросети, в основе которых лежит обучение с подкреплением. Тогда задача нейросети — заполнить страницу элементами и повысить ее конверсию. Так нейросеть будет обучаться параллельно с тем, как идет трафик. Результат — нейросеть найдет оптимальную версию лендинга быстрее.

При усложнении ИИ можно научить демонстрировать варианты лендинг-страниц, персонализированных для определенного пользователя. Он будет видеть страницу, которую ему показывает нейросеть, и трафика при таком подходе нужно меньше. Так страница покажет хорошие результаты быстрее.

Узнайте больше об искусственном интеллекте и машинном обучении от эксперта на конференции!

Похожие новости