«Використовуючи машинний зір, можна покращувати фотографії в один клік» — Олександр Савсуненко, керівник AI Lab в Skylum Software «Використовуючи машинний зір, можна покращувати фотографії в один клік» — Олександр Савсуненко, керівник AI Lab в Skylum Software

«Систему, яка працює тільки завдяки нейромережі, поки неможливо створити», — вважає керівник AI Lab в Skylum Software Олександр Савсуненко. 14 листопада експерт виступить на AI Conference Kyiv з доповіддю «АІ для візуального контенту. Як це працює, і де використовується».

В інтерв’ю для AI Conference Kyiv фахівець розповів про свої проекти з машинним навчанням і поділився, як АІ використовується для поліпшення якості фотографій.

Інтерв’юер: AI Conference Kyiv (AICK).

Респондент: Олександр Савсуненко, керівник AI Lab в Skylum Software (ОС).


AICK: Розкажіть про свій проект у галузі ML — Let's Enhance. Як ви покращували якість фото, і на які труднощі натрапили під час роботи над проектом?

ОС: Для тренування нейромережі ми використовували якісні зображення, з яких ми отримали стислі фото, а також фотографії із шумом. Завдання нейромережі полягало в тому, щоби відновити картинку в хорошій якості. Результат був успішним — нейромережа навчилася прибирати пікселізацію, артефакти стиснення й інші дефекти.

«Використовуючи машинний зір, можна покращувати фотографії в один клік» — Олександр Савсуненко, керівник AI Lab в Skylum Software - 1

Найскладнішим завданням було підтримка цієї системи в Produсtion. Після публікації статей про наш сервіс в TechCrunch і Mashable, до нас посипалася велика кількість трафіку, і за добу довелося обробити майже 200 тисяч зображень.


AICK: Минулого року вийшла версія Let's Enhance 2.0. Чим вона відрізняється від попередньої, і як сервіс виглядає сьогодні?

ОС: У другій версії Let's Enhance змінилася методика тренування, loss-функція та архітектура мережі. Це ті аспекти, які необхідно змінювати постійно, щоби збільшувати якість продукту.

Після того, як я пішов з Let's Enhance.io, у липні 2018 року стартап пройшов у програму Techstars London і отримав інвестиції, які монетизувати і вийшов у прибуток.


AICK: Поділіться найцікавішими АІ-розробками, у яких ви брали участь.

ОС: Я працював над одним із перших проектів із нутригенетики- Titanovo. Завдяки ML ми з колегами намагалися передбачити фізіологічні схильності, грунтуючись на повногемному аналізі й чіповому генотипуванні.

Ми збирали інформацію зі статей, створювали датасета й навчали різних моделів. На цій основі ми створювали рекомендації для людей і передбачали стан їхнього здоров’я в майбутньому.


AICK: Які функції виконують нейромережі в сервісах редагування фотографій, над якими ви працюєте зараз?

ОС: Головну роль АІ виконує в програмі Photolemur від Skylum Software: використовуючи машинний зір, програма покращує зображення в один клік.

Спочатку програма розпізнає тип зображення, а також визначає людей, будівлі й час доби. Після цього програма проводить сегментацію зображення, виділяє відповідні зони.

Далі зображення поліпшується вже без АІ. Це відбувається завдяки використанню зошитів алгоритмів, так, як фотографії обробляються фотографами.


AICK: За якими базами даних і алгоритмів навчалася ця система?

ОС: Що стосується фреймворку для розробки нейромереж, то я надаю перевагу незвичайному, але популярному MXNet. Головний плюс — швидкість обчислень. Те, як називаються датасети й алгоритми не можу сказати — це комерційна таємниця.


AICK: З якими складнощами довелося зіткнутися, створюючи інтелектуальний графічний редактор?

ОС: Якщо зображення складне, нейромережі часто помиляються, розпізнаючи образи або роблячи сегментацію. Тому потрібно було проводити аналіз результатів і виправляти помилки, використовуючи традиційні методи і стандартні алгоритми.

Системи, яка повністю все робить тільки завдяки нейромережі, ще не існує.


AICK: Розкажіть про аудиторію цих продуктів. Чи виходить «переманювати» користувачів Adobe?

ОС: Продукт Luminar служить альтернативою Adobe Lightroom. Нові технології впроваджуються в продукт швидше завдяки маленькій команді, а також постійно залучаються нові користувачі.

«Використовуючи машинний зір, можна покращувати фотографії в один клік» — Олександр Савсуненко, керівник AI Lab в Skylum Software - 2

Luminar — відповідне рішення як для початківців, так і для професійних фотографів — продукт включає інструменти, які редагують зображення в один клік, і набір функцій, який дозволяє більш детально працювати з фото.

А ось продукт Photolemur був створений понад рік тому. Ним активно користуються, оскільки його ЦА — люди, які не бажають вивчати Photoshop. Ця програма підходить для тих, хто хоче, щоби фотографії виглядали красиво.


AICK: Розкажіть про свої проекти, які популяризують нейронні мережі, для того, щоб оптимізувати цільові сторінки.

ОС: Це стандартне завдання, коли необхідно провести A / B-тестування лендінг-сторінок. Під час генерування окремих сторінок для всіх можливих варіантів, у результаті можливі мільйони версій. Для отримання відчутного результату, потрібно провести попарне A / B-тестування всіх версій — для цього необхідна велика кількість трафіку. Таке велике тестування підходить тільки великим компаніям.

А якщо маленька компанія планує перевірку великої кількості варіантів, то можна провести A / B-тестування, використовуючи нейромережі, в основі яких — навчання з підкріпленням. Тоді завдання нейромережі — заповнити сторінку елементами й підвищити її конверсію. Так, нейромережа буде навчатися паралельно з тим, як йде трафік. Результат — нейромережа знайде оптимальну версію лендінгу швидше.

Якщо виникли якісь ускладнення, то АІ можна навчити демонструвати варіанти лендінг-сторінок, персоналізованих для певного користувача. Він буде бачити сторінку, яку йому показує нейромережа, і трафіку завдяки такому підходу потрібно значно менше. У такий спосіб, сторінка покаже гарні результати швидше.

Дізнайтеся більше про штучний інтелект і машинному навчанні від експерта на конференції!

Схожі новини