«Систему, яка працює тільки завдяки нейромережі, поки неможливо створити», — вважає керівник AI Lab в Skylum Software Олександр Савсуненко. 14 листопада експерт виступить на AI Conference Kyiv з доповіддю «АІ для візуального контенту. Як це працює, і де використовується».
В інтерв’ю для AI Conference Kyiv фахівець розповів про свої проекти з машинним навчанням і поділився, як АІ використовується для поліпшення якості фотографій.
Інтерв’юер: AI Conference Kyiv (AICK).
Респондент: Олександр Савсуненко, керівник AI Lab в Skylum Software (ОС).
AICK: Розкажіть про свій проект у галузі ML — Let's Enhance. Як ви покращували якість фото, і на які труднощі натрапили під час роботи над проектом?
ОС: Для тренування нейромережі ми використовували якісні зображення, з яких ми отримали стислі фото, а також фотографії із шумом. Завдання нейромережі полягало в тому, щоби відновити картинку в хорошій якості. Результат був успішним — нейромережа навчилася прибирати пікселізацію, артефакти стиснення й інші дефекти.
Найскладнішим завданням було підтримка цієї системи в Produсtion. Після публікації статей про наш сервіс в TechCrunch і Mashable, до нас посипалася велика кількість трафіку, і за добу довелося обробити майже 200 тисяч зображень.
AICK: Минулого року вийшла версія Let's Enhance 2.0. Чим вона відрізняється від попередньої, і як сервіс виглядає сьогодні?
ОС: У другій версії Let's Enhance змінилася методика тренування, loss-функція та архітектура мережі. Це ті аспекти, які необхідно змінювати постійно, щоби збільшувати якість продукту.
Після того, як я пішов з Let's Enhance.io, у липні 2018 року стартап пройшов у програму Techstars London і отримав інвестиції, які монетизувати і вийшов у прибуток.
AICK: Поділіться найцікавішими АІ-розробками, у яких ви брали участь.
ОС: Я працював над одним із перших проектів із нутригенетики- Titanovo. Завдяки ML ми з колегами намагалися передбачити фізіологічні схильності, грунтуючись на повногемному аналізі й чіповому генотипуванні.
Ми збирали інформацію зі статей, створювали датасета й навчали різних моделів. На цій основі ми створювали рекомендації для людей і передбачали стан їхнього здоров’я в майбутньому.
AICK: Які функції виконують нейромережі в сервісах редагування фотографій, над якими ви працюєте зараз?
ОС: Головну роль АІ виконує в програмі Photolemur від Skylum Software: використовуючи машинний зір, програма покращує зображення в один клік.
Спочатку програма розпізнає тип зображення, а також визначає людей, будівлі й час доби. Після цього програма проводить сегментацію зображення, виділяє відповідні зони.
Далі зображення поліпшується вже без АІ. Це відбувається завдяки використанню зошитів алгоритмів, так, як фотографії обробляються фотографами.
AICK: За якими базами даних і алгоритмів навчалася ця система?
ОС: Що стосується фреймворку для розробки нейромереж, то я надаю перевагу незвичайному, але популярному MXNet. Головний плюс — швидкість обчислень. Те, як називаються датасети й алгоритми не можу сказати — це комерційна таємниця.
AICK: З якими складнощами довелося зіткнутися, створюючи інтелектуальний графічний редактор?
ОС: Якщо зображення складне, нейромережі часто помиляються, розпізнаючи образи або роблячи сегментацію. Тому потрібно було проводити аналіз результатів і виправляти помилки, використовуючи традиційні методи і стандартні алгоритми.
Системи, яка повністю все робить тільки завдяки нейромережі, ще не існує.
AICK: Розкажіть про аудиторію цих продуктів. Чи виходить «переманювати» користувачів Adobe?
ОС: Продукт Luminar служить альтернативою Adobe Lightroom. Нові технології впроваджуються в продукт швидше завдяки маленькій команді, а також постійно залучаються нові користувачі.
Luminar — відповідне рішення як для початківців, так і для професійних фотографів — продукт включає інструменти, які редагують зображення в один клік, і набір функцій, який дозволяє більш детально працювати з фото.
А ось продукт Photolemur був створений понад рік тому. Ним активно користуються, оскільки його ЦА — люди, які не бажають вивчати Photoshop. Ця програма підходить для тих, хто хоче, щоби фотографії виглядали красиво.
AICK: Розкажіть про свої проекти, які популяризують нейронні мережі, для того, щоб оптимізувати цільові сторінки.
ОС: Це стандартне завдання, коли необхідно провести A / B-тестування лендінг-сторінок. Під час генерування окремих сторінок для всіх можливих варіантів, у результаті можливі мільйони версій. Для отримання відчутного результату, потрібно провести попарне A / B-тестування всіх версій — для цього необхідна велика кількість трафіку. Таке велике тестування підходить тільки великим компаніям.
А якщо маленька компанія планує перевірку великої кількості варіантів, то можна провести A / B-тестування, використовуючи нейромережі, в основі яких — навчання з підкріпленням. Тоді завдання нейромережі — заповнити сторінку елементами й підвищити її конверсію. Так, нейромережа буде навчатися паралельно з тим, як йде трафік. Результат — нейромережа знайде оптимальну версію лендінгу швидше.
Якщо виникли якісь ускладнення, то АІ можна навчити демонструвати варіанти лендінг-сторінок, персоналізованих для певного користувача. Він буде бачити сторінку, яку йому показує нейромережа, і трафіку завдяки такому підходу потрібно значно менше. У такий спосіб, сторінка покаже гарні результати швидше.
Дізнайтеся більше про штучний інтелект і машинному навчанні від експерта на конференції!
Підпишіться на розсилку.
Без спаму.