Без назви-1

Добірка ШІ для генерації картинок

Вступ

Штучний інтелект (ШІ) розвивається стрімкими темпами, і його можливості постійно розширюються. Сьогодні ШІ можна використовувати для виконання найрізноманітніших завдань, в тому числі для генерації зображень на основі тексту.

Існує безліч ШІ для генерації зображень. Більша частина з них платні, проте можна знайти й безкоштовні платформи. Усі вони відрізняються технологіями генерації, функціоналом та методами оплати (безкоштовні, підписка, бали), проте кожен сервіс створює по своєму унікальні та неповторні картинки. Найголовніше - це детальний, чіткий та зрозумілий запит, адже саме його обробляє нейромережа та створює на його основі картинку.

Усі TTI (Text To Image) сервіси працюють за однаковим принципом:
  1. Користувач вводить текстовий запит (або промпт), що описує зображення, яке він хоче створити.
  2. Сервіс використовує різні моделі нейронної мережі, щоб генерувати зображення, яке відповідає текстовому запиту.
  3. Сервіс повертає зображення користувачеві.

Для оцінки TTI сервісів, було взято промпт:

“Generate an image of a city made of vegetables and fruits, where the streets are covered with carrot cobblestones, buildings are constructed from broccoli and zucchinis, and large tomatoes serve as paint for creating vibrant graffiti on the walls. In the square, there may be fountains with orange-shaped figures, and in the sky, there are air balloons made of pineapples.”

Переклад на українську:

“Створіть малюнок міста, зробленого з овочів та фруктів, де вулиці вкриті кишеньками з моркви, будинки виготовлені з броколі та кабачків, а великі томати служать як фарби для створення яскравих графіті на стінах. На площі можуть бути фонтани з апельсиновими фігурками, а в небі - повітряні кульки з ананасів.”

Firefly від Adobe

https://firefly.adobe.com/

Firefly від Adobe - це генеративна модель штучного інтелекту, яка може створювати зображення на основі текстових запитів. Сервіс все ще перебуває в розробці, але він вже може генерувати вражаючі результати. Firefly доступний для користувачів в Photoshop 2023 або онлайн у вебдодатку.

Firefly використовує технологію, яка називається дифузією нейронної мережі –  процес, за допомогою якого нейронна мережа поступово генерує зображення, починаючи з випадкового шуму.

Можливості сервісу

Firefly за замовчуванням генерує 4 зображення за заданим запитом. Перевагою сервісу є те, що користувач може обрати найбільш вдалий варіант, та створити на його основі ще три схожих картинки.

Платформа має великий вибір стилів, ефектів, технік та концептів, що надає ширший спектр варіантів та допомагає допасувати результат до потреб користувача.

Генеративні кредити

Онлайн сервіс Firefly пропонує 25 балів для створення зображень (генеративні кредити). Одна генерація на основі запиту дає чотири картинки та коштує один бал. Щомісяця бали відновлюються.

Недоліки

На зображеннях є логотип "Adobe Firefly", він невеликий та знаходиться в кутку, тому не заважає сприймати зображення.

Recraft AI

https://app.recraft.ai/

Recraft AI - це сервіс, який дозволяє створювати векторну та 3D-графіку за індивідуальним текстовим запитом. Recraft AI використовує технологію GAN для генерації картинок. GAN - це тип нейронної мережі, яка може створювати нові зображення, які є реалістичними та природними.

Функціонал

Окрім того, що сервіс дозволяє створювати зображення на основі тексту, він також може генерувати векторні зображення. Векторні зображення відрізняються від растрових тим, що вони складаються з кривих і ліній, а не з пікселів. Це означає, що їх можна масштабувати до будь-якого розміру без втрати якості.

Згенеровані векторні зображення можна вивантажити в різних форматах. Після цього їх можна імпортувати в програми для роботи з векторною графікою, такі як Adobe Illustrator або Inkscape.

Сервіс також може повторно генерувати картинку (або її частину), з можливістю вибору, на скільки нове зображення схоже на попереднє.

Застереження

Recraft AI - безплатний, а згенеровані результати можуть використовуватися в комерційних цілях. Проте, всі картинки, створені в рамках безкоштовного плану мають публічний доступ.

Unstock

https://unstock.ai/create

Завдяки Unstock ви можете отримати високоякісні ілюстрації, створені штучним інтелектом, абсолютно безплатно. Ці зображення можуть бути використані для будь-якої мети, включаючи комерційне використання.

Можливості платформи

Після реєстрації на платформі для користувача відкривається можливість генерації зображень за допомогою ШІ.

Інтерфейс сайту дуже простий: поле для введення тексту, кнопка "Згенерувати" та результат. Отримане зображення можна згенерувати повторно, без введення додаткової інформації.

Сервіс Unstock є повністю безкоштовним.

Обмеження

На жаль, можливості сервісу досить обмежені. Платформа не пропонує ані вибору стилю, ані розширення картинки. Користувач може отримати результат спираючись лише не написаний текст.

Платні сервіси

Існує безліч платних сервісів для генерації зображень. Вони дають певну кількість кредитів (балів), завдяки чому користувач має можливість згенерувати декілька картинок та оцінити можливості платформи. Ось список платних ШІ, які  можуть створювати картинки на основі текстових запитів:

Бонус

AutoDraw

https://www.autodraw.com/

На відмінну від попередніх сервісів, AutoDraw не генерує зображення на основі тексту. Це новий вид інструменту для малювання від Google Creative Lab. Він використовує машинне навчання та малюнки талановитих художників, щоб допомогти будь-кому швидко створити будь-який візуальний контент.

Платформа працює за наступним принципом:

  1. користувач малює якийсь предмет (на скільки дозволяють художні здібності),
  2. з кожною намальованою рискою, ШІ пропонує варіанти картинок, які, можливо, хотів зобразити користувач.

Це може нагадати гру QuickDraw (https://quickdraw.withgoogle.com/), де гравець має за визначений час намалювати предмет, запропонований програмою. Під час малювання ШІ намагається здогадатися, що ж зображує гравець. Тепер ви знаєте, що це була не перевірка ваших здібностей до малювання, а тренування штучного інтелекту.

Заключення

Отже, генерація зображення за запитом дуже корисна технологія, що дозволяє людям без профільних навичок створювати дивовижні арти. Результат залежить здебільшого від якості промпту, хоча нейронна модель та доступний функціонал також роблять вагомий внесок.

Однією з найкращих платформ є Recraft AI. Окрім того, що вона має дуже вигідний безкоштовний план, ця нейромережа також має змогу генерувати векторні зображення. Користувач може вибрати різні стилі, що полегшує роботу та дає більш точний результат.