Публикация Школы траблшутеров

Как мы обучали артилект

Время чтения: 2 мин 30 сек
11 ноября 2024 г. Просмотров: 169

Искусственный интеллектОлег БрагинскийМарина Строева

Основатель «Школы траблшутеров» Олег Брагинский и ученица Марина Строева рассказывают, как искусственный интеллект может обучиться рисовать конкретную модель, и делать это так, чтобы изображения нельзя было отличить от реальных фотографий.

Первым этапом освоения искусственного интеллекта стал выбор модели для обучения. Для чего были загружены доступные модели Stable Diffusion от Stability AI, LLaMA от Meta AI, моделей DEV и SCHNELL от Flux. Результаты получили разношёрстные, что-то приятно удивило, что-то огорчило:

По итогам тестирования выбрали инструменты DEV и SCHNELL от Flux: показали лучшие результаты генерации изображения по промту и гибкость дообучения. Начали процесс обучения, разработав чат-бот, в который загружали фотографии:

Оказалось, что исходные данные имеют огромное значение, а неидеальные изображения дали некачественный результат, но уже с первой попытки модель начала рисовать схожие черты лица:

Подготовили более качественные фотографии и обучили новую модель:

Результаты начали радовать, можно было начинать создавать контент под произвольный запрос:

Остановились на моделях, показывающие диаметральные результаты качества изображения.

Одна обучена рисовать на SCHNELL, создаёт вполне реалистичные изображения:

Вторая, основанная на DEV творит ярко, вызывающе, но не менее интересно и качественно.

Какие же выводы можно сделать на основе проделанной работы:

  1. Выбор модели имеет ключевое значение. Различные архитектуры нейросетей дают разные результаты, что лучше всего видно на примере моделей DEV и SCHNELL от Flux.
  2. Качество исходных данных критично. Плохие первичные изображения приводят к менее качественным результатам, даже при использовании продвинутых алгоритмов.
  3. Тщательная настройка улучшает точность. Дополнительное обучение позволяет добиваться более реалистичного изображения, передающего черты лица.
  4. Модель определяет стиль. SCHNELL творит фотореалистично, DEV создаёт яркие и экспрессивные образы, добавляя уникальные визуальные элементы.

Использование искусственного интеллекта для создания визуального контента требует детальной настройки, выбора правильной модели и качественных исходных данных, что позволяет создавать изображения высокого качества, которые соответствуют даже самым взыскательным требованиям.