• первый
  • нейро
  • фото
  • видео
  • нейронимы
  • продакшн
  • искусственный интеллект
Загрузка

Нейросети: практический угол зрения

Post Image

До прошлого года искусственный интеллект занимал умы в основном ученых и IT-специалистов, но в 2023 инструменты на базе ИИ сделали огромный скачок, став важнейшим фактором развития бизнеса, и это только начало:

  • $400+ млрд – объем рынка искусственного интеллекта к 2027 году,
  • 37,3% – годовой прирост ИИ с 2023 по 2030 год,
  • 90% интернет-контента будет создаваться при помощи ИИ к 2026 году.

Рынок труда также изменится, и всем придётся освоить новые навыки: от 75 млн до 375 млн человек (по разным оценкам) переквалифицируются к 2030, и к 2025 году появится 90+ млн рабочих мест, связанных с ИИ.

Эта революция по масштабам сравнима с компьютеризацией 90‑х, когда новая технология полностью преобразовала все сферы жизни, оставив за бортом всех, кто не принял перемен. Но сегодня всё намного быстрее.

Весь год не утихали споры о невиданных возможностях и опасностях нейросетей, кто-то смеялся над их несовершенством, по интернету ходили мемы про шесть пальцев… Но пришло время от неприятия или восторга перейти в практическую плоскость: как именно приспособить новые инструменты, какие у них ограничения и какая в них польза в каждом конкретном случае.

Для начала: общий контекст использования ИИ в России.

  • Самые распространенные сервисы – иностранные, а это значит, что их легальное использование сильно ограничено: VPN + оплата картами зарубежных банков + незаконность работы с персональными данными, а также со всеми, что составляют коммерческую и государственную тайну. Некоторые люди даже в госорганизациях используют ChatGPT, но это до тех пор, пока службы безопасности не задумываются, что данные обрабатываются на серверах в США. И, конечно, любая иностранная корпорация может по своему усмотрению в любой момент ещё более ограничить и вовсе запретить использование своих сервисов в РФ.
  • Вероятны ограничения поставок иностранного оборудования для профессионального использования. США уже ввело подобные санкции для Китая. Сейчас львиная доля рынка у американской Nvidia – на их оборудовании и софте производятся почти все вычисления в области искусственного интеллекта и альтернатив пока не видно. Простые задачи можно делать на игровых видеокартах, но для масштабных проектов они не годятся.
  • Россия делает ставку на ИИ на самом высоком уровне, но отставание пока весьма заметно. Яндекс делает большие успехи, но добиться от него практически полезных текстов сложно. При этом у нас есть реальная возможность стать одной из ведущих стран в этой высокотехнологичной области. Не стоит забывать, что собственная интернет-инфраструктура есть только у США, России и Китая, у остальных – отдельные программы или сайты.
  • Велик риск монополизации отрасли: вспомним пассажирские перевозки – как хорошо все начиналось для пользователей, когда на рынке появилось Яндекс такси, и что происходит с ценами сейчас, когда он стал почти монополистом. Для устойчивого развития бизнес-сообщества нужно несколько сильных независимых локальных игроков.
  • Наибольшие перспективы – у систем на базе open source (с открытым исходным кодом) решений. Это реальная альтернатива закрытым продуктам западных корпораций. Каждый может собрать и «допилить» продукт для себя или клиента из легально доступных решений. Это делает большинство компаний, ведь создать полностью свою нейросетевую экосистему уровня ChatGPT или Stable Diffusion не проще, чем написать альтернативу Windows с нуля.

Вот в таком контексте будет происходить выбор нейро-решений для каждого бизнеса: нахождение собственного баланса между возможностями с одной стороны, легальностью, надежностью и безопасностью с другой. Итак, что же можно делать с помощью визуальных генеративных нейросетей здесь и сейчас?

Кейс 1: История с идеальной резкостью

Первый нейро продакшн. Проект для "Мнемотеатр". Статья: "Нейросети: практический угол зрения": что можно "фотографировать" здесь и сейчас. Генерация высокого качества онлайн.

Задача.

Создание изображения для оформления зала в творческом кластере «Арт-муза» необычным пресс-воллом на время проведения театральной конференции «Мнемотеатр», которая реализована в рамках гранта Президента Российской Федерации для поддержки творческих проектов общенационального значения в области культуры и искусства. «Мнемотеатр» – это интенсив-курс для специалистов сферы культуры, студентов и педагогов творческих вузов, участников театральных студий, посвящённый созданию, сохранению и распространению театрального наследия. Особенность задачи: большое изображение должно было хорошо восприниматься на любом расстоянии, а также на фотографиях в соцсетях, когда люди сделают селфи на его фоне.

Решение.

Мы выбрали такой вариант только благодаря нейросети: издали виден древнегреческий амфитеатр, преходящий в современный город, а вблизи амфитеатр состоит из мельчайших деталей – дороги, мостов, машин и деревьев. Мы использовали собственные решения и наработки на базе Stable Diffusion, а не общедоступные варианты, такие как Midjourney, именно для того, чтобы не только создать уникальный образ, но и обеспечить возможность управляемой генерации огромного (11000 х 11000 пикселей) детализированного изображения.

Первый нейро продакшн. Проект для "Мнемотеатр". Статья: "Нейросети: практический угол зрения": что можно "фотографировать" здесь и сейчас. Генерация высокого качества онлайн. Увеличенный фрагмент изображения.

Результат.

Результат поражает воображение. Действительно, мы привыкли, что изображение для восприятия издали (наружная реклама, например) вблизи выглядит не очень четко и наоборот. А тут: чем ближе подходишь, тем больше видишь деталей. Чудеса технологий!

Кейс 2: Самостоятельное создание изображений для упаковок и рекламы

Первый нейро продакшн. Проект для "Мнемотеатр". Статья: "Нейросети: практический угол зрения": что можно "фотографировать" здесь и сейчас. Генерация высокого качества онлайн. Натюрморт с сыром, помидором Черри и прованскими травами.

Задача.

Производитель пищевой продукции постоянно создает множество фотографий для упаковок и рекламы в своей дизайн-студии, но она загружена текущими задачами,

а нанимать каждый раз внешнего подрядчика дорого и требует дополнительных ресурсов для управления проектами. К тому же, дизайн и фотография – важное конкурентное преимущество, и их надежнее делать внутри компании.

Решение.

В данном случае пошли еще дальше по пути оптимизации производственного процесса, и установили у клиента рабочее место для самостоятельной генерации изображений с необходимым для его деятельности набором библиотек и настроек.

Ещё важный нюанс: для того, чтобы найти наиболее подходящие параметры, было проведено жёсткое тестирование восприятия нейрофотографий в сравнении с обычными. Мы подали 24 работы на несколько фотоконкурсов. 2800+ фотографов и любителей фотографии, то есть разбирающихся в теме людей, не только не распознали, что изображения сделаны с помощью нейросетей, но оценили их выше большинства работ других участников конкурса. Анализ статистики по голосованию помог нам создать тонкие настройки генерации.

Первый нейро продакшн. Проект для "Мнемотеатр". Статья: "Нейросети: практический угол зрения": что можно "фотографировать" здесь и сейчас. Генерация высокого качества онлайн. Натюрморт со свежим ароматным хлебом и черникой.

Результат.

Дизайн команда получила нейро-помощника, которого можно использовать 24/7. Это очень удобно – ставишь задачу и переключаешься на другой проект или идешь домой. Потом смотришь сгенерированные варианты и выбираешь нужный или немного уточняешь задачу. Это намного дешевле дополнительного дизайнера, ретушера

и фотографа со всем комплектом необходимого им оборудования. И ещё важный нюанс – настоящая еда редко бывает настолько идеальна, как на фотографии, каждый кадр надо ретушировать. Теперь большинство изображений создаются готовыми, «без фотошопа», это дает дизайн-студии возможность больше времени уделять поиску креативных решений.

Нейро продакшн — замена коммерческой фотосессии.

Под натиском новых технологий традиционные жанры бизнес фотографии будут умирать один за другим. Первый кандидат – съемка всех новых (неиспользованных) предметов и объектов: уже сейчас в недвижимости и большинстве других бизнесов используется 3D графика вместо фотографий. Исключение: «вторичка» – съемка использованных объектов и вещей, так как важно показать реальное состояние товара (машины, например). Репортаж не умрет, скорее всего, никогда – в нем важен сам факт съемки. Пока держится традиционная рекламная фотосессия с людьми. Но лёд уже тронулся, ведь дешевые фотобанки с одинаковыми фотографиями всем уже надоели и больше

не «цепляют», а уникальные фотографии – это долго и дорого. К тому же с нашего рынка ушли качественные международные фотобанки, которые порой обеспечивали разумный баланс между ценой и качеством.

В этой статье описаны лишь пара проектов, но самые невероятные прорывы нейросети несут в креативные индустрии: театр, архитектуру, моду, дизайн – тысячекратно умножая творчество человека. Вот где настоящие чудеса!

Подул ветер перемен, подставляйте паруса!

Георгий Безбородов,
Опубликовано в журнале ОПТИЧЕСКИЙ MAGAZINE
№1 (88) 2024, Международное издание

Назад
Нет больше сообщений
Вперед
Как генеративный ИИ может стимулировать потребительский маркетинг
Comments are closed.