Google анонсировала кардинальное обновление возможностей генерации изображений в приложении Gemini. Новая модель Gemini 2.5 Flash Image, получившая неофициальное название "nano banana", заняла первое место в рейтинге лучших редакторов изображений LMArena и собирает восторженные отзывы пользователей.
Модель доступна через приложение Gemini, а также для разработчиков via Gemini API, Google AI Studio и платформу Vertex AI. Ключевое преимущество nano banana заключается в решении одной из главных проблем генерации изображений с помощью ИИ – поддержании консистентности при редактировании.
Многие пользователи сталкивались с ситуацией, когда при попытке внести незначительные изменения в понравившееся изображение через ChatGPT или Grok, весь рисунок трансформировался. Новая система Google устраняет эту проблему, позволяя точечно корректировать детали без искажения основного объекта.
Пользователи могут загрузить фотографию человека и экспериментировать с различными нарядами, прическами или помещать персонажа в антураж разных эпох, сохраняя при этом узнаваемость субъекта.
Gemini 2.5 Flash Image поддерживает мультитурновое редактирование, позволяя последовательно вносить изменения в изображения. Google предлагает, например, добавлять мебель и декорации к фотографии комнаты для генерации дизайнерских идей.
Интересной функцией стало смешивание дизайнов – технология позволяет применять стиль одного изображения к объекту на другом. Так можно перенести узор с крыльев бабочки на дизайн платья.
С развитием технологий генерации изображений растут и опасения по поводу их потенциального злоупотребления. Google учитывает эти риски, так что каждое изображение, созданное nano banana, содержит видимый водяной знак ИИ в углу, а также невидимую цифровую метку SynthID, которая остается детектируемой даже после модификации файла. Правда, ничто не мешает сделать скриншот изображения и сохранить его без меток.
Источник: shazoo.ru