Google

Google анонсировала кардинальное обновление возможностей генерации изображений в приложении Gemini. Новая модель Gemini 2.5 Flash Image, получившая неофициальное название "nano banana", заняла первое место в рейтинге лучших редакторов изображений LMArena и собирает восторженные отзывы пользователей.

Модель доступна через приложение Gemini, а также для разработчиков via Gemini API, Google AI Studio и платформу Vertex AI. Ключевое преимущество nano banana заключается в решении одной из главных проблем генерации изображений с помощью ИИ – поддержании консистентности при редактировании.

Многие пользователи сталкивались с ситуацией, когда при попытке внести незначительные изменения в понравившееся изображение через ChatGPT или Grok, весь рисунок трансформировался. Новая система Google устраняет эту проблему, позволяя точечно корректировать детали без искажения основного объекта.

Пользователи могут загрузить фотографию человека и экспериментировать с различными нарядами, прическами или помещать персонажа в антураж разных эпох, сохраняя при этом узнаваемость субъекта.

Gemini 2.5 Flash Image поддерживает мультитурновое редактирование, позволяя последовательно вносить изменения в изображения. Google предлагает, например, добавлять мебель и декорации к фотографии комнаты для генерации дизайнерских идей.

Интересной функцией стало смешивание дизайнов – технология позволяет применять стиль одного изображения к объекту на другом. Так можно перенести узор с крыльев бабочки на дизайн платья.

С развитием технологий генерации изображений растут и опасения по поводу их потенциального злоупотребления. Google учитывает эти риски, так что каждое изображение, созданное nano banana, содержит видимый водяной знак ИИ в углу, а также невидимую цифровую метку SynthID, которая остается детектируемой даже после модификации файла. Правда, ничто не мешает сделать скриншот изображения и сохранить его без меток.

Источник: shazoo.ru