🍌Нано-банана — что может, где найти, откуда хайп (гайд)
В конце августа появился Nano-banana. Он был доступен только на 1 сайте, и выдавал действительно хорошие результаты в редактировании фото
Затем оказалось, что это модель gemini-2.5-flash-image-preview
Что же по факту можно сказать о ней?
1) действительно это лучшая на данный момент модель по редактированию фотографий — она очень хорошо понимает что нужно изменит в фото
2) Она может добавлять/убирать объекты, совмещать 2 объекта на 1 фото, перемещать объект с одного на другое фото, менять стиль, делать замену лица, одежды и много что ещё
3) у неё максимальная консистентность из того, что я видел, но это всё ещё не идеал. Примерно 80-95% схожесть, в зависимости от простоты объекта и его величине в кадре. Но если много фактуры или, допустим это человек в отдалении, то схожесть и его качество будут всё ещё заметно страдать. Будет пластиковость, будет сглаживание и расширение лица. Особенно это заметно, если делать изменения на самом лице, либо несколько раз отредактировать фото — при каждой итерации картинка будет более пластиковая
4) я не знаю про все платформы, но gemini-2.5-flash-image-preview всё ещё заметно ухудшает разрешение исходной фото/картинки. Соотвественно вам придётся его апскейлить на выходе. А из-за этого теряются некоторые детали
Где же она есть?
1. Официально Gemini API (в Google AI studio бесплатно)
2. Чам чат-бот Gemini
3. Openrouter (тоже есть бесплатный вариант)
4. Fal.ai
5. Replicate.com
6. Higgsfiled (тут можно использовать для редактирования видео или в рамках UGC Factory - создание рекламы продукта)
7. nanobanana.ai
В сторонних сервисах использование Нано-банано стоит дёшево ($0.039 за фото), а если использовать через Vertex или через openrouter — то $0.30 и $2.50 за 1 млн токенов на вход и на выход соответственно
Единственное что, как и с прошлой версии Gemini, тут постоянно сервера Google перегружены, поэтому часто можно ждать картинку целую минуту.
Как её реально можно использовать?
— Вместо фото шопа
— При генерации баннеров на ютуб, и инстаграм, а также рекламных креативов
— Для карточки в озон и вайдберрис
— Для примерки одежды/обуви*
— Для ИИ-фотосессии*
— Для редактирования видео
— Для вирусных роликов
*не 100% cходство, уступает лоре, но лучшее при наличии 1 фото
• Важно, хоть это и Gemini, но промпты ей писать лучше на английском. Русские промпты она в этой версии слушается гораздо хуже. Вот официальный промпт-гайд от Google на русском языке. А вот gpt, который настроен на создание промптов для Нано-банано.
• Также внутри обычного чата Gemini (только vpn) можно давать полноценное описание задачи, как "Вот фотография (например Льва Толстого), найди в интернете кто это, поставь его фото на баннер на улице Москвы и подпиши его именем и профессией".
• Как правило достаточно просто написать то, что вы хотите, как и в gpt-4o, но всё же не все случае так работают. Вот несколько кейсов и правильных формулировок промптов к ним, которые с большой долей сработают (другие формулировки у меня не работали):
1) Если хочется заменить персонажа на фото — "Turn this person into ..."
2) Если нужно переместить персонажа в другое место без изменений — "Keep this character's look identical, but place them in ..."
3) Если нужно изменить портрет картинки — "Transform this portrait into (название стиля)"
Напишите свой опыт, как вы внедряете его в свои проекты или просто лайфхаки )
Выше демонстрация, где я взял свою фото, приделал присобачил себе бороду, а затем использовал промпты выше)
#разборы
#визуал
@oh_my_zen
🔗 Источник: Нейро Дзен
📤 Подпишитесь на 🏢 Тринадцатый этаж, CHATGPT, DeepSeek и другие нейросети, новости ИИ 🤖 и получайте больше полезного контента Google AI studio https://aistudio.google.com/app/prompts/new_chat Gemini https://gemini.google.com/ Openrouter https://openrouter.ai/ Fal.ai http://Fal.ai/ Replicate.com http://Replicate.com/ Higgsfiled http://higgsfield.ai/ nanobanana.ai http://nanobanana.ai/ промпт-гайд https://ai.google.dev/gemini-api/docs/image-generation?hl=ru#image-editing-prompts gpt https://chatgpt.com/g/g-Uiz5ukAUR-nano-banana-prompt-engineer #разборы ?q=%23%D1%80%D0%B0%D0%B7%D0%B1%D0%BE%D1%80%D1%8B #визуал ?q=%23%D0%B2%D0%B8%D0%B7%D1%83%D0%B0%D0%BB @oh_my_zen https://t.me/oh_my_zen Нейро Дзен https://t.me/oh_my_zen 🏢 Тринадцатый этаж, CHATGPT, DeepSeek и другие нейросети, новости ИИ 🤖 https://t.me/thThirteenthFloor