Google обяви значително надграждане на своя модел за генериране на изображения, представяйки Nano Banana Pro – усъвършенствана версия, базирана на най-новия езиков модел Gemini 3, публикуван по-рано тази седмица. Технологичният гигант посочва, че новият модел предлага по-точно изобразяване на текст, по-висока резолюция и възможност за работа в широк диапазон от стилове, шрифтове и езици, надминавайки предшественика си Nano Banana.
Една от ключовите нови функционалности е вграденото уеб търсене, позволяващо на модела да извлича информация в реално време — например да открие рецепта и да създаде учебни карти въз основа на нея.
Nano Banana Pro е ориентиран към професионалисти и предлага фино управление на визуалните параметри като камера ъгъл, осветление, дълбочина на рязкост, фокус и цветови корекции. За разлика от лимита от 1024×1024 пиксела при предишния модел, тук потребителите могат да генерират изображения в 2K или 4K резолюция.
Google уточнява, че подобреното качество идва с по-висока цена и по-бавно генериране. Докато оригиналният Nano Banana струваше $0.039 за изображение 1024px, Nano Banana Pro се таксува с $0.139 за 1080p или 2K изображение и $0.24 за 4K.
Новият модел поддържа до шест висококачествени снимки, смесване на до 14 обекта в рамките на една композиция и може да запази визуалната последователност и прилика на пет човека едновременно. Google е публикувала и демо приложение за тестване на тези възможности.
Nano Banana Pro вече се внедрява в различни услуги на компанията. Приложението Gemini ще използва модела по подразбиране, като безплатните потребители имат ограничен брой генерирания, след което се превключва към оригиналния Nano Banana. Абонатите на Google AI Plus, Pro и Ultra получават по-високи лимити, както и достъп до модела в NotebookLM.
В Google Search, чрез AI mode, моделът ще бъде достъпен за Pro и Ultra потребители в САЩ. Ultra абонатите могат да използват Nano Banana Pro и във видеоплатформата Flow, а корпоративните клиенти ще го открият в Google Slides и Vids.
Разработчиците могат да интегрират новия модел чрез Gemini API, Google AI Studio и новата IDE среда Antigravity.
Компанията допълва, че технологията SynthID, предназначена за маркиране и разпознаване на AI-генерирани изображения, вече е част от приложението Gemini. Потребителите могат да качат изображение и да проверят дали е създадено или редактирано от Google модели. С течение на времето ще бъде добавена и поддръжка за C2PA удостоверяване на съдържание.
Все още няма коментари. Бъдете първи!