Nano Banana یک ابزار هوش مصنوعی برای تولید تصویر است که توسط گوگل توسعه یافته و ایده‌ها و مفاهیم را به تصویر می‌کشد و با پردازش سریع و جزئیات ساده، برای ساخت تصاویر آموزشی، محصولی و خلاقانه مناسب است. در این مطلب از مجله فرادرس با ویژگی‌ها و روش کار با این ابزار اشنا می‌شویم.

آنچه در این مطلب می‌آموزید:

  • می‌آموزید Nano Banana چه کاربردهایی دارد.

  • با ویژگی‌های مهم Nano Banana آشنا می‌شوید.

  • روش استفاده قدم به قدم Nano Banana را برای ویرایش و پردازش تصویر می‌آموزید.

  • یاد می‌گیرید چگونه پرامپت‌های ساده و کاربردی برای استفاده در Nano Banana بنویسید.

  • روش ادغام تصاویر و ویرایش چند مرحله‌ای را می‌آموزید.

  • یاد می‌گیرید چگونه زاویه نمای تصویر را با Nano Banana تغییر دهید.

فهرست مطالب این نوشته
997696

در ابتدای این مطلب می‌آموزیم Nano Banana چیست و مهم‌ترین قابلیت‌های آن کدامند. سپس به بررسی کاربردها، روش استفاده و پرامپت‌نویسی برای استفاده از این هوش مصنوعی می‌پردازیم. با مطالعه این مطلب تا انتها می‌توانید به شکلی کامل بیاموزید Nano Banana چیست.

Nano Banana چیست؟

Nano Banana یک ابزار حرفه‌ای تولید و ویرایش تصویر با استفاده از هوش مصنوعی است که توسط شرکت گوگل ارائه شده و نامی جدید برای ابزار ویرایش تصویر Flash Gemini 2.5 است. این ابزار انجام کارهایی مانند تغییر تصویر، تغییر پس زمینه تصویر، ترکیب چند تصویر متفاوت، تغییر زاویه عکس برداری، تولید تصاویر محصولات برندها و … را آسان کرده است.

Nano Banana یک مدل هوش مصنوعی مولد و پردازش تصویر است و معمولا از طریق Google AI Studio یا API استفاده می‌شود. این به‌روزرسانی انجام شده توسط گوگل، این قابلیت را فراهم می‌کند که چند تصویر را در قالب یک تصویر ادغام کنید، انسجام شخصیت‌ها را برای روایت‌های کامل‌تر حفظ نمایید، تغییرات دلخواه را با زبان طبیعی اعمال کنید و با تکیه بر دانش جهانی Gemini تصاویر را تولید و ویرایش کنید.

تصویر موز تولید شده با nano banana

ویژگی‌های مهم Nano Banana

با ابزار هوش مصنوعی ویرایش تصویر Nano Banana می‌توانید ویرایش‌هایی کاربردی روی تصاویر انجام دهید. این ابزار ویژگی‌هایی کاربردی مانند حفظ ثبات شخصیت‌ها، ویرایش مبتنی بر دستور متنی، بهره‌گیری از دانش جهانی Gemini و ادغام چند تصویر را دارد که آن را نسبت به سایر ابزارهای ویرایش تصویر متمایز ساخته است.

نمودار ویژگی های nano banana
ویژگی‌ها و برتری Nano Banana

در ادامه این ویژگی‌های Nano Banana را بررسی می‌کنیم.

حفظ ثبات شخصیت ها

یکی از چالش‌های اصلی در تولید تصویر، حفظ ظاهر ثابت یک شخصیت یا شیء در میان چندین دستور یا ویرایش است. با استفاده از Nano Banana می‌توانید یک شخصیت (تصویر واقعی یا تولید شده یک فرد، شیء و …) را در محیط‌های مختلف قرار دهید، یک محصول را از زوایای گوناگون نمایش دهید یا دارایی‌های برند را به‌صورت یکنواخت نمایش دهید.

این قابلیت محدود به توانایی‌های مدل است و گاهی ممکن است در شرایط خاص خطا داشته باشد.

ویرایش مبتنی بر دستور متنی

در Nano Banana می‌توان با استفاده از زبان ساده و طبیعی، تغییرات دقیق و هدفمندی در تصویر ایجاد کرد. برای مثال، با استفاده از عباراتی مانند تار کردن پس زمینه، پاک کردن لکه روی لباس، حذف کامل یک شخص از تصویر، تغییر حالت سوژه یا رنگی کردن عکس‌های سیاه و سفید می‌توان به راحتی و با جزئیات دقیق تصاویر را ویرایش کرد.

بهره گیری از دانش جهانی Gemini

بر خلاف مدل‌های تصویری گذشته که بیشتر روی جنبه‌ی زیبایی‌شناسی تمرکز داشتند، Gemini 2.5 Flash Image از دانش عمیق جهانی Gemini استفاده می‌کند. این موضوع کاربردهای تازه‌ای را ممکن می‌سازد. برای مثال، تصاویر خیابان‌های موجود در یک شهر، افراد برجسته، بناهای تاریخی و … با دقت زیادی تولید می‌شود.

این ابزار می‌تواند نمودارهای دست‌کشیده را بخواند، به پرسش‌های واقعی پاسخ دهد و حتی دستورهای پیچیده‌ی ویرایشی را در یک مرحله انجام دهد. درواقع، این مدل می‌تواند اطلاعات عمومی و متنی را در تولید تصویر به کار ببرد، ولی نمی‌تواند واقعیت‌های زنده را با دقت صد درصد بازسازی کند.

ادغام چند تصویر

Nano Banana می‌تواند چند تصویر را ترکیب کرده و به نتیجه‌ای واحد و واقع‌گرایانه برساند. می‌توانید شیئی را وارد صحنه کنید، طراحی یک اتاق را تغییر دهید یا چند تصویر را با هم در یک دستور ادغام نمایید. کیفیت ادغام بستگی به ورودی‌ها و وضوح تصاویر دارد و همیشه نتیجه کاملا واقع‌گرایانه نخواهد بود.

ویرایش چند مرحله ای

یکی از مهم‌ترین ویژگی‌های Nano Banana، ویرایش چند مرحله‌ای روی یک تصویر واحد است. برای این کار، ابتدا تصویر بارگذاری شده و ویرایش می‌شود. سپس می‌توانید روی تصویر به‌روزرسانی‌شده، ویرایش‌های بیشتری انجام دهید. هوش مصنوعی دستورات قبلی شما را به خاطر می‌سپارد، این باعث می‌شود مدل با زمینه قبلی کار کند و توانایی ویرایش قدرتمندتری داشته باشد.

افزودن متن به تصویر

ابزار Nano Banana، می‌تواند با دقت بالایی و با توجه به تصویر، متن ارائه شده در پرامپت را به تصویر اضافه کند. با این وجود این قابلیت ابزار نیز می‌تواند با خطاهایی روبه‌رو شود. با این وجود، متن‌های واضح و کوتاه (خصوصا به زبان انگلیسی) با دقت بسیار بالایی به تصویر اضافه می‌شوند.

سرعت قابل ملاحظه

ابزار Nano Banana با توجه به قابلیت‌های ویژه‌ای که دارد، سرعت قابل توجهی در درک، ویرایش و ساخت تصاویر جدید دارد.

یک مرد، لپتاپ و ماگ با لوگوی فرادرس
تصویر ساخته شده با Nano Banana

کاربردهای Nano Banana

با توجه به ویژگی‌های منحصر به فرد Nano Banana، از این ابزار می‌توان برای بسیاری از هدف‌ها مانند تولید محتوای شخصی، تولید محتوای سازمانی، تولید محتوای تصویری برای استفاده‌های شخصی و سازمانی،  و …. استفاده کرد. از برخی دیگر از کاربردهای Nano Banana می‌توان به موارد زیر اشاره کرد.

  • رنگی کردن و بهبود کیفیت تصاویر
  • طراحی محصول برند
  • طراحی لوگو
  • طراحی داخلی
  • عکاسی مد و فشن
  • شخصیت پردازی برای داستان‌ها و بازی‌ها
  • تولید دیاگرام‌ها و پوسترهای علمی
  • دکوراسیون فضاهای داخلی مانند خانه، اتاق، دفتر کار و …
نمودار کاربردهای Nano Banana
کاربردهای Nano Banana

روش استفاده از Nano Banana

برای استفاده از ابزار Nano Banana ابتدا باید وارد آدرس‌های اینترنتی شوید که از این ابزار استفاده می‌کنند. برای مثال، وبسایت‌های Google AI Studio و API Gemini امکان استفاده از این ابزار به همراه محدودیت‌های مشخص را دارند.

در ادامه روش استفاده از Nano Banana در وبسایت Google AI Studio را بررسی می‌کنیم.

نمودار مراحل استفاده از Nano Banana
مراحل استفاده از Nano Banana

قدم اول: ورود به وبسایت مورد نظر

ابتدا وبسایت Google AI Studio یا هر وبسایت مورد نظر دیگری را با استفاده از مرورگر باز می‌کنیم.

محیط Google AI Studio
محیط Google AI Studio

قدم دوم: آشنایی با محیط ابزار

می‌توان با استفاده از زبانه چت (Chat) یا زبانه Generate Media، از ابزار Nano Banana استفاده کرد. این زبانه‌ها در تصاویر زیر مشخص شده‌اند.

محیط Google AI Studio برای تولید تصاویر

در صفحه‌ای که باز می‌شود، ستون تنظیمات در سمت راست صفحه نمایان می‌شود که می‌توان از آن‌ها برای استفاده و تنظیم ویژگی‌های Nano Banana استفاده کرد.

تنظیمات Nano Banana در محیط Google AI Studio
تنظیمات Nano Banana در محیط Google AI Studio

در ادامه گزینه‌های موجود در این قسمت‌ها را بررسی می‌کنیم.

  • Token count: تعداد توکن‌های استفاده‌شده و حداکثر توکن‌های مجاز برای پردازش در هر درخواست
  • Temperature: تعیین میزان خلاقیت یا تنوع خروجی مدل. در این قسمت، هرچه عدد روی مقدار بالاتری تنظیم شود، خروجی خلاقانه‌تر بوده و هرچه عدد کمتر باشد، خروجی دقیق‌تر خواهد بود.
  • Safety settings: تنظیمات ایمنی مدل، برای جلوگیری از تولید محتوای نامناسب.
  • Add stop sequence: می‌توان توکن یا رشته‌ای مشخص کرد که هنگام رسیدن به آن، مدل تولید خروجی را متوقف کند.
  • output length: حداکثر تعداد توکن خروجی که مدل می‌تواند تولید کند.
  • Top P: میزان پراکندگی احتمال انتخاب توکن‌ها. در این قسمت هرچه عدد بالاتر باشد، تنوع انتخاب توکن‌ها بیشتر شده و هرچه عدد پایین‌تر باشد، خروجی محدودتر و پیش‌بینی شده‌تر خواهد بود.

در ستون سمت چپ صفحه، ابزارها و گزینه‌های محیط Google AI Studio پدیدار می‌شود که می‌توان از آن برای گفتگو با مدل، تولید مستقیم تصویر، ساخت اپلیکیشن، مشاهده تاریخچه پرامپت‌ها، فعال‌کردن ذخیره‌سازی خودکار پروژه‌ها و … استفاده کرد.

قدم سوم: نوشتن پرامپت و تولید تصاویر

در نهایت با استفاده از نوشتن پرامپت‌های ساده می‌توان تصاویر مورد نظر را تولید و ویرایش کرد. در این قسمت می‌توان از بارگذاری تصاویر و فایل‌های دستگاه، گوگل درایو، دوربین و نمونه‌های آماده نیز استفاده کرد.

روش افزودن فایل به Nano Banana در Google AI Studio
روش افزودن فایل به Nano Banana در Google AI Studio

پس از ارسال پرامپت و تولید تصویر، با ادامه دادن پرامپت می‌توان تغییراتی روی تصویر تولید شده ایجاد نمود. برای مثال، اگر تصویر گربه‌ای خوابیده تولید شود، می‌توان با ارسال پرامپت مناسب تصویر همان گربه را در حالت نشسته تولید کرد. در ادامه روش‌های نوشتن پرامپت مناسب را بررسی می‌کنیم.

پیشنهاد می‌کنیم برای یادگیری بیشتر در مورد تولید تصویر با استفاده از هوش مصنوعی، مطلب ساخت عکس با هوش مصنوعی با ۱۰ سایت کاربردی مجله فرادرس را مطالعه کنید.

پرامپت نویسی برای Nano Banana

ابزارهای هوش مصنوعی مانند Nano Banana (Gemini 2.5 Flash Image) به طور بهینه با پرامپت‌های انگلیسی کار می‌کنند. پرامپت دستور متنی است که به این ابزار داده می‌شود تا خروجی مورد نظر تولید شود. این مدل با داده‌های متنی و تصویری انگلیسی آموزش دیده است و برای نتایج قابل فهم‌تر و دقیق‌تر نیاز است تا پرامپت‌های وارد شده به زبان انگیسی باشند.

نکته قابل توجه این است که هرچه متن پرامپت با زبان ساده‌تر و واضح‌تر نوشته شود، درک آن برای Nano Banana راحت‌تر است و نتایج دقیق‌تری را تولید می‌کند. در ادامه، روش پرامپت نویسی برای استفاده از برخی از ویژگی‌های مهم Nano Banana را توضیح می‌دهیم.

ساختار کلی پرامپت

برای شروع کار با Nano Banana ابتدا باید پرامپت را با موضوع اصلی مورد نظر آغاز کرد. سپس جزئیات مورد نظر را افزود و نوع هنر، نورپردازی و، زاویه دید و حس صحنه مشخص شود. در نهایت اگر ویرایش خاصی مانند حذف یا افزودن گزینه‌ای مد نظر باشد، به آن اضافه شود. برای مثال، برای تولید تصویر نمای شهری شبانه تهران، به سبک نقاشی ونگوک با قلم‌مو‌های زنده و با ابعداد ۱۶:۹ بدون حضور افراد در آن، پرامپت به شکل زیر نوشته می‌شود.

A night cityscape of Tehran, painted in the style of Van Gogh, with vibrant, swirling brushstrokes, no people present, aspect ratio 16:9.

بهتر است قسمت‌های مختلف پرامپت با علامت «,» از هم جدا شوند. تصویر تولید شده از این پرامپت به شکل زیر است.

نقاشی تهران به سبک نقاشی ونگوگ

همانطور که مشاهده می‌کنید، اشتباهاتی در تولید این تصویر مانند نمای برج میلاد و ابعاد رعایت نشده وجود دارد. برای رفع این مشکل‌ها می‌توان از بارگذاری تصاویر واقعی با ابعاد موردنظر استفاده کرد و از پیش نمایش تصویر در محیط Nano Banana با ابعاد صحیح اسکرین‌شات گرفت. با این‌حال، تغییر ابعاد تصویر یکی از چالش‌های بزرگ کار با Nano Banana است.

پرامپت ویرایش تصویر

در Nano Banana می‌توان تصاویر را ویرایش کرد. این ویرایش می‌تواند شامل بهبود کیفیت تصویر، رنگ‌ها، نورپردازی، تغییر پس زمینه عکس و حذف یا افزودن المان‌هایی به تصویر باشد. برای مثال، برای بهبود کیفیت تصویر ارائه شده بدون تغییر جزئیات آن، پرامپت زیر را به Nano Banana می‌دهیم.

High quality photo, better lighting and clarity, preserve natural colors and original style, do not change objects or composition.
دو تصویر با کیفیت متفاوت از یک مکان
بهبود کیفیت عکس با Nano Banana

پیشنهاد می‌کنیم برای یادگیری بهتر روش ویرایش تصویر با هوش مصنوعی، آ​موزش هوش مصنوعی برای ساخت و ویرایش عکس فرادرس را مشاهده کنید.

پرامپت ویرایش چند مرحله‌ای و حفظ زمینه

یکی از ویژگی‌های مهم Nano Banana این است که می‌توان در آن در چند مرحله تصویر را ویرایش کرد. برای مثال، پس از تغییر رنگ یا پس زمینه یک تصویر می‌توان ویژگی‌های آن، المان‌های آن و … را در چند مرحله تغییر داد. برای مثال، تصویر کنید می‌خواهیم ابتدا کیفیت تصویر زیر را افزایش داده و سپس، تصویر یک گربه و چند کتاب را به آن بیافزاییم.

تصویر پنجره و فرش قرمز
تصویر اولیه

اولین پرامپت مورد استفاده برای بهبود کیفیت تصویر مشابه زیر خواهد بود.

Improve image quality and lighting, do not change objects or composition.
تصویر پنجره و فرش قرمز
تصویر دوم

سپس برای افزودن المان‌های گربه و کتاب به تصویر، کافی است پرامپت زیر را بدون افزودن دوباره تصویر، به Nano Banana بدهیم و تصویر با همان شکل تغییر می‌کند.

add a sleeping cat and some closed colored books on the rug in a good position, keep the details.
تصویر پنجره و فرش قرمز با کتاب و گربه
تصویر نهایی

پرامپت ادغام چند تصویر

یکی دیگر از قابلیت‌های Nano Banana ادغام چند تصویر است. اما باید دقت داشته باشید، برای ادغام بیش از چند تصویر در یک مرحله، نیاز است ابتدا تصاویر مورد نظر خود را در یک تصویر کنار یکدیگر قرار داده و یک کلاژ ایجاد کنید. سپس با استفاده از بارگذاری تصویر اصلی و افزودن تصویر چندتایی، پرامپت را وارد کرده و تصاویر ادغام می‌شوند.

تصویر اتاق خالی به علاوه میز و صندلی اداری، گلدان، کمد و فرش
تصاویر اولیه

برای مثال، تصویر یک کمد، میز و صندلی اداری، گیاه و فرش را به همراه فضای خالی اتاق به این ابزار می‌دهیم و با استفاده از پرامپت زیر می‌خواهیم اتاق را با استفاده از این اجزا چیدمان کند.

decorate this empty room with these objects to have a warm, modern office, keep the details.
تصویر اتاق چیدمان شده با استفاده از Nano Banana

پرامپت ثبات شخصیت / محصول

یکی از کاربردی‌ترین ویژگی‌های Nano Banana حفظ شخصیت یا شیء با جزئیات دقیق در تغییر محیط تصاویر است. برای مثال، می‌توان برای طراحی و ایده‌پردازی تبلیغات و برندینگ، تصویر یک سوژه را در محیط‌ها و ترکیب‌بندی‌های مختلف با نورپردازی‌ها و داستان‌های متفاوت دریافت کرد.

برای مثال با پرامپت‌های زیر از آن خواسته‌ایم تصویر لوگوی فرادرس را برای محصولات تبلیغاتی با فضاهای متفاوت درج کند.

add the logo clearly on a notebook, pen, pencil case, and a poster on the wall, simple and professional advertising style, different camera angles.
لوگوی فرادرس روی دفتر، جامدادی، خودکار و تابلو

پرامپت تغییر نمای تصویر

یکی دیگر از مهم‌ترین ویژگی‌های Nano Banana، تغییر نمای تصویر داده شده است. برای مثال، می‌توان یک تصویر به خصوص را از نماهای متفاوت دریافت کرد. برای مثال می‌توان از پرامپت‌های زیر استفاده کرد.

Different camera angles of the same object: front, side, back, 45-degree, top view, low angle, isometric, close-up, and wide shot.
تصویر کارتونی دختری خندان
تصویر اولیه

یک نمونه از این ویژگی در تصویر زیر مشخص شده است.

زوایای مختلف تصویر با nano banana
تصویر نهایی

همانطور که مشاهده می‌کنید در تصویر نهایی خطاهایی مانند تغییر چهره فرد یا تغییر جزئیات مشاهده شده است. بهتر است برای کاهش چنین خطاهای احتمالی در هر پرامپت تنها یک زاویه مشخص شود و پرامپت‌ها ساده‌نویسی شوند.

یادگیری هوش مصنوعی با فرادرس

برای درک بهتر کار با Nano Banana نیاز است ابتدا با مفاهیمی چون هوش مصنوعی جمنای، نحوه استفاده از هوش مصنوعی گوگل و الگوریتم‌های یادگیری در هوش مصنوعی آشنا شوید. پیشنهاد می‌کنیم برای یادگیری بهتر این مفاهیم به مجموعه فیلم اموزش هوش مصنوعی فرادرس مراجعه کنید که با زبانی ساده ولی کاربردی به توضیح این مفاهیم می‌پردازد.

مجموعه فیلم آموزش هوش مصنوعی فرادرس
برای مشاهده مجموعه فیلم آموزش هوش مصنوعی فرادرس، روی تصویر کلیک کنید.

همچنین، با مراجعه به فیلم‌های آموزش فرادرس که در ادامه آورده شده است، می‌توانید به آموزش‌های بیشتری در زمینه هوش مصنوعی دسترسی داشته باشید.

هزینه استفاده از Nano Banana

در این مطلب از مجله فرادرس با ابزار Nano Banana آشنا شدیم. ابزار ادیت تصویر Nano Banana را می‌توان به صورت رایگان استفاده کرد. اما نسخه رایگان این نرم افزار محدودیت‌هایی مانند تعداد محدود تصاویر یا افزوده شدن واترمارک را دارد. می‌توان نسخه پولی این اپلیکیشن را نیز خریداری کرد که به ازای تعداد مشخصی توکن خروجی، هزینه‌ای را دریافت می‌کند. سایر حالت‌های ورودی و خروجی نیز مطابق با قیمت‌گذاری Gemini 2.5 Flash محاسبه می‌شوند.

source

توسط expressjs.ir