گوگل در مدل Veo 3.1 با معرفی قابلیتهای تولید صوت هماهنگ با تصویر، کنترل سبک بصری و گسترش خودکار صحنهها، گامی بلند در تولید ویدیوهای سینمایی با هوش مصنوعی برداشته است. این مدل که از طریق Gemini API و ابزار Flow در دسترس است، امکان ویرایش پیشرفته و ساخت روایتهای منسجم بصری را برای تولیدکنندگان محتوا فراهم میکند.
گوگل در گامی جسورانه برای آیندهی فیلمسازی با هوش مصنوعی، نسخهی جدید مدل تولید ویدیوی خود یعنی Veo 3.1 را معرفی کرده است. این نسخه از طریق Gemini API، پلتفرم Vertex AI و ابزار Google Flow Video در دسترس توسعهدهندگان و تولیدکنندگان محتوا قرار گرفته است.
Veo 3.1 نسبت به نسخهی قبلی، سریعتر، دقیقتر و خلاقانهتر عمل میکند و با هدف ارائهی کیفیت سینمایی و کنترل بیشتر به فیلمسازان، تولیدکنندگان محتوا و توسعهدهندگان طراحی شده است.
در حالی که نسخههای پیشین توانایی گوگل در ساخت کلیپهای کوتاه باکیفیت از روی متن را نشان داده بودند، Veo 3.1 تمرکز خود را بر داستانگویی، هماهنگی صوت و تصویر، و کنترل سینمایی بیشتر گذاشته است. در ادامه، با پنج قابلیت کلیدی این نسخهی جدید آشنا میشویم.
۱. تولید صدای طبیعی و هماهنگ با تصویر
برای نخستینبار، گوگل در Veo 3.1 امکان تولید صوت بومی و همزمان با ویدیو را فراهم کرده است.
این مدل میتواند دیالوگها، صدای محیط و افکتهای صوتی را بر اساس حس و حرکت صحنه بسازد؛ از صدای آرام خیابان گرفته تا لحظههای پرتنش سینمایی.
به لطف این قابلیت، کاربران میتوانند تنها با یک پرامپت، ویدیویی تقریباً کامل همراه با صدا تولید کنند — قابلیتی که در تمام حالتهای ابزار Flow در دسترس است.
۲. قابلیت «Ingredients to Video» برای کنترل سبک بصری
ویژگی جدید Ingredients to Video به کاربران اجازه میدهد تا حداکثر سه تصویر مرجع برای هدایت تولید ویدیو آپلود کنند.
این تصاویر بهعنوان طرح اولیهی بصری (Blueprint) عمل میکنند تا Veo 3.1 بتواند سبک، کاراکتر یا شیء خاصی را در طول کلیپ حفظ کند.
این ویژگی برای پروژههایی که به تداوم شخصیتها، نمایش محصولات یا روایتهای سبکدار نیاز دارند، تحولبرانگیز است.
۳. تولید ویدیو بین دو فریم ثابت (First-and-Last-Frame Transitions)
این قابلیت امکان تعریف فریم آغاز و پایان را برای ویدیو فراهم میکند تا Veo 3.1 صحنهای پیوسته بین آنها بسازد.
نتیجه، انتقالی سینمایی و نرم از آغاز تا پایان است؛ ابزاری ایدهآل برای فیلمسازانی که میخواهند با تغییر زمان، متافورهای بصری یا گذارهای روایی بازی کنند.
۴. گسترش خودکار صحنهها برای ساخت ویدیوهای بلندتر
قابلیت جدید Scene Extension به Veo 3.1 اجازه میدهد تا ویدیوهای کوتاه را بهطور طبیعی ادامه دهد.
مدل با تحلیل آخرین فریمها، حرکات و اتمسفر صحنه را شناسایی کرده و فریمهای جدیدی تولید میکند که تداوم طبیعی داستان را حفظ میکنند.
این ویژگی به سازندگان کمک میکند ویدیوهایی طولانیتر و منسجمتر بدون نیاز به ادیت دستی بسازند.
۵. ویرایش پیشرفته در Flow با قابلیت حذف و اضافه عناصر
گوگل در کنار Veo 3.1، ابزار Flow را نیز ارتقا داده است. حالا کاربران میتوانند با قابلیتهای Insert و Remove، عناصر خاصی را به صحنه اضافه یا از آن حذف کنند — بدون اینکه نور، پرسپکتیو یا حرکت طبیعی تصویر از بین برود.
این قابلیت هنوز در حال انتشار تدریجی است، اما چشمانداز گوگل را برای ویرایش حرفهای ویدیوهای تولیدشده با هوش مصنوعی نشان میدهد.
آیندهای سینمایی و قابلکنترل برای هوش مصنوعی
Veo 3.1 فقط کیفیت تصویر را افزایش نمیدهد؛ بلکه نحوهی کارگردانی با هوش مصنوعی را تغییر میدهد.
از کنترل صدا و سبک تا حفظ تداوم روایی، این نسخه نشان میدهد که ویدیوهای تولیدی با AI دیگر صرفاً یک دموی فنی نیستند، بلکه ابزاری واقعی برای خلاقان بهشمار میآیند.
در حال حاضر، استودیوهایی مانند Promise Studios و Latitude از Veo 3.1 برای ساخت استوریبوردها و روایتهای کاربرمحور استفاده میکنند — نشانهای از اینکه این فناوری بهزودی وارد جریان اصلی تولید محتوا خواهد شد.
گوگل با گسترش دسترسی به Flow و API، استاندارد جدیدی برای فیلمسازی با کمک هوش مصنوعی تعریف کرده است؛ جایی که خلاقیت انسان و هوش ماشین در یک قاب حرکت میکنند.
source