اگر تا همین یکیدو سال پیش برای ساخت یک ویدیو لیپسینگ طبیعی باید یا جلوی دوربین میایستادی یا هزینهی ادیت و فیلمبرداری میدادی، امروز یک مسیر سادهتر وجود دارد: ساخت ویدیوی لیپسینگ موزیک با هوش مصنوعی؛ آن هم فقط با یک عکس پرتره و یک فایل صوتی/موزیک.
در این راهنما، دقیق و مرحلهبهمرحله (و مناسب برای تولید محتوا در اینستاگرام، تیزرهای کوتاه و ویدیوهای سرگرمی) یک ورکفلو ۳ ابزاری را معرفی میکنم که در عمل، خروجی قابلقبولی میدهد: Nano Banana (در Gemini) برای ساخت پرتره، Seedream برای تغییر استایل، و Wan.ai برای متحرکسازی و لیپسینگ.
برای ادیت ویدئو با هوش مصنوعی کلیک کنید.
این روش برای چه کسانی عالی است؟
- تولیدکنندههای محتوا که نمیخواهند جلوی دوربین باشند اما میخواهند ویدیوهای «انسانی» داشته باشند.
- برندهایی که برای محصول/کمپین به تیزرهای کوتاه و سریع نیاز دارند.
- پیجهای موزیک و سرگرمی که دنبال ایدههای ترندی هستند.
- تیمهای مارکتینگ که میخواهند با هزینهی کم، تنوع محتوایی بالا تولید کنند.
نکته مهم: هرقدر تصویر پایه طبیعیتر و با کیفیتتر باشد، نتیجهی لیپسینگ هم حرفهایتر درمیآید.
ابزارهای موردنیاز برای ساخت ویدیوی لیپسینگ
این مسیر با سه ابزار جلو میرود:
- Nano Banana (مدل تصویری داخل Gemini): ساخت یک پرتره واقعگرایانه با شباهت بالا به عکس مرجع
- Seedream (ویرایشگر تصویر مبتنی بر AI): تغییر لباس/استایل بدون دستکاری چهره
- Wan.ai (متحرکسازی چهره): تولید حرکت لب، چشم و سر (و در برخی حالتها بدن) و ساخت خروجی ویدیویی
اگر دوست داری قبل از شروع، اصول «ساخت تصویر واقعی» را بهتر یاد بگیری، این مطلب هم کمکت میکند: تصویر واقعی با هوش مصنوعی
مرحله ۱: ساخت پرتره دقیق با Nano Banana (در Gemini)
پایهی کل پروژه همینجاست. هدف این مرحله تولید یک پرتره استودیویی، شارپ و طبیعی است که بیشترین شباهت را به عکس مرجع داشته باشد.
چرا Nano Banana؟ چون معمولاً در بازتولید ویژگیهای چهره (فرم بینی، فاصله چشمها، فرم لبها) و همچنین نورپردازی و بافت پوست دقیقتر عمل میکند و همین دقت، در مرحله متحرکسازی باعث میشود دهان و چشمها کمتر «غیرطبیعی» شوند.
پیشنهاد برای عکس مرجع:
- بدون فیلتر، بدون روتوش سنگین
- نور طبیعی یا نور نرم (سایههای تند کار را سخت میکند)
- صورت رو به دوربین و واضح (ترجیحاً نیمرخ نباشد)
پرامپت نمونه (برای Gemini / به انگلیسی):
Create an ultra-realistic, high-resolution black-and-white studio portrait based on the uploaded reference photo…
Negative Prompt: altered face, incorrect likeness, unrealistic lighting, glossy skin, cartoon style, distortion, low resolution.
اگر در این مرحله خروجی خیلی «گلاسه» یا کارتونی شد، Negative Prompt را جدیتر کن و روی “unrealistic lighting / glossy skin / distortion” تاکید بیشتری بده.
مرحله ۲: تغییر لباس و استایل با Seedream یا خود Nano Banana
حالا که پرترهی تمیز داری، وقت هماهنگکردن ظاهر کاراکتر با فضای موزیک است. اینجا دو راه داری:
- Seedream (ویرایش متنی روی تصویر): برای تغییر لباس و اکسسوری سریع و دقیق
- Nano Banana: اگر Seedream در نسخه رایگان خطا داد یا تغییرات را خراب کرد
پرامپت ساده برای تغییر لباس (نمونه):
Now change the outfit. Make the character wear a red hoodie. Do not change the face or overall style of the photo.
نکته استایل (خیلی کاربردی):
- موزیکهای شاد و ترندی: رنگهای روشن، استایل خیابانی، هودی/کت جین/اکسسوری
- موزیکهای احساسی: رنگهای خنثی، لباس ساده، بکگراند خلوت
اگر دنبال ایدههای بیشتر برای تغییر پوشش با AI هستی، این مقاله را ببین: هوش مصنوعی تغییر لباس
مرحله ۳: ساخت ویدیوی لیپسینگ با Wan.ai (دو حالت مهم)
اینجا نقطهای است که عکس به ویدیو تبدیل میشود. Wan.ai معمولاً دو مسیر رایج در اختیار میگذارد:
- Avatar → Photo Animate
برای وقتی که یک حرکت ساده میخواهی (حرکت چشم و سر و کمی لبها) و دنبال تولید سریع هستی. - Avatar → Character Swap
برای وقتی که یک ویدیوی مرجع داری و میخواهی لیپسینگ دقیقتر و طبیعیتری بگیری (دهان دقیقتر روی ریتم/کلمات مینشیند).
پس اگر هدف تو ساخت ویدیوی لیپسینگ موزیک با هوش مصنوعی با دقت بالا است، معمولاً Character Swap انتخاب بهتری است؛ البته به شرط اینکه ویدیوی مرجع مناسب داشته باشی.
آموزش سریع کار با Wan.ai (قدمبهقدم)
طبق روند رایج:
- وارد بخش Generate شو.
- Avatar را انتخاب کن.
- در قسمت Function یکی از این دو را بزن: Photo Animate یا Character Swap
- Quality را روی Standard یا Pro بگذار (در نسخه رایگان معمولاً Standard فعال است).
- در بخش Character Image عکس نهایی (بعد از استایلدهی) را آپلود کن.
- اگر Character Swap را انتخاب کردهای، در Action Video ویدیوی مرجع را هم آپلود کن.
- روی Generate بزن و خروجی را بررسی کن.
اگر نتیجه دهان کمی نامیزان بود، معمولاً با تعویض ویدیوی مرجع (ویدیو با زاویه رو به دوربین و نور خوب) مشکل بهتر میشود.
جدول مقایسه سریع ابزارها برای این ورکفلو
| ابزار | نقش در فرآیند | نکته کلیدی برای نتیجه بهتر |
|---|---|---|
| Nano Banana (Gemini) | ساخت پرتره پایه | شباهت چهره + نور طبیعی = لیپسینگ بهتر |
| Seedream | تغییر لباس/استایل | دستور بده «چهره تغییر نکند» |
| Wan.ai | ساخت حرکت و لیپسینگ | برای دقت بالاتر از Character Swap استفاده کن |
نکات طلایی برای طبیعیتر شدن خروجی لیپسینگ
- پرتره را خیلی «آرایشی/گلاسه» نساز؛ پوست طبیعی بهتر جواب میدهد.
- پسزمینهی شلوغ انتخاب نکن؛ جزئیات زیاد باعث خطا در حرکت میشود.
- اگر با نسخه رایگان Seedream به خطا خوردی، تغییر استایل را دوباره در Nano Banana انجام بده.
- برای انتشار در ریلز/تیکتاک، خروجی را با 9:16 خروجی بگیر یا بعداً کراپ استاندارد انجام بده.
- اگر هدفت تولید انیمیشنهای کوتاه و محتوای متحرک بیشتر است، این مطلب مکمل خوبی است: ساخت انیمیشن با هوش مصنوعی
کاربردهای واقعی: از ریلز سرگرمی تا تیزر تبلیغاتی
با همین ورکفلو میتوانی:
- ریلزهای سرگرمی (میم، ترند موزیک، دیالوگهای معروف) بسازی
- برای محصولات، تیزرهای کوتاه با کاراکتر ثابت تولید کنی
- سناریوهای خلاقانه را بدون فیلمبرداری اجرا کنی
برای ایدههای تبلیغاتی آماده، این لینک هم میتواند کمک کند: ساخت تیزر تبلیغاتی با هوش مصنوعی
جمعبندی + قدم بعدی برای تولید محتوا با DigiMark
اگر یک عکس مرجع خوب داشته باشی، با Nano Banana یک پرتره دقیق میسازی، با Seedream استایل را هماهنگ میکنی و در Wan.ai خروجی ویدیویی میگیری؛ یعنی عملاً ساخت ویدیوی لیپسینگ موزیک با هوش مصنوعی از حالت «ایده» به یک کار اجراییِ سریع و قابل انتشار تبدیل میشود.
اگر میخواهی این مدل تولید محتوا را برای پیج/برندت سیستماتیک کنی (سناریو، ایده، تولید سریالی و حتی بهینهسازی برای جذب)، در دیجی مارک میتوانی از سرویسهای هوش مصنوعی برای سرعتدادن به تولید محتوا و رشد ارگانیک استفاده کنی.
سوالات متداول (FAQ)
1) آیا میشود فقط با یک عکس، ویدیوی لیپسینگ طبیعی ساخت؟
بله. با یک عکس پرترهی باکیفیت و ابزارهایی مثل Wan.ai میشود خروجی قابلقبول گرفت؛ طبیعی بودن به کیفیت عکس و ویدیوی مرجع (در Character Swap) وابسته است.
2) برای شروع، Photo Animate بهتر است یا Character Swap؟
برای شروع و تست سریع، Photo Animate سادهتر است. برای لیپسینگ دقیقتر و حرفهایتر، Character Swap معمولاً نتیجه بهتر میدهد.
3) چرا پرتره سیاهوسفید پیشنهاد میشود؟
در بسیاری از مدلها، سیاهوسفید کمک میکند تمرکز روی نور و بافت پوست بالا برود و تصویر کمتر «فانتزی/کارتونی» شود. البته رنگی هم شدنی است.
4) اگر Seedream خطا داد یا تصویر را خراب کرد چه کنم؟
یک راه عملی این است که همان تغییر لباس را دوباره با Nano Banana انجام بدهی و حتماً تاکید کنی «چهره تغییر نکند».
5) برای اینستاگرام خروجی را با چه تنظیماتی منتشر کنم؟
ترجیحاً 1080×1920 (نسبت 9:16) و حجم بهینه. اگر خروجی افقی بود، بعداً کراپ یا بکگراند بلِر اضافه کن.



