تصویرسازی با کلمات
گاهی اوقات یک تصویر میتواند مفهومی را میرساند که شاید با هزاران کلمه نتوان بیان کرد؛ اما برای خلق یک نقاشی نیازی به هزاران کلمه نیست. حالا دیگر با ورود هوش مصنوعی به حوزه هنر و تصویرسازی، میتوانید تصورات خود را در قالب چند کلمه بیان کنید و سپس با کمی آزمونوخطا تصویر موردنظر خود را تحویل بگیرید.
خیلی وقتها در اینترنت به تصاویری بر میخوریم که از زیبایی و جزئیات آن تعجب میکنیم و این سؤال برایمان پیش میآید که کدام ذهن خلاق و هنرمندی چنین اثر زیبایی را خلق کرده است. تا همین چند سال پیش تنها نتیجهای که میتوانستیم بگیریم این بود که این تصویر توسط یک هنرمند بسیار بااستعداد یا یک فتوشاپ کار خیلی باحوصله طراحی شده است.
اما حالا با ورود هوش مصنوعی به حوزه خلق تصاویر دیجیتالی با استفاده از متن ورودی توسط کاربر، هنرمندان آثار تجسمی یک رقیب جدید پیدا کردهاند. حالا دیگر هر کسی میتواند با استفاده از هوش مصنوعی میدجورنی هنرمند درون خود را بیدار کند و با توصیف تصویری که در ذهن دارد، کار خلق آن را به هوش مصنوعی بسپارد.
تا کنون پلتفرمهای متعددی برای تبدیل متن به تصویر ساخته شدهاند که از میان آنها نامهایی مثل DALL-E 2، Stable Diffusion و Adobe Firefly اشاره کرد. در این مقاله ما قصد داریم شما را با معروفترین آنها یعنی میدجورنی (Midjourney) آشنا کنیم. در سایت اکانت فور آل راهکار سادهای به کاربران ایرانی نشان خواهیم داد که بتوانند به سادگی از امکانات این ابزار نوین استفاده کنند.
میدجورنی چیست؟
میدجورنی یک پلتفرم مبتنی بر هوش مصنوعی است که به طور تخصصی برای تبدیل متن به تصویر طراحی شده است. میدجورنی میتواند توصیف متنی شما از تصویر ذهنیتان را با استفاده از هوش مصنوعی و الگوریتمهای یادگیری عمیق به تصاویری شبیه به عکسهای واقعی تبدیل کند. در واقع میتوان گفت که با میدجورنی برای خلق تصاویر هنری نیازی به مهارت نقاشی ندارید.
میدجورنی در سال 2022 توسط کارآفرین آمریکایی، دیوید هولز (David Holz) پایهگذاری شد و از زمان تا کنون توانسته است تاثیر عمیقی بر دنیای تصویرسازی دیجیتالی بگذارد. میدجورنی از نظر کیفیت و دقت تصاویر بسیار بهتر از ابزارهایی مانند DALL-E 2 ، که زودتر از میدجورنی آغاز به کار کرد، عمل میکند.
این پلتفرم بر خلاف دیگر تکنیکهای خلق تصویر میتواند طرحها، بافتها و ساختارهای موجود در میلیونها تصویر موجود در بانک اطلاعاتیاش را درک و تقلید کرده و سپس تمام این اجزای مختلف را به شکل معنیداری با یکدیگر ترکیب کند.
میدجورنی برای خلق تصاویر از توضیحات ارائه شده توسط کاربر به زبان طبیعی (متن) و همچنین مدل تصویرسازی انتشاری (Diffusion Model) برای خلق تصویر استفاده کند.
طریقه استفاده از میدجورنی
در حال حاضر تنها راه دسترسی به میدجورنی استفاده از بات آن در نرمافزار دیسکورد است. اگر تا حالا از دیسکورد استفاده نکردهاید باید اول به صفحه دانلود دیسکورد مراجعه کنید و آن را روی مرورگر، کامپیوتر یا گوشی خود نصب کرده و اکانت خود را بسازید.
بعد از ساخت اکانت دیسکورد به سایت میدجورنی بروید روی دکمه Join the Beta کلیک کنید.
بعد از کلیک به سایت اصلی دیسکورد منتقل میشوید.
در کادر باز شده روی دکمه Already have an account کلیک کنید و وارد شوید. برای ورود سریع میتوانید از طریق اسکن بارکد ارائه شده
با اپلیکیشن دیسکورد گوشی خود استفاده کنید. بعد از ورود به اپلیکیشن دیسکورد میبینید آیکون میدجورنی که به شکل یک قایق با پسزمینه سفید است، به لیست کانالهای شما اضافه شده است.
بعد از ورود به کانال میدجورنی برای دسترسی به بات آن کافی است وارد یکی از اتاقهایی که با نام Newbies مشخص هستند شوید و با پرامپت یا دستور / Imagine کار خود را آغاز کنید. در نسخه رایگان تنها امکان تولید 25 تصویر در کانالهای عمومی را دارید و بعد از پایان اعتبار باید اشتراک ماهانه آن را خریداری کنید.
البته اگر اکانت میدجورنی را خریداری کرده باشید این امکان را دارید که تصاویر را در کانال اختصاصی خودتان و نه در کانالهای عمومی تولید کنید. برای این کار ابتدا یک کانال خصوصی برای خودتان بسازید و سپس با در کانال دیسکورد میدجورنی رو دکمه view members در کنار کادر جستجوی بالای صفحه و سپس روی Midjourney Bot کلیک کرده و آن را به سروری که تازه ساختهاید اضافه کنید.
ساختار کلی پرامپت در میدجورنی
همانطور که در تصویر پایین مشخص است هر پرامپت میتواند بهسادگی یک کلمه، یک جمله باشد. حتی این امکان وجود دارد که شما بهجای متن لینک تصویر موردنظر خود را به میدجورنی بدهید و بعد بهتدریج تغییرات موردنظر خود را اعمال کنید.
برای مثال من از میدجورنی خواستم که تصویر یک عکاس به تصویر بکشد که در حال بالارفتن از کوه سعی دارد از یک دایناسور عکسبرداری کند. بعد از چند دقیقه میدجورنی چهار تصویر مختلف را به من نشان داد.
در پایین تصویر چهار دکمه به نامهای (U1,U2,U3,U4) که با کلیک روی هر کدام نسخه بزرگ شده هر کدام به نمایش در خواهد آمد. البته شما میتوانید با کلید روی دکمههای (V1,V2,V3,V4) از میدجورنی بخواهید که نسخههای جدیدتری بر اساس تصویر انتخابی شما ایجاد کند.
من با کلیک روی V4 از میدجورنی خواستم که نسخههای بیشتری از تصویر چهارم را تولید کند و بعد با کلیک روی U4 نسخه بزرگتر و کامل تصویر موردنظر خودم را تحویل گرفتم.
برای گرفتن نتایج بهتر در میدجورنی بهتر است که دستور یا پرامپت شما از یک ساختار مشخص پیروی کند. البته میدجورنی بدون رعایت این ساختار هم به شما نتایج خوبی ارائه میدهد؛ اما برای اینکه تصویر نهایی مطابقت بهتری با تصور شما داشته باشد بهتر است یاد بگیرید از این ساختار کلی استفاده کنید:
- نوع تصویر یا مدیوم: در این بخش بهتر است نوع تصویر یا رسانه موردنظر خود را که میتواند یک نقاشی، عکس، کارت ویزیت، لوگو یا هر چیز دیگری باشد را مشخص کنید. البته هر نوع تصویر میتواند انواع مختلفی داشته باشد که معرفی همه آنها در این مقاله ممکن نیست.
- فرم هنری/ قاببندی: فرم یا استایل هنری در حقیقت یک توضیح اضافی برای مدیوم شما محسوب میشود. برای مثال اگر مدیوم شما عکس باشد، فرم هنری آن را میتوان بهصورت واقعگرایانه، انیمیشن، کارتون یا با اشاره مستقیم به آرتیست موردنظر شما، مثلاً تیم برتون، تعریف شود. برای مثال فرم هنری انیمیشن را میتوان بهصورت انیمیشنهای پیکسار، انیمههای ژاپنی یا والتدیزنی تعریف کرد. قاببندی و فرم هنری مکمل یکدیگر هستند. برای مثال فرم هنری انیمیشن را میتوان بهصورت انیمیشنهای پیکسار، انیمههای ژاپنی یا والتدیزنی و قاببندی آن بهصورت نمای دور، کلوزآپ، دید از بالا، ماهوارهای و مانند آن تعریف شود.
- صحنه: صحنه در واقع توضیح لوکیشن و مشخصات کاراکتر موردنظر شماست. مثلاً میتوان صحنه موردنظر بهصورت یک کافیشاپ شلوغ و کاراکتر خود را به شکل یک مرد شیکپوش با عینک آفتابی و قد بلند توصیف کرد.
- تنظیمات نهایی: در این قسمت شما بهتر است تنظیمات نهایی مثل تصویر پسزمینه، نوع لباس، رنگبندی، فصلها یا هر تنظیمات دیگری را مشخص کنید
- پارامترها: پارامترها در واقع دستورات مشخصی هستند که باید در انتهای پرامپت شما و با دو خط تیره (–) اضافه شوند و هر کدام کار خاصی را انجام میدهند. یکی از کارهایی که میتوانید با پارامترها انجام دهید این است که به میدجورنی بگویید که چه کارهایی را باید یا نباید انجام دهد. برای مثال با پارامتر –ar نسبت طول و عرض تصویر، با پارامتر –q کیفیت تصویر را تنظیم کرد و با پارامتر –no میتوان عنصر یا جزئیات موردنظر را از تصویر حذف کرد.
پس ساختار پیشنهادی ما برای پرامپتهای میدجورنی به این شکل است:
/Imagine prompt پارامترها، تنظیمات نهایی، صحنه، فرم هنری/ قاببندی، مدیوم
البته همانطور که گفتیم هیچ فرمول دقیقی برای کار با میدجورنی وجود ندارد؛ اما با استفاده از فرمول پیشنهادی ما و اضافه کردن جزئیات و پارامترهای تخصصی میتوانید نتایج بهتری بگیرید.
با توجه به توضیحات این ابزار برای استفاده در صنعت های مختلف میتوانید برای تهیه اکانت میدجورنی روی لینک کلیک کنید و از مسیری که در مطلب بالا به شما توضیح داده شده این ابزار را فعال کرده و به راحتی استفاده کنید.
کاربردهای میدجورنی
شما با استفاده از میدجورنی و دیگر ابزارهای جدید هوش مصنوعی میتوانید در وقت و هزینه خود صرفهجویی زیادی بکنید و انرژی خود را بهجای طراحی و تولید محتوا به بخش فروش و بازاریابی منتقل کنید.
در مورد میدجورنی کسبوکار شما میتواند به شکلهای مختلفی از امکانات این هوش مصنوعی برای توسعه و پیشرفت خود استفاده کند که در ادامه به چند مورد از کاربردهای آن اشاره میکنیم.
ساخت لوگو با ابزار میدجورنی
ساخت لوگو یکی از اولین کارهایی که صاحبان کسبوکارها باید انجام دهند؛ اما برای طراحی یک لوگوی باکیفیت و جذاب باید هزینه نسبتاً زیادی (گاهی اوقات تا چند میلیون تومان) پرداخت کرد و لوگوهایی که با استفاده از سایتها و تصاویر موجود در اینترنت ساخته میشوند هیچگاه آن اصالت و کیفیت لوگوهای حرفهای را ندارند.
البته لوگویی که میدجورنی به شما تحویل میدهد کیفیت چندان بالایی ندارد و معمولاً متن آن هم باید اصلاح شود که با استفاده از نرمافزارهایی مثل Adobe Illustrator، Conva و Photoshop میتوان هم کیفیت تصویر را بالا برد و هم متن موردنظر خود را به آن اضافه کرد.
من از میدجورنی خواستم که یک نماد (Emblem) برای یک گروه کوهنوردی و طبیعتگردی بسازد. نوع تصویر لوگو تعیین و برای فرم هنری آن از دو سبک نقاشی چسبرنگ (تمپورا) و زغال استفاده شد.
شما میتوانید از لوگوهای تولید شده برای وبسایت، کارت ویزیت، بنرهای تبلیغاتی و بهطورکلی همه نیازهای تبلیغات دیجیتالی و چاپی کسبوکار خود استفاده کنید.
تولید تصاویر متناسب با محتوای وبسایت یا شبکه های اجتماعی
پیدا کردن تصاویر برای مطالب وبسایت و شبکههای اجتماعی با استفاده از موتورهای جستجو معمولاً نتایج یکسان و شبیه به همی دارد و استخدام یک گرافیست باتجربه با حقوق بالا هم برای کسبوکارهای تازهکار و کوچک انتخاب به صرفهای نیست.
با استفاده از میدجورنی کافی است که شما تصویر مناسب با محتوای خود را برای میدجورنی توضیح دهید و با کمی آزمونوخطا و طی چند دقیقه صاحب یک تصویر یونیک و باکیفیت شوید که کاملاً با محتوای شما مطابقت داشته باشد.
فرض کنید که شما مطلبی در مورد سربازان ایرانی در دوره ساسانیان نوشتهاید و میخواهید تصویری متناسب با آن به متن اضافه کنید. من از میدجورنی خواست که تصویری از یک واحد نظامی دوره ساسانیان در حال آماده شدن برای نبرد تولید کند. البته شاید از نظر تاریخی چندان دقیق نباشد؛ اما کمی سعی و خطا میتوان آن را اصلاح کرد.
کاربرد میدجورنی در معماری
معماران یا دانشجوهای رشته معماری میتوانند از میدجورنی برای طراحی مفهومی و تولید و مشاهده نسخههای متفاوت و متنوع پروژه خود، بدون نیاز به طراحیهای پیچیده و زمانبر و کامپیوترهای رندرینگ قوی، استفاده کنند.
سرعت بسیار بالای میدجورنی در تولید تصاویر، و امکان سفارشیسازی بسیار بالای آنها باعث میشود که شرکتهای معماری کوچکتر هم بتوانند امکان رقابت با شرکتهای مجهز و پیشرفته داشته باشند.
البته ساختار پرامپتهای مورد نیاز برای تولید تصویر برای پروژههای معماری کمی با بقیه متفاوت و باید در آن سبک معماری، مصالح بهکاررفته، نوع نمای ساختمان و دیگر جزئیات موردنظر مشخص شده باشد. دقت کنید که کاربرد میدجورنی در معماری فقط برای مشاهده نمای کلی یک ساختمان یا طرح نیست و شما میتوانید پس از مشخصکردن سایر جزئیات ساختمان طراحی داخلی، حیاط، آشپزخانه یا نمای لابی ساختمان را به تصویر بکشید.
من در این مثال از میدجورنی خواستم یک ویلای کنار ساحل مدرن با دیوارهای شیشهای گران قیمت و استخر بدون لبه بسیار لوکس را برایم به تصویر بکشد. دقت کنید که این یک مثال خیلی ساده برای کاربرد میدجورنی در معماری است و شما میتوانید با یادگرفتن دستورات مخصوص این کار تصاویر شگفتانگیزی خلق کنید.
طراحی وبسایت با میدجورنی
میدجورنی میتواند آیکون، لوگو، رابط کاربری، عکس محصول و دیگر نیازهای گرافیکی یک طراح وبسایت را در یک پکیج کامل ارائه دهد. البته برای طراحی یک وبسایت باید از ابزارهای زیادی استفاده کرد و استفاده از میدجورنی به تنهایی کافی نیست اما میتوان گفت حداقل از نظر ایدهپردازی بسیار مفید خواهد بود.
علاوه بر موارد ذکر شده یکی از بهترین کاربردهای میدجورنی برای طراحان وبسایت تولید تصویر از رابط کاربری (UI Screen) است. البته برای استفاده از تصاویر تولید شده باید آنها را توسط یک طراح رابط کاربری مسلط به نرمافزارهای گرافیکی دوباره پیادهسازی کرد؛ اما مشاهده نمای کلی رابط کاربری پیش از اتمام کار موهبتی ست که هیچ طراحی نمیتواند از آن چشمپوشی کند.
در تصویر بعدی من از میدجورنی خواستم که یک رابط کاربری باکیفیت بالا و یک رابط کاربری تمیز برای اپلیکیشن موبایل یک فروشگاه کتاب آنلاین تولید کند.
سخن آخر
قدرت تصویرسازی میدجورنی و کاربردهای آن به معنای واقعی کلمه شگفتانگیز است. البته ممکن است تصویر نهایی دقیقاً با تصور ذهنی شما مطابقت نداشته باشد و تصویر تولید شده همواره با کمی چاشنی شانس و اقبال همراه است ولی میتوانید مطمئن باشید که نتیجه کار شما را شگفتزده خواهد کرد.
الگوریتم و هوش مصنوعی میدجورنی مدام در حال بهبود و پیشرفت است و اخیراً نسخه 2/5 آن در دسترس عموم قرار گرفته است. عکسهای تولید شده توسط میدجورنی و دیگر ابزارهای مشابه رفته رفته واقعیتر میشوند و به زودی تشخیص آنها از یک عکس واقعی غیر ممکن خواهد بود.
بزرگترین رقیب میدجورنی در زمینه تصویرسازی DALL-E 2 است که همانطور که گفتیم چند ماه قبل از میدجورنی آغاز به کار کرد. هر دوی این پلتفرمها تصاویر درخشان و فوقالعادهای تولید میکنند و هر دو ارزش خرید بالایی دارند. در پایان بد نیست این دو پلتفرم را از نظر کاربرد، قیمت، رابط کاربری و دقت تصاویر تولید شده با هم مقایسه کنیم و با کلیک روی لینک میتوانید اکانت DALL-E را تهیه کنید.
- تصاویر تولید شده توسط DALL-E 2 جزئیات بهتری دارند و واقعیتر به نظر میرسند؛ اما تمرکز میدجورنی روی خلاقیت و تنوع بیشتر است.
- کیفیت تصاویر تولید شده توسط میدجورنی میتواند تا رزولوشن 1280*2048 تنظیم شود اما این کیفیت در DALL-E 2 حداکثر 1024*1024 پیکل است.
- قیمت بستههای DALL-E 2 از حداقل 15 دلار برای 460 پرامپت آغاز میشود که البته برای ماه اول ثبتنام 50 کردیت یا اعتبار بهصورت رایگان دریافت میکنید. در میدجورنی برای شروع تنها 25 کردیت دریافت میکنید و باید برای خرید اشتراک بیسیک 10 و اشترک استاندارد 30 دلار در ماه پرداخت کنید.
- میدجورنی از طریق بات دیسکورد قابل دسترسی است و DALL-E 2 بهصورت نسخه تحت وب و از طریق مرورگر اینترنت شما.