ভিএফএক্সের জন্য কমফিইউআই: ভূমিকা, ইনস্টলেশন এবং কর্মপ্রবাহ

  • ComfyUI-তে ওয়ার্কফ্লো ধারণা: মেটাডেটা না হারিয়ে কীভাবে সংরক্ষণ, আমদানি এবং রপ্তানি করা যায়।
  • FLUX: প্রো, ডেভ এবং শনেল সংস্করণ, প্রয়োজনীয়তা এবং ComfyUI তে কীভাবে ইনস্টল করবেন।
  • Txt2Img, Img2Img, LoRA, ControlNet, Inpainting, NF4, IPAdapter এবং Upscale-এর জন্য কীভাবে করবেন তার নির্দেশিকা।

আরামদায়ক ইউআই

আপনি যদি ভিএফএক্স-এ কাজ করেন এবং আপনার জেনারেটিভ ইমেজ ওয়ার্কফ্লোকে পরবর্তী স্তরে নিয়ে যেতে আগ্রহী হন, তাহলে ComfyUI অবশ্যই আপনার জন্য উপযুক্ত। এর নোড-ভিত্তিক পদ্ধতি, মডুলারিটি এবং FLUX যে শক্তি যোগ করে এটি কন্ট্রোলনেট, আইপি-অ্যাডাপ্টার, অথবা লোরা প্রশিক্ষণের মাধ্যমে উচ্চ-বিশ্বস্ততা text2img থেকে শুরু করে জটিল পাইপলাইন পর্যন্ত সবকিছু অন্বেষণের জন্য এটি একটি আদর্শ পরিবেশ করে তোলে। VFX এর জন্য ComfyUI: ইনস্টলেশন এবং FLUX কর্মপ্রবাহ ব্যাখ্যা করা হয়েছে.

এই নির্দেশিকায় আপনি একটি সুসংগঠিত উপায়ে আপনার প্রয়োজনীয় সবকিছু পাবেন: ComfyUI-তে একটি ওয়ার্কফ্লো কী, কীভাবে এটি সংরক্ষণ এবং ভাগ করবেন, ধাপে ধাপে FLUX কীভাবে ইনস্টল করবেন, আপনার কী হার্ডওয়্যার প্রয়োজন এবং সর্বাধিক ব্যবহৃত প্রবাহগুলির একটি স্পষ্ট ব্যাখ্যা (Txt2Img, Img2Img, Inpainting, LoRA, ControlNet, NF4, IPAdapter এবং ল্যাটেন্ট স্কেলিং)। VRAM কমানোর জন্য আপনি FP8, NF4, অথবা GGUF এর মতো বিকল্পগুলিও দেখতে পাবেন।ক্লাউডে ফ্লাক্স ব্যবহারের জন্য রিসোর্স এবং ব্যবহারিক টিপস সহ একটি উইন্ডোজ-অপ্টিমাইজড ComfyUI ইনস্টলেশন।

ComfyUI তে ওয়ার্কফ্লো কী?

নোড যোগ করে আপনি যে জেনারেশন প্রক্রিয়াটি তৈরি করেন তার একটি দৃশ্যমান উপস্থাপনা হল একটি ওয়ার্কফ্লো। তুমি এটাকে লেগো-টাইপ টুকরোর বোর্ড হিসেবে কল্পনা করতে পারো।প্রতিটি নোড একটি ফাংশন সম্পাদন করে (মডেল লোড করা, টেক্সট এনকোডিং, স্যাম্পলিং, ডিকোডিং ইত্যাদি) এবং সংযোগগুলি চূড়ান্ত চিত্র প্রাপ্ত না হওয়া পর্যন্ত তথ্য অনুসরণ করে এমন পথ বর্ণনা করে।

বাস্তুতন্ত্র বিশাল: স্থির চিত্র, ভিডিও, অডিও এমনকি 3D ওপেন-সোর্স কমিউনিটির কারণে এগুলো সহাবস্থান করে। নেতিবাচক দিক হলো, এখানে শেখার একটা ধারা আছে, কারণ প্রতিটি উপাদান কী করে এবং কীভাবে বাধা বা অসঙ্গতিপূর্ণ ফলাফল এড়াতে কার্যকরভাবে তাদের একত্রিত করা যায় তা বোঝা গুরুত্বপূর্ণ।

দ্রুত শুরু করার জন্য, অফিসিয়াল এবং বেসিক ফ্লো (text2img এবং img2img) দেখে নেওয়া এবং তারপরে আরও জটিল নোডগুলিতে যাওয়া ভাল। কমিউনিটি ডকুমেন্টেশন এবং অফিসিয়াল ComfyUI উদাহরণ এগুলি ঘন ঘন আপডেট করা হয়, তাই নতুন সংস্করণের সাথে পরিবর্তিত কর্মপ্রবাহগুলি পুনরায় শুরু করা বা পর্যালোচনা করা সহজ।

একটি গুরুত্বপূর্ণ বিশদ: ComfyUI ওয়ার্কফ্লোকে চূড়ান্ত ছবিতে (PNG) মেটাডেটা হিসেবে এম্বেড করতে পারে। এটি আপনাকে শুধুমাত্র ছবিটি ভাগ করে নিতে এবং সম্পূর্ণ গ্রাফটি পুনরুদ্ধার করতে দেয়। এটিকে ইন্টারফেসে টেনে আনছি।

কর্মপ্রবাহের মাধ্যমে কীভাবে শিখবেন এবং অগ্রগতি করবেন

আমার পরামর্শ হল উইকি-টাইপ রিসোর্স এবং কমিউনিটি গ্যালারিতে প্রকাশিত সহজ উদাহরণ দিয়ে শুরু করা। একটি যৌক্তিক অগ্রগতি হল: Txt2Img, Img2Img, এবং তারপর ControlNet অথবা LoRAইনপুট, আউটপুট এবং পরিকল্পনাকারীরা কীভাবে নমুনা গ্রহণকে প্রভাবিত করে তা বুঝতে পারলে, গাইড নোড, মাস্ক এবং অতিরিক্ত শর্তাবলী অন্তর্ভুক্ত করা স্বাভাবিক হয়ে উঠবে।

আপনি যদি বিভিন্ন টপোলজি দেখতে চান, তাহলে পাবলিক ফ্লো এবং পুনরুৎপাদনযোগ্য উদাহরণ সহ পৃষ্ঠাগুলির সংগ্রহস্থল রয়েছে যেখানে আপনি মেটাডেটা বা .json ফাইল সহ ছবি ডাউনলোড করতে পারেন। আমদানি করা, যেমন আছে তেমন চালানো এবং তারপর প্যারামিটারের মাধ্যমে পুনরাবৃত্তি করা ভালো অভ্যাস। সম্পূর্ণ ব্লকটি না ভেঙে প্রতিটি ব্লকের প্রভাব বোঝার জন্য।

ক্লাউড প্ল্যাটফর্মগুলিতে আপনি স্থানীয় নির্ভরতার সাথে লড়াই না করে পাইপলাইন চালানোর জন্য পূর্ব-কনফিগার করা পরিবেশও পাবেন। সুবিধা হলো, তারা ভারী নোড এবং মডেল প্রিলোড করে।তবে, ফলাফল প্রত্যাশা পূরণ করছে কিনা তা নিশ্চিত করার জন্য উপলব্ধ সংস্করণ এবং VRAM পরীক্ষা করা যুক্তিযুক্ত।

ComfyUI-তে কর্মপ্রবাহ সংরক্ষণ, আমদানি এবং রপ্তানি করা

ComfyUI দুটি প্রধান সঞ্চয় পদ্ধতি সমর্থন করে: মেটাডেটা (PNG) অথবা JSON ফাইল সহ ছবি গ্রাফের। প্রথমটি ফোরামে শেয়ার করার জন্য সবচেয়ে সুবিধাজনক; দ্বিতীয়টি আপনাকে ফাইলের স্পষ্ট নিয়ন্ত্রণ দেয়, যা সংস্করণের জন্য কার্যকর।

আমদানি করতে, কেবল PNG বা Json ফাইলটি ইন্টারফেসে টেনে আনুন, অথবা Ctrl (Command) + O শর্টকাট ব্যবহার করুন। এক্সপোর্ট করার জন্য, আপনি জেনারেট করা ছবিটি সংরক্ষণ করতে পারেন অথবা JSON এর জন্য এক্সপোর্ট মেনু ব্যবহার করতে পারেন।ছবি সংকুচিত বা স্থানান্তর করার সময় সাবধান থাকুন: কিছু সংকোচন পদ্ধতি এবং নির্দিষ্ট চ্যানেল মেটাডেটা সরিয়ে দেয়, যার ফলে আপনি এমবেডেড ওয়ার্কফ্লো হারাতে পারেন।

ComfyUI-তে কর্মপ্রবাহ

ComfyUI এর ক্রমাগত বিবর্তনের কারণে, সমস্ত পুরানো JSON ফাইল নতুন সংস্করণে কাজ করে না।যদি কিছু ভুল হয়ে যায়, তাহলে ফ্লোটি খুলুন, অপ্রচলিত নোডগুলি প্রতিস্থাপন করুন, অথবা তাদের সামঞ্জস্যপূর্ণ সংস্করণ দিয়ে নির্ভরতা পুনরায় ইনস্টল করুন; ComfyUI-Manager ব্যবহার করলে অনুপস্থিত উপাদানগুলি সনাক্ত করা এবং সমাধান করা অনেক দ্রুত হয়।

ComfyUI-তে FLUX: এটি কী এবং কেন এটি গুরুত্বপূর্ণ

FLUX.1 হল ব্ল্যাক ফরেস্ট ল্যাবসের মডেলগুলির একটি পরিবার যা উচ্চ-বিশ্বস্ততা টেক্সট-টু-ইমেজ রূপান্তরের উপর দৃষ্টি নিবদ্ধ করে। প্রায় ১২ বিলিয়ন প্যারামিটার সহ এর হাইব্রিড আর্কিটেকচার এটি প্রম্পট মেনে চলা, জটিল দৃশ্য পরিচালনা এবং ছবির মধ্যে সুস্পষ্ট টেক্সট তৈরির জন্য অপ্টিমাইজ করা হয়েছে, এমন একটি কাজ যেখানে অন্যান্য মডেল প্রায়শই ব্যর্থ হয়।

আরেকটি সুবিধা: এর বহুমুখীতা। ফটোরিয়ালিজম থেকে শৈল্পিক শৈলীতেFLUX.1 তার ভিজ্যুয়াল ধারাবাহিকতা এবং বিশদ বিবরণের জন্য আলাদা, যার মধ্যে হাতের রেন্ডারিংও রয়েছে, যা জেনারেটিভ গ্রাফিক্সের একটি ক্লাসিক দুর্বল দিক। এতে অবাক হওয়ার কিছু নেই যে এটি স্টেবল ডিফিউশন বা মিডজার্নির মতো সমাধানের সাথে তুলনা করা হয়েছে, যা ব্যবহারের সহজতা এবং মানের দিক থেকে শীর্ষে রয়েছে।

ব্ল্যাক ফরেস্ট ল্যাবস প্রতিষ্ঠা করেছিলেন রবিন রোমবাখ, যিনি স্ট্যাবিলিটি এআই-এর মূলে কাজ করা একজন গুরুত্বপূর্ণ ব্যক্তিত্ব। যদি তুমি সরাসরি দেখতে চাও, এর অফিসিয়াল ওয়েবসাইটটি হল blackforestlabs.ai সম্পর্কে.

FLUX.1 তিনটি ভেরিয়েন্টে বিতরণ করা হয়েছে: প্রো, ডেভ এবং শ্নেলপ্রো পেশাদার পরিবেশের জন্য সর্বোচ্চ মানের অফার করে; ডেভ অ-বাণিজ্যিক ব্যবহারের জন্য ডিজাইন করা হয়েছে এবং এর ভারসাম্য চমৎকার; শ্নেল গতি এবং হালকাতার উপর জোর দেয় এবং অ্যাপাচি ২.০ লাইসেন্সের অধীনে এটি ওপেন সোর্স।

FLUX সংস্করণ অনুসারে হার্ডওয়্যারের প্রয়োজনীয়তা

FLUX.1 Pro এর জন্য, এটি সুপারিশ করা হয় ২৪ জিবি ভিআরএএম সহ এনভিআইডিআইএ আরটিএক্স ৪০৯০ টাইপ জিপিইউ৩২ জিবি র‍্যাম এবং একটি দ্রুত SSD। বক্সিং-এর বাইরে যাওয়া এড়াতে এটি FP16 ব্যবহার করে এবং সর্বোচ্চ মানের জন্য FP16-তে টেক্সট এনকোডার ব্যবহার করাই ভালো।

FLUX.1 Dev-এ, a ১৬ জিবি ভিআরএএম সহ আরটিএক্স ৩০৮০/৩০৯০ এটি ১৬ জিবি র‍্যাম এবং প্রায় ২৫ জিবি ডিস্ক স্পেসের সাথে ভালো কাজ করে। এটি আপনার জিপিইউর উপর নির্ভর করে কিছু ক্ষেত্রে FP16 এমনকি FP8 সমর্থন করে।

FLUX.1 Schnell-এর জন্য, ১৬ জিবি ভিআরএএম সহ আরটিএক্স ৩০৮০/৩০৯০ ৮ জিবি র‍্যাম এবং ১৫ জিবি স্টোরেজই যথেষ্ট। এটি গতির জন্য ডিজাইন করা হয়েছে, যা প্রো/ডেভ ভার্সনের তুলনায় পারফরম্যান্সের কিছুটা ক্ষতি করে।

যদি আপনার স্মৃতিশক্তি কম থাকে, তাহলে কমিউনিটি FP8, NF4, অথবা GGUF এর মতো বিকল্পগুলি অফার করে যা তারা প্রয়োজনীয় VRAM কে অনেকাংশে কমিয়ে দেয়, প্রবাহের উপর নির্ভর করে 6 থেকে 12 GB পর্যন্ত কনফিগারেশন সহ।

ComfyUI তে FLUX ইনস্টল করা: প্রয়োজনীয় পদক্ষেপ

ComfyUI তে FLUX

প্রথমত, নিশ্চিত করুন যে আপনি ব্যবহার করছেন ComfyUI এর সর্বশেষ সংস্করণFLUX ইন্টিগ্রেশনের জন্য নোড এবং বৈশিষ্ট্যগুলির প্রয়োজন হয় যা ঘন ঘন আপডেট করা হয়।

টেক্সট এবং CLIP এনকোডার ডাউনলোড করুন: clip_l.safetensors এবং T5 XXL ফাইলগুলির মধ্যে একটি, হয় t5xxl_fp16.safetensors (যদি আপনার প্রচুর VRAM/RAM থাকে) অথবা t5xxl_fp8_e4m3fn.safetensors (যদি আপনার বাজেট কম থাকে)। এগুলি ComfyUI/models/clip/ ফোল্ডারে রাখুন। আপনি যদি SD3 মিডিয়াম ব্যবহার করে থাকেন, তাহলে আপনার কাছে ইতিমধ্যেই এই ফাইলগুলি থাকতে পারে।.

VAE: ডাউনলোড করুন ae.safetensors সম্পর্কে এবং এটিকে ComfyUI/models/vae/ এ সরান। আরও সহজে খুঁজে পেতে চাইলে এর নাম পরিবর্তন করে flux_ae.safetensors রাখুন। এই VAE চূড়ান্ত ডিকোডিং উন্নত করে এবং এটি মানের চাবিকাঠি।

UNET: এর মধ্যে বেছে নিন flux1-dev.safetensors বা flux1-schnell.safetensors তোমার স্মৃতি অনুসারে, এবং এটি ComfyUI/models/unet/ তে রাখুন। এর মাধ্যমে, আপনার FLUX ফ্লো চালানোর ভিত্তি তৈরি হবে। স্থানীয়

ComfyUI-তে FLUX কর্মপ্রবাহের জন্য একটি ব্যবহারিক নির্দেশিকা

FLUX সহ Txt2Img

উপাদানগুলি লোড করে শুরু করুন: UNETLoader, DualCLIPLoader এবং VAELoaderCLIPTextEncode নোড আপনার প্রম্পট এনকোড করে; EmptyLatentImage প্রাথমিক সুপ্ত চিত্র তৈরি করে; BasicGuider FLUX এর UNET এর সাথে শর্তসাপেক্ষ যুক্তি একত্রিত করে প্রক্রিয়াটি পরিচালনা করে।

এর সাথে নমুনা নির্বাচন করুন KSamplerSelectএটি RandomNoise এর মাধ্যমে শব্দ উৎপন্ন করে এবং BasicScheduler এর মাধ্যমে সিগমা র‍্যাম্প সংজ্ঞায়িত করে। SamplerCustomAdvanced সবকিছুকে একত্রিত করে: নয়েজ, গাইড, স্যাম্পলার, সিগমাস এবং ল্যাটেন্ট। অবশেষে, VAEDecode সুপ্ত সংকেতটিকে একটি ছবিতে রূপান্তর করে। এবং SaveImage দিয়ে আপনি ফলাফল সংরক্ষণ করতে পারবেন।

FLUX সহ Img2Img

পাইপলাইনটি একটি শুরুর চিত্র যুক্ত করে: লোড ইমেজ + ইমেজস্কেল আকারটি সামঞ্জস্য করা হয়, এবং VAEEncode এটিকে ল্যাটেন্টে সেট করে। প্রম্পটটি CLIPTextEncode দিয়ে এনকোড করা হয় এবং এর শক্তি FluxGuidance দিয়ে সামঞ্জস্য করা হয়। মডেলস্যাম্পলিংফ্লাক্স রিস্পেসিং এবং মাত্রা নিয়ন্ত্রণ করেKSamplerSelect, RandomNoise, এবং BasicScheduler স্যাম্পলিং পরিচালনা করে। SamplerCustomAdvanced ইনপুট ল্যাটেন্টের সাথে কন্ডিশনালকে মার্জ করে, এবং VAEDecode আউটপুট তৈরি করে।

FLUX সহ LoRA

স্টাইল বা বৈশিষ্ট্যগুলিকে পরিমার্জিত করতে, যোগ করুন LoraLoaderModelOnly সম্পর্কে UNETLoader, DualCLIPLoader, এবং VAELoader এর সাথে। টেক্সট এনকোড করার পরে এবং FluxGuidance প্রয়োগ করার পরে, আপনি EmptyLatentImage দিয়ে ল্যাটেন্ট ইমেজ তৈরি করেন, ModelSamplingFlux দিয়ে স্যাম্পলিং সংজ্ঞায়িত করেন এবং SamplerCustomAdvanced চালান। VAEDecode এর মাধ্যমে আপনি LoRA দ্বারা প্রভাবিত ছবিটি পাবেন. সাধারণ উদাহরণ: flux1-dev-এ realism_lora.safetensors।

LoRA

FLUX সহ কন্ট্রোলনেট

ভিএফএক্সের জন্য দুটি খুব কার্যকর কেস: গভীরতা এবং চতুর প্রান্ত। গভীরতার জন্য, প্রিপ্রসেস করুন MiDaS-DepthMapপ্রিপ্রসেসরগভীরতা কন্ট্রোলনেট লোড করুন এবং এটি ApplyFluxControlNet দিয়ে প্রয়োগ করুন। শর্তসাপেক্ষ সুপ্ত তরঙ্গরূপ তৈরি করতে XlabsSampler ব্যবহার করুন, এবং তারপর VAEDecode ছবিটি তৈরি করে.

ক্যানির জন্য, ব্যবহার করুন ক্যানিএজপ্রিপ্রসেসর, ক্যানি কন্ট্রোলনেট লোড করুন এবং স্কিমটি পুনরাবৃত্তি করুন: ApplyFluxControlNet → XlabsSampler → VAEDecode। এই অতিরিক্ত নিয়ন্ত্রণ আকৃতি এবং গঠনের উপর নির্ভুলতা প্রদান করে।.

FLUX দিয়ে রঙ করা

UNET, VAE এবং CLIP লোড করুন এবং ইতিবাচক এবং নেতিবাচক প্রম্পট প্রস্তুত করুন। LoadAndResizeImage ছবি এবং মাস্কটি সামনে আনে।ImpactGaussianBlurMask দিয়ে ট্রানজিশনটি মসৃণ করা হয়েছে। InpaintModelConditioning কন্ডিশনিং, ইমেজ এবং মাস্ককে একত্রিত করে। স্যাম্পলার, নয়েজ এবং সিগমাস কনফিগার করার পর, SamplerCustomAdvanced মাস্ক করা অঞ্চলটি পুনর্গঠন করে। VAEDecode ধারাবাহিকভাবে প্যাচটি সংহত করে বাকিদের সাথে।

ফ্লাক্স এনএফ৪

NF4 কোয়ান্টাইজেশনের সাথে, মেমরি হ্রাস পায়। উপাদানগুলি লোড করুন চেকপয়েন্টলোডারNF4 এবং আদিম নোড দিয়ে উচ্চতা/প্রস্থ নির্ধারণ করে। ModelSamplingFlux প্যারামিটার সেট করে; EmptySD3LatentImage ল্যাটেন্ট ইমেজ তৈরি করে; BasicScheduler এবং RandomNoise ডিনয়েজ সংগঠিত করে। SamplerCustomAdvanced লুকানো সংকেত তৈরি করে এবং VAEDecode এটিকে একটি ছবিতে অনুবাদ করে।স্কেলিংয়ের ক্ষেত্রে, UltimateSDUpscale, UpscaleModelLoader এবং একটি অতিরিক্ত পজিটিভ প্রম্পট, সমস্ত পার্থক্য তৈরি করে।

FLUX সহ আইপ্যাড্যাপ্টার

যখন আপনি একটি রেফারেন্স ইমেজ ব্যবহার করে কন্ডিশন করতে চান, তখন ব্যবহার করুন লোডফ্লাক্সআইপিএডাপ্টার এবং অ্যাপ্লাইফ্লাক্সআইপিএডাপ্টার clip_vision_l.safetensors সহ। ImageScale দিয়ে রেফারেন্স ইমেজটি স্কেল করুন, প্রম্পট প্রস্তুত করুন এবং XlabsSampler চালান। VAEDecode এর মাধ্যমে আপনি নান্দনিকতা বা বৈশিষ্ট্য দ্বারা প্রভাবিত আউটপুট দেখতে পাবেন। গাইড ছবি থেকে।

FLUX এর জন্য LoRA প্রশিক্ষক

ComfyUI তে সরাসরি LoRA প্রশিক্ষণের জন্য, কর্মপ্রণালীতে অন্তর্ভুক্ত রয়েছে: FluxTrainModelSelect, OptimizerConfig এবং TrainDatasetGeneralConfigInitFluxLoRATraining আরম্ভ করে, FluxTrainLoop ধাপগুলি কার্যকর করে এবং FluxTrainValidate পর্যায়ক্রমিক বৈধতা তৈরি করে।

ভিএফএক্সের জন্য কমফিইউআই: ভূমিকা, ইনস্টলেশন এবং কর্মপ্রবাহ

ভিজ্যুয়ালাইজলসের মাধ্যমে আপনি ক্ষতি ট্র্যাক করতে পারবেন; ImageBatchMulti এবং ImageConcatFromBatch তারা যাচাইকরণ গ্রুপ করে; FluxTrainSave চেকপয়েন্ট সংরক্ষণ করে, এবং FluxTrainEnd প্রক্রিয়াটি বন্ধ করে দেয়। আপনি যদি চান, UploadToHuggingFace দিয়ে Hugging Face-এ ফলাফল আপলোড করুন এবং শেয়ার করুন।

ফ্লাক্স ল্যাটেন্ট আপস্কেলার

বিস্তারিতভাবে স্কেল করার জন্য, আকারটি সংজ্ঞায়িত করুন SDXLEmptyLatentSizePicker+ সম্পর্কে এবং LatentUpscale এবং LatentCrop-কে চেইন করে। SolidMask এবং FeatherMask দ্বারা তৈরি মাস্কের সাহায্যে, LatentCompositeMasked স্কেল করা ল্যাটেন্টকে আসলটির সাথে মিশ্রিত করে। InjectLatentNoise+ VAEDecode-এর আগে বিস্তারিত তথ্য উন্নত করেএবং ImageSmartSharpen+ এর সাথে একটি টাচ-আপ প্রক্রিয়াটি সম্পূর্ণ করে। SimpleMath+ এর মতো গণনা নোডগুলি অনুপাতগুলিকে সারিবদ্ধ করতে সহায়তা করে।

বিকল্প সংস্করণ: VRAM কমাতে FP8, NF4 এবং GGUF

যদি আপনার সম্পদের অভাব হয়, তাহলে আপনার কাছে বিকল্প আছে। Comfy.org এর FP8 চেকপয়েন্ট এবং কিজাইয়ের মতো লেখকরা। আপনাকে একটি ফাইল দিয়ে FLUX ব্যবহার করার অনুমতি দেয় ComfyUI/models/checkpoints/ তে। dev এবং schnell ভেরিয়েন্টের মধ্যে পার্থক্য করার জন্য ফোল্ডারগুলির নাম পরিবর্তন বা আলাদা করার পরামর্শ দেওয়া হয়।

NF4 (বিটস্যান্ডবাইট) দিয়ে, প্লাগইনটি ইনস্টল করুন আরামদায়ক UI_bitsandbytes_NF4 আর ব্যবহার করুন ফ্লাক্স১-ডেভ-বিএনবি-এনএফ৪-ভি২ মডেল/চেকপয়েন্টে। এই সংস্করণটি প্রথম পুনরাবৃত্তির তুলনায় বিশদ উন্নত করে।

প্লাগইন সহ City96 এর GGUF কোয়ান্টাইজেশন কমফিইউআই-জিজিইউএফবার আরও কমিয়ে দেয়: FLUX GGUF মডেলটি ডাউনলোড করুন, t5-v1_1-xxl-encoder-gguf এনকোডার।`clip_l.safetensors` এবং `ae.safetensors` ফাইলগুলি তাদের নিজ নিজ ফোল্ডারে স্থাপন করা উচিত। 6 GB VRAM সহ সুবিধাজনক ব্যবহারের ক্ষেত্রে রয়েছে।

ক্লাউড এবং অন্যান্য রিসোর্সে FLUX.1 ব্যবহার করা

যদি আপনি কিছু ইনস্টল না করতে চান, তাহলে আপনি FLUX ব্যবহার করে দেখতে পারেন আলিঙ্গন ফেস স্পেস: FLUX.1-ডেভ y FLUX.1-schnell সম্পর্কে। এছাড়াও চিত্রের প্রতিলিপি করা, Mystic.ai সম্পর্কে o ফল.আই. প্রম্পট এবং কনফিগারেশন যাচাই করার জন্য এগুলি কার্যকর বিকল্প। স্থানীয় মডেল ডাউনলোড করার আগে।

অনুপ্রেরণা এবং তৈরি কর্মপ্রবাহের জন্য, দেখুন ComfyUI এর অফিসিয়াল উদাহরণ এবং ওয়ার্কফ্লো গ্যালারী যেমন ওপেনআর্ট. মনে রাখবেন যে অনেক ছবিতে মেটাডেটা থাকেযাতে আপনি গ্রাফটি পুনরুদ্ধার করতে ComfyUI তে টেনে আনতে পারেন।

উন্নতমানের পিক্সেল

আরও উপাদান: সংগ্রহ FLUX এর জন্য LoRA Como বাস্তববাদলোরা অথবা সংকলন এক্সল্যাবস-এআইFLUX এর জন্য ControlNet হিসাবে সংগ্রহ y মিলন; আইপি অ্যাডাপ্টার en এক্সল্যাবস-এআইকম VRAM দিয়ে LoRA প্রশিক্ষণ দিতে, চেষ্টা করুন ফ্লাক্সজিম অথবা অস্ট্রিসের রেপ্লিকাট প্রশিক্ষক; FLUX.1 ডেভেলপারের জন্য একটি DreamBooth গাইড আছে। ডিফিউজার রেপোতে।

Windows 11-এ ComfyUI ইনস্টল করুন, ভালো পারফরম্যান্স সহ

যদি আপনি একটি পরিষ্কার ইনস্টলেশন চান, তাহলে এটি একটি প্রমাণিত উপায়। এটি NVIDIA 40/50 সিরিজের কার্ডগুলির সাথে খুব ভালো কাজ করে। এবং এটি আপনাকে সাধারণ ভুলগুলি এড়াতে সাহায্য করে।

১) NVIDIA অ্যাপ এবং স্টুডিও ড্রাইভার ইনস্টল করুন এনভিডিয়া.কম. পুনঃসূচনা করুন। 2) CUDA টুলকিট থেকে developer.nvidia.com (ঐচ্ছিক কিন্তু venv ব্যবহার না করলে Triton এর সতর্কতা এড়াতে কার্যকর)। ৩) এফএফএমপিইজি BtbN রিপোজিটরি থেকে, Path-এ C:\ffmpeg\bin যোগ করুন। ৪) উইন্ডোজের জন্য Git থেকে git-scm.com৫) পাইথন ৩.১২ x৬৪ থেকে পাইথন.অর্গ, সকল ব্যবহারকারীর জন্য py লঞ্চার সহ এবং পরিবেশ ভেরিয়েবলে যোগ করুন।

৫.৫) যদি আপনি venv বেছে নেন, তাহলে এটি দিয়ে তৈরি করুন পাইথন -এম ভেনভ সিইউভেনভ এবং CUVenv\Scripts\activate.bat দিয়ে এটি সক্রিয় করুন। সেখান থেকে, venv-এর মধ্যে যেকোনো প্রাসঙ্গিক pip বা git কমান্ড চালান। আপনার স্টার্টআপ স্ক্রিপ্ট পরিবেশ সক্রিয় করতে পারে এবং ComfyUI চালাতে পারে এক দৌড়ে।

৬) এর সাথে ComfyUI ক্লোন করুন git ক্লোন https://github.com/comfyanonymous/ComfyUI.git D:\CU৭) D:\CU তে যান এবং pip install -r requirements.txt চালান। ৮) যদি pip পাথের বাইরের স্ক্রিপ্ট সম্পর্কে সতর্ক করে, তাহলে সিস্টেম ভেরিয়েবলে পাইথন স্ক্রিপ্ট পাথ যোগ করুন এবং পুনরায় চালু করুন। ৯) PyTorch CUDA 12.8 ইনস্টল করুন `pip install torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128` ব্যবহার করে টর্চ ইনস্টল করুন। যদি কিছু সমস্যা মনে হয়, তাহলে টর্চ আনইনস্টল করুন এবং একই কমান্ড ব্যবহার করে এটি পুনরায় ইনস্টল করুন।

৯ বিস) এর সাথে ComfyUI চালু করুন python main.py এবং 127.0.0.1:8188 খুলুন। 10) pip install -U triton-windows দিয়ে Windows এর জন্য Triton ইনস্টল করুন। 11) Sage Attention 2.2 দিয়ে মনোযোগ দ্রুত করুন: CP312 এর জন্য সামঞ্জস্যপূর্ণ চাকা CU128/Torch2.8 ডাউনলোড করুন।, এটি pip দিয়ে ইনস্টল করুন এবং –use-sage-attention পতাকা দিয়ে ComfyUI শুরু করুন।

১২) ComfyUI-Manager ইনস্টল করুন: ComfyUI/custom_nodes রানে গিট ক্লোন https://github.com/ltdrdata/ComfyUI-Manager comfyui-manager১৩) cd D:\CU এবং python main.py –use-sage-attention লাইনগুলি ব্যবহার করে একটি boot .bat ফাইল তৈরি করুন। শুরু করার সময়, ম্যানেজার প্রথমবার একটু সময় নেবেন।; ইন্টারফেসে ম্যানেজার ট্যাবটি উপস্থিত আছে কিনা তা পরীক্ষা করুন।

১৪) টেমপ্লেটগুলো সঠিক ফোল্ডারে (চেকপয়েন্ট, ক্লিপ, ইউনেট, ভিএই) রাখুন এবং আপনার ফ্লো খুলুন। যদি কোনও ওয়ার্কফ্লো তার নিজস্ব সেজ নোড নিয়ে আসে, আপনি যদি ইতিমধ্যেই পতাকা দিয়ে শুরু করেন তবে এটি বাদ দিতে পারেনটিপস: রিসোর্স-ইনটেনসিভ প্রোগ্রাম খোলা এড়িয়ে চলুন, যদি আপনার মেমোরি কম থাকে তাহলে উইন্ডোজ ভার্চুয়াল মেমোরি কনফিগার করুন এবং ComfyUI রিপোজিটরিতে পারফরম্যান্স আলোচনা পরীক্ষা করুন। যদি আপনি মেমোরি সতর্কতা পান, তাহলে সিঙ্গেল-ফাইল FP8 ভেরিয়েন্ট ব্যবহার করার কথা বিবেচনা করুন।

স্থিতিশীল ভিডিও বিস্তার

যদি আপনি একটি ডাউনলোডযোগ্য ম্যানুয়াল পছন্দ করেন, তাহলে একটি সহায়ক পিডিএফ এখানে আছে এই লিঙ্কে. ইনস্টলেশন সহজ করার জন্য এবং ভেনেভ প্রস্তাব করার জন্য কিছু নির্দেশিকা সংশোধন করা হয়েছেvenv ব্যবহার করার সময়, পরিবেশের মধ্যে সর্বদা pip এবং git চালাতে ভুলবেন না।

ব্যবহারের টিপস, সামঞ্জস্যতা এবং সর্বোত্তম অনুশীলন

মেটাডেটা বা JSON সহ PNG টেনে প্রবাহ আমদানি করুন এবং ম্যানেজার দিয়ে নোড সংস্করণগুলি পরীক্ষা করুন। ছবি শেয়ার করার সময়, মেটাডেটা মুছে ফেলার মতো কম্প্রেশন এড়িয়ে চলুন।যদি কোনও JSON ভেঙে যায়, তাহলে অপ্রচলিত নোডগুলি প্রতিস্থাপন করুন অথবা সামঞ্জস্যপূর্ণ সংস্করণগুলি ইনস্টল করুন।

একাধিক FLUX LoRA-এর সাথে কাজ করার জন্য, সাম্প্রতিক ComfyUI বিল্ডগুলিতে উচ্চ শক্তি খরচের রিপোর্ট রয়েছে; GGUF বা নির্দিষ্ট লোডার পরীক্ষা করুন VRAM কমাতে। ControlNet-এ, একটি স্থিতিশীল কম্পোজিটিং রিগ স্থাপন করতে depth অথবা Canny দিয়ে শুরু করুন।

ক্লাউডে স্থাপন করার সময়, VRAM এবং এক্সিকিউশন কিউ পরীক্ষা করুন। স্থানীয়ভাবে, একটি দ্রুত SSD এবং হালনাগাদ ড্রাইভারগুলি সমস্ত পার্থক্য তৈরি করে।আপনার পাইপলাইনটি বিভাগ অনুসারে নথিভুক্ত করুন: মডেল লোডিং, কন্ডিশনিং, স্যাম্পলিং, ডিকোডিং এবং পোস্ট-প্রসেসিং। এটি কোনও কিছু ভেঙে গেলে ডিবাগিংকে আরও সহজ করে তুলবে।

উপরের সবগুলো বিষয়ের সাহায্যে, আপনি এখন ComfyUI এর মাধ্যমে একটি সত্যিকারের শক্তিশালী VFX পাইপলাইন তৈরি করতে পারেন: তুমি কি জানো ওয়ার্কফ্লো কী এবং মেটাডেটা না হারিয়ে কীভাবে এটি সংরক্ষণ করা যায়?আপনি FLUX এবং এর ভেরিয়েন্টগুলি (Dev, Schnell এবং FP8, NF4, GGUF বিকল্পগুলি) ইনস্টল করতে পারেন, আপনি দৈনন্দিন অনুশীলনের মূল কর্মপ্রবাহগুলি (Txt2Img, Img2Img, Inpainting, ControlNet, LoRA, IPAdapter এবং Upscale) কীভাবে চালাতে হয় তা জানেন এবং সিস্টেমটিকে সূক্ষ্ম, স্থিতিশীল এবং দ্রুত রাখার জন্য আপনার কাছে Triton, Sage Attention এবং ComfyUI-Manager সহ একটি অপ্টিমাইজ করা উইন্ডোজ ইনস্টলেশন রয়েছে।