Skip to main content
PROMPT SPACE
ट्यूटोरियल
8 min readUpdated

ControlNet की पूरी जानकारी - AI इमेज कंपोज़िशन को प्रो की तरह कंट्रोल करें

जानें कैसे ControlNet आपको AI-जनरेटेड इमेज में पोज़, एज, डेप्थ और कंपोज़िशन पर सटीक नियंत्रण देता है।

ControlNet की पूरी जानकारी - AI इमेज कंपोज़िशन को प्रो की तरह कंट्रोल करें
जब मैंने पहली बार ControlNet इस्तेमाल किया, तो नतीजा देखकर मुझे हँसी आ गई - जो मैं चाहता था उससे बिल्कुल अलग था। फिर मैंने समझा कि पोज़ स्केलेटन असल में कैसे काम करते हैं, और रातोंरात सब कुछ बदल गया। ControlNet के बिना आप एक प्रॉम्प्ट लिखते हैं और उम्मीद करते हैं कि AI सीन को वैसे ही कंपोज़ करे जैसा आपने सोचा था। ControlNet के साथ आप सटीक पोज़, एज, डेप्थ मैप, कंपोज़िशन और स्पेशियल लेआउट तय करते हैं, और AI उन्हीं सीमाओं के भीतर इमेज बनाता है। यह रैंडम जनरेशन और प्रोफेशनल आर्ट डायरेक्शन के बीच की खाई को पाटता है - वैसा नियंत्रण देता है जैसा फोटोग्राफर्स को अपने सब्जेक्ट पर और डायरेक्टर्स को अपने सीन पर होता है। अगर आप AI आर्ट को गंभीरता से लेते हैं - चाहे कमर्शियल काम हो, पर्सनल प्रोजेक्ट हो, या प्रोफेशनल पोर्टफोलियो - तो ControlNet एक ज़रूरी स्किल है। यह गाइड बेसिक कॉन्सेप्ट से लेकर एडवांस्ड मल्टी-ControlNet वर्कफ्लो तक सब कुछ कवर करती है।

ControlNet क्या है?

ControlNet एक न्यूरल नेटवर्क आर्किटेक्चर है जो Stable Diffusion की इमेज जनरेशन को एक अतिरिक्त इनपुट इमेज - एक "कंट्रोल इमेज" - से कंडीशन करता है, जो आउटपुट की कंपोज़िशन, स्ट्रक्चर या पोज़ को गाइड करती है। यह A1111 और ComfyUI दोनों में एक्सटेंशन के रूप में काम करता है। कॉन्सेप्ट बेहद सरल है: आप एक रेफरेंस देते हैं - पोज़ स्केलेटन, एज मैप, डेप्थ मैप, सेगमेंटेशन मैप, या यहाँ तक कि हाथ से बनाई रफ स्केच - और AI उन स्ट्रक्चरल कंस्ट्रेंट्स को फॉलो करते हुए एक नई इमेज बनाता है, जिसमें आपके टेक्स्ट प्रॉम्प्ट में बताई स्टाइल, कंटेंट और क्वालिटी लागू होती है। इसे AI को एक आर्किटेक्चरल ब्लूप्रिंट देने जैसा समझें: ब्लूप्रिंट स्ट्रक्चर तय करता है, जबकि आपका प्रॉम्प्ट एस्थेटिक तय करता है। ControlNet की असली ताकत यह है कि यह कंपोज़िशन को कंटेंट से अलग करता है। आप किसी फैशन फोटो से पोज़ ले सकते हैं, किसी फैंटेसी प्रॉम्प्ट से स्टाइल, और किसी सिनेमैटिक डिस्क्रिप्शन से लाइटिंग - और इन सबको एक ऐसी इमेज में मिला सकते हैं जो आपके क्रिएटिव विज़न से बिल्कुल मेल खाए। ControlNet मॉडल फ्री, ओपन-सोर्स हैं और SD 1.5 तथा SDXL दोनों आर्किटेक्चर के लिए उपलब्ध हैं। एक ही जनरेशन में कई ControlNet मॉडल एक साथ इस्तेमाल किए जा सकते हैं, जिससे आप एक साथ पोज़ AND डेप्थ AND एज डिटेल - सब कंट्रोल कर सकते हैं।

सबसे उपयोगी ControlNet मॉडल

ControlNet के एक दर्जन से ज़्यादा मॉडल टाइप हैं, लेकिन 90% समय आप इन्हीं का इस्तेमाल करेंगे: OpenPose बॉडी पोज़ को डिटेक्ट और कंट्रोल करता है। किसी भी व्यक्ति की रेफरेंस फोटो अपलोड करें और ControlNet पोज़ स्केलेटन निकाल लेता है - एक स्टिक फिगर जो जॉइंट पोज़िशन दिखाता है। AI फिर उसी पोज़ में एक बिल्कुल नया व्यक्ति जनरेट करता है, जिसमें आपके प्रॉम्प्ट की स्टाइल और कपड़े होते हैं। OpenPose सबसे लोकप्रिय ControlNet मॉडल है क्योंकि पोज़ कंट्रोल की ज़रूरत सबसे ज़्यादा होती है। इसके वेरिएंट भी हैं: OpenPose Face फेशियल लैंडमार्क डिटेक्शन (एक्सप्रेशन कंट्रोल) जोड़ता है, और OpenPose Hand हाथों की पोज़िशनिंग बेहतर करता है। Canny Edge रेफरेंस इमेज में एज डिटेक्ट करता है और उन्हें कंपोज़िशनल गाइडलाइन के रूप में इस्तेमाल करता है। यह रेफरेंस की एक लाइन ड्रॉइंग बनाता है, और AI आपके प्रॉम्प्ट के अनुसार डिटेल भरता है। Canny बेहद वर्सेटाइल है - किसी मौजूदा फोटो की कंपोज़िशन बनाए रखते हुए स्टाइल पूरी तरह बदलने के लिए, स्केच को फिनिश्ड इलस्ट्रेशन में बदलने के लिए, या आर्किटेक्चरल लाइनें सीधी और सटीक रखने के लिए इसका इस्तेमाल करें। Depth रेफरेंस इमेज से एक डेप्थ मैप बनाता है, जो नज़दीकी और दूर के एलिमेंट्स के बीच स्पेशियल रिलेशनशिप दिखाता है। AI इस डेप्थ इन्फॉर्मेशन का उपयोग करके वही स्पेशियल लेआउट बनाए रखता है - फोरग्राउंड एलिमेंट आगे रहते हैं, बैकग्राउंड एलिमेंट पीछे, और पूरा थ्री-डायमेंशनल स्ट्रक्चर सुरक्षित रहता है। लैंडस्केप, आर्किटेक्चरल इंटीरियर और हर उस सीन के लिए परफेक्ट जहाँ स्पेशियल एक्यूरेसी ज़रूरी हो। Lineart खासतौर पर लाइन ड्रॉइंग और स्केच के लिए बना है। यह रेफरेंस से क्लीन लाइन आर्ट निकालता है और जनरेशन को गाइड करने के लिए इस्तेमाल करता है। यह उन आर्टिस्ट्स के लिए सबसे अच्छा ControlNet है जो रफ कंपोज़िशन स्केच करके AI से पॉलिश्ड इलस्ट्रेशन बनवाना चाहते हैं। Scribble सबसे फ्लेक्सिबल मॉडल है - यह रफ, अनगढ़ स्केच और स्क्रिबली ड्रॉइंग से भी काम करता है। 30 सेकंड की रफ स्केच भी एक सुसंगत इमेज के लिए पर्याप्त स्ट्रक्चरल गाइडेंस देती है। यह उन नॉन-आर्टिस्ट्स के लिए सबसे सुलभ ControlNet है जो ड्रॉइंग स्किल के बिना कंपोज़िशनल कंट्रोल चाहते हैं। Tile इमेज को अपस्केल करता है और डिटेल जोड़ता है। यह इमेज को टाइल्स में बाँटता है और ओरिजिनल कंपोज़िशन से गाइड होते हुए हर टाइल को नई डिटेल के साथ रीजनरेट करता है। AI इमेज अपस्केलिंग के लिए यह सबसे अच्छा ControlNet है जो सिर्फ पिक्सल इंटरपोलेट करने की बजाय असली नई डिटेल जोड़ता है।

प्रैक्टिकल वर्कफ्लो: स्टेप बाय स्टेप

ControlNet को प्रभावी ढंग से इस्तेमाल करने का सटीक वर्कफ्लो यहाँ है, रेफरेंस से फिनिश्ड इमेज तक: स्टेप 1: अपनी रेफरेंस इमेज चुनें या बनाएँ। यह कोई फोटोग्राफ हो सकती है (पोज़ या कंपोज़िशन रेफरेंस के लिए), आपकी खुद बनाई स्केच, किसी मूवी का स्क्रीनशॉट (कंपोज़िशन इंस्पिरेशन के लिए), या Magic Poser या Daz3D जैसे फ्री टूल से बनाया 3D पोज़्ड फिगर। रेफरेंस का अच्छा दिखना ज़रूरी नहीं - बस उसे वह स्ट्रक्चरल इन्फॉर्मेशन देनी है जो आप चाहते हैं। स्टेप 2: रेफरेंस को ControlNet में लोड करें और सही प्रीप्रोसेसर चुनें। A1111 में, प्रॉम्प्ट फील्ड के नीचे ControlNet सेक्शन खोलें, इमेज अपलोड करें, और प्रीप्रोसेसर व मॉडल चुनें। बॉडी पोज़ के लिए OpenPose, एज और कंपोज़िशन के लिए Canny, स्पेशियल लेआउट के लिए Depth, रफ स्केच के लिए Scribble। जनरेट करने से पहले एक्सट्रैक्टेड कंट्रोल मैप देखने के लिए प्रीव्यू बटन क्लिक करें। स्टेप 3: अपना प्रॉम्प्ट सामान्य तरीके से लिखें। आपका टेक्स्ट प्रॉम्प्ट वह सब हैंडल करता है जो ControlNet नहीं करता - आर्ट स्टाइल, लाइटिंग, रंग, मूड, कपड़े, कैरेक्टर डिटेल। ControlNet WHERE और STRUCTURE हैंडल करता है; आपका प्रॉम्प्ट WHAT और HOW हैंडल करता है। स्टेप 4: ControlNet वेट और गाइडेंस एडजस्ट करें। वेट (0.0-2.0, डिफ़ॉल्ट 1.0) यह कंट्रोल करता है कि कंट्रोल इमेज जनरेशन को कितनी मज़बूती से प्रभावित करे। 1.0 पर यह रेफरेंस को करीब से फॉलो करता है। कम वेट (0.4-0.7) ज़्यादा क्रिएटिव फ्रीडम देता है। ज़्यादा वेट (1.2-1.5) सख्त पालन सुनिश्चित करता है। 1.0 से शुरू करें और नतीजों के आधार पर एडजस्ट करें। Control guidance start/end से आप तय कर सकते हैं कि जनरेशन प्रोसेस के किस स्टेप पर ControlNet एक्टिवेट और डीएक्टिवेट हो - यह एडवांस्ड टेक्निक के लिए उपयोगी है जहाँ आप चाहते हैं कि ControlNet शुरुआती कंपोज़िशन सेट करे लेकिन बाद के स्टेप में AI को फ्री रिफाइन करने दे। स्टेप 5: जनरेट करें और इटरेट करें। 4 इमेज जनरेट करें, देखें कौन सी आपके विज़न से सबसे ज़्यादा मेल खाती है, और अगले बैच के लिए वेट या प्रॉम्प्ट एडजस्ट करें। ControlNet के साथ इटरेटिव लूप बिना ControlNet के मुकाबले बहुत तेज़ होता है क्योंकि कंपोज़िशन पहले से लॉक है - आप सिर्फ स्टाइल और डिटेल रिफाइन कर रहे हैं।

रियल-वर्ल्ड यूज़ केस

ControlNet ऐसे प्रोफेशनल एप्लिकेशन खोलता है जो सिर्फ टेक्स्ट प्रॉम्प्टिंग से संभव नहीं: कैरेक्टर आर्ट और कॉमिक्स: कॉमिक पेज या कैरेक्टर शीट के लिए एक ही कैरेक्टर को अलग-अलग पोज़ में जनरेट करने के लिए OpenPose इस्तेमाल करें। हर पैनल के लिए पोज़ रेफरेंस इमेज लें, --cref या LoRA से कैरेक्टर कंसिस्टेंसी बनाए रखें, और प्रोफेशनल-लेवल पोज़ वैरायटी के साथ पूरा कॉमिक पेज तैयार करें। प्रोडक्ट फोटोग्राफी और प्लेसमेंट: सीन में किसी खास जगह प्रोडक्ट रखने के लिए Depth ControlNet इस्तेमाल करें। अपनी मनचाही प्रोडक्ट प्लेसमेंट का डेप्थ मैप लें, और AI परफेक्ट स्पेशियल एक्यूरेसी के साथ उसके आसपास का एनवायरनमेंट जनरेट करता है। आर्किटेक्चरल विज़ुअलाइज़ेशन: आर्किटेक्चरल स्केच या CAD रेंडर से Canny एज इस्तेमाल करके फोटोरियलिस्टिक आर्किटेक्चरल रेंडर जनरेट करें। एज स्ट्रक्चरल एक्यूरेसी सुनिश्चित करते हैं जबकि प्रॉम्प्ट मटेरियल, लाइटिंग और एटमॉस्फेयर कंट्रोल करता है। फैशन और क्लोदिंग डिज़ाइन: AI-जनरेटेड आउटफिट पहने मॉडल्स को खास रनवे पोज़ में जनरेट करने के लिए OpenPose इस्तेमाल करें। प्रॉम्प्ट में कपड़े डिज़ाइन करें, OpenPose से मॉडल का पोज़ कंट्रोल करें, और बिना फोटोग्राफर या मॉडल के फैशन लुकबुक इमेज तैयार करें। एनिमेशन और मोशन: फ्रेम-बाय-फ्रेम एनिमेशन बनाने के लिए OpenPose को सीक्वेंशियल पोज़ रेफरेंस के साथ इस्तेमाल करें। AnimateDiff के साथ मिलाकर यह कंसिस्टेंट कैरेक्टर पोज़ के साथ AI-असिस्टेड एनिमेशन को संभव बनाता है। इंटीरियर डिज़ाइन: कमरे की फोटो से Depth मैप इस्तेमाल करके इंटीरियर रीडिज़ाइन करें। डेप्थ मैप कमरे का स्पेशियल लेआउट बनाए रखता है जबकि आपका प्रॉम्प्ट स्टाइल, फर्नीचर, मटेरियल और लाइटिंग पूरी तरह बदल देता है।

एडवांस्ड: मल्टी-ControlNet और स्टैकिंग

असली ताकत तब सामने आती है जब आप एक साथ कई ControlNet मॉडल स्टैक करते हैं। A1111 में आप कई ControlNet यूनिट एनेबल कर सकते हैं (3 या उससे ज़्यादा तक)। ComfyUI में बस अपने वर्कफ्लो में कई ControlNet Apply नोड जोड़ें। उदाहरण: कैरेक्टर पोज़ के लिए OpenPose + बैकग्राउंड स्पेशियल लेआउट के लिए Depth + आर्किटेक्चरल डिटेल के लिए Canny - सब एक ही जनरेशन में। हर ControlNet इमेज के एक अलग पहलू को कंट्रोल करता है। हर एक के लिए अलग वेट सेट करें: सटीक पोज़ मैचिंग के लिए मज़बूत OpenPose वेट (1.0) और सामान्य स्पेशियल गाइडेंस के लिए हल्का Depth वेट (0.5)। यही मल्टी-ControlNet अप्रोच है जिससे प्रोफेशनल AI आर्टिस्ट कंपोज़िशनल कंट्रोल का वह स्तर हासिल करते हैं जो उनके काम को रैंडम जनरेटेड की बजाय जानबूझकर डायरेक्टेड दिखाता है।

आज ही शुरुआत करें

A1111 में ControlNet एक्सटेंशन इंस्टॉल करें (Extensions टैब में "ControlNet" सर्च करें) या ComfyUI में ControlNet नोड जोड़ें (ComfyUI Manager से इंस्टॉल करें)। Hugging Face से ControlNet मॉडल डाउनलोड करें - ये फ्री हैं और आमतौर पर 700MB-1.4GB प्रत्येक। OpenPose से शुरुआत करें - यह सबसे इंट्यूटिव और तुरंत असरदार है। जिस पोज़ में चाहते हैं उसमें एक सेल्फी लें, उसे रेफरेंस के रूप में लोड करें, स्टाइल के लिए PromptSpace का प्रॉम्प्ट जोड़ें, और जनरेट करें। ControlNet से मिलने वाला सटीक कंपोज़िशन कंट्रोल और PromptSpace के हाई-क्वालिटी प्रॉम्प्ट का संयोजन ऐसे प्रोफेशनल, इरादतन नतीजे देता है जो सिर्फ टेक्स्ट प्रॉम्प्टिंग से कभी नहीं मिल सकते। ControlNet वर्कफ्लो के लिए ऑप्टिमाइज़्ड प्रॉम्प्ट के लिए promptspace.in ब्राउज़ करें और आज ही डायरेक्टेड AI आर्ट बनाना शुरू करें।
S

Creator of PromptSpace · AI Researcher & Prompt Engineer

Building the largest free AI prompt library with 4,000+ prompts. Covering AI image generation, prompt engineering, and tool comparisons since 2024. 159+ articles published.

Related Articles

🎨

Related Prompt Collections

Free AI Prompts

Ready to Create Stunning AI Art?

Browse 4,000+ free, tested prompts for Midjourney, ChatGPT, Gemini, DALL-E & more. Copy, paste, create.