मुख्य » एल्गोरिथम ट्रेडिंग » स्तरीय अनियमित नमूने का चुनाव

स्तरीय अनियमित नमूने का चुनाव

स्तरीकृत यादृच्छिक नमूनाकरण क्या है?

स्तरीकृत यादृच्छिक नमूनाकरण नमूनाकरण की एक विधि है जिसमें एक आबादी के विभाजन को छोटे उप समूहों में शामिल किया जाता है जिन्हें स्ट्रेट के रूप में जाना जाता है। स्तरीकृत यादृच्छिक नमूनाकरण या स्तरीकरण में, स्ट्रेट का गठन सदस्यों की साझा विशेषताओं या विशेषताओं जैसे आय या शैक्षिक प्राप्ति के आधार पर किया जाता है।

स्तरीकृत यादृच्छिक नमूनाकरण को आनुपातिक यादृच्छिक नमूनाकरण या कोटा यादृच्छिक नमूनाकरण भी कहा जाता है।

[महत्वपूर्ण: स्तरीकृत नमूनाकरण का उपयोग आबादी में समूहों के बीच अंतर को उजागर करने के लिए किया जाता है, जैसा कि सरल यादृच्छिक नमूनाकरण के विपरीत होता है, जो जनसंख्या के सभी सदस्यों को समान माना जाता है, जिसका नमूना होने की समान संभावना है।]

1:40

स्तरीय अनियमित नमूने का चुनाव

कैसे स्तरीकृत यादृच्छिक नमूनाकरण कार्य करता है

समान विशेषताओं वाली संस्थाओं के समूह पर विश्लेषण या अनुसंधान पूरा करते समय, एक शोधकर्ता यह पा सकता है कि जनसंख्या का आकार बहुत बड़ा है जिसके लिए अनुसंधान पूरा करना है। समय और धन बचाने के लिए, एक विश्लेषक आबादी से एक छोटे समूह का चयन करके अधिक व्यवहार्य दृष्टिकोण पर ले जा सकता है। छोटे समूह को एक नमूना आकार के रूप में संदर्भित किया जाता है, जो आबादी का एक सबसेट है जो संपूर्ण आबादी का प्रतिनिधित्व करने के लिए उपयोग किया जाता है। एक नमूने को जनसंख्या से कई तरीकों से चुना जा सकता है, जिनमें से एक स्तरीकृत यादृच्छिक नमूना विधि है।

एक स्तरीकृत रैंडम सैंपलिंग में पूरी आबादी को समतामूलक समूहों में विभाजित किया जाता है जिसे स्ट्रैटा ( स्ट्रैटम के लिए बहुवचन ) कहा जाता है । यादृच्छिक नमूने तब प्रत्येक स्ट्रैटम से चुने जाते हैं। उदाहरण के लिए, एक अकादमिक शोधकर्ता पर विचार करें, जो 2007 में एमबीए के छात्रों की संख्या जानना चाहते हैं, जिन्होंने स्नातक होने के तीन महीने के भीतर नौकरी की पेशकश की थी।

वह जल्द ही पाएंगे कि वर्ष के लिए लगभग 200, 000 एमबीए स्नातक थे। वह सिर्फ 50, 000 स्नातकों का एक सरल यादृच्छिक नमूना लेने और एक सर्वेक्षण चलाने का फैसला कर सकता है। अभी भी बेहतर है, वह आबादी को तबाह कर सकता है और तबके से एक यादृच्छिक नमूना ले सकता है। ऐसा करने के लिए, वह लिंग, आयु सीमा, नस्ल, राष्ट्रीयता के देश, और कैरियर की पृष्ठभूमि के आधार पर जनसंख्या समूह बनाएगा। जनसंख्या की तुलना में प्रत्येक स्ट्रैटम से एक रैंडम सैंपल स्ट्रैटम के आकार के अनुपात में लिया जाता है। तब स्ट्रैट के इन सबसेट को रैंडम सैंपल बनाने के लिए रखा जाता है।

चाबी छीन लेना

स्तरीकृत यादृच्छिक नमूना शोधकर्ताओं को एक नमूना आबादी प्राप्त करने की अनुमति देता है जो अध्ययन की जा रही पूरी आबादी का सबसे अच्छा प्रतिनिधित्व करता है।
स्तरीकृत यादृच्छिक नमूनाकरण में संपूर्ण आबादी को समरूप समूहों में विभाजित करना शामिल है जिन्हें समता कहा जाता है।
स्तरीकृत यादृच्छिक नमूना सरल यादृच्छिक नमूने से भिन्न होता है, जिसमें संपूर्ण आबादी से डेटा का यादृच्छिक चयन शामिल होता है, इसलिए प्रत्येक संभावित नमूना समान रूप से होने की संभावना है।

स्तरीकृत यादृच्छिक नमूनाकरण का उदाहरण

मान लीजिए कि एक शोध टीम अमेरिका भर में कॉलेज के छात्रों के GPA का निर्धारण करना चाहती है, शोध टीम को सभी 21 मिलियन कॉलेज छात्रों से डेटा एकत्र करने में कठिनाई होती है; यह 4, 000 छात्रों का उपयोग करके जनसंख्या का यादृच्छिक नमूना लेने का निर्णय करता है।

अब मान लें कि टीम नमूना प्रतिभागियों और चमत्कारों की विभिन्न विशेषताओं को देखती है अगर जीपीए और छात्रों की बड़ी कंपनियों में कोई मतभेद हैं। मान लीजिए कि यह पता चलता है कि 560 छात्र इंग्लिश मैजर्स हैं, 1, 135 साइंस मैजर्स हैं, 800 कंप्यूटर साइंस मैजर्स हैं, 1, 090 इंजीनियरिंग मैजर्स हैं और 415 मैथ मेजर हैं। टीम एक आनुपातिक स्तरीकृत यादृच्छिक नमूने का उपयोग करना चाहती है, जहां नमूने की परत आबादी में यादृच्छिक नमूने के लिए आनुपातिक है।

मान लें कि टीम अमेरिका में कॉलेज के छात्रों की जनसांख्यिकी पर शोध करती है और अंग्रेजी में 12% प्रमुख, विज्ञान में 28% प्रमुख, कंप्यूटर विज्ञान में 24% प्रमुख, इंजीनियरिंग में 21% प्रमुख, और 15% प्रमुख में प्रतिशत का पता लगाती है। गणित में। इस प्रकार, पांच स्तरीकृत स्तरीकृत यादृच्छिक नमूनाकरण प्रक्रिया से बनाए जाते हैं।

टीम को तब यह पुष्टि करने की आवश्यकता होती है कि जनसंख्या का स्ट्रैटम नमूने में स्ट्रेटम के अनुपात में है; हालाँकि, वे पाते हैं कि अनुपात समान नहीं हैं। इसके बाद टीम को जनसंख्या से 4, 000 छात्रों को फिर से नमूना लेने और 480 अंग्रेजी, 1, 120 विज्ञान, 960 कंप्यूटर विज्ञान, 840 इंजीनियरिंग, और 600 गणित के छात्रों का चयन करने की आवश्यकता है।

उन लोगों के साथ, इसमें कॉलेज के छात्रों का एक आनुपातिक स्तरीकृत यादृच्छिक नमूना होता है, जो यूएस में छात्रों के कॉलेज की बड़ी संख्या का बेहतर प्रतिनिधित्व प्रदान करता है। शोधकर्ता विशिष्ट स्ट्रैटम को उजागर कर सकते हैं, यूएस कॉलेज के छात्रों के अलग-अलग अध्ययनों का निरीक्षण कर सकते हैं और विभिन्न ग्रेड बिंदु औसत का निरीक्षण कर सकते हैं। ।

सरल यादृच्छिक बनाम स्तरीकृत यादृच्छिक नमूने

सरल यादृच्छिक नमूने और स्तरीकृत यादृच्छिक नमूने दोनों सांख्यिकीय माप उपकरण हैं। संपूर्ण डेटा आबादी का प्रतिनिधित्व करने के लिए एक सरल यादृच्छिक नमूना का उपयोग किया जाता है। एक स्तरीकृत यादृच्छिक नमूना साझा विशेषताओं के आधार पर जनसंख्या को छोटे समूहों या वर्गों में विभाजित करता है।

सरल यादृच्छिक नमूना अक्सर उपयोग किया जाता है जब डेटा आबादी के बारे में बहुत कम जानकारी उपलब्ध होती है, जब डेटा आबादी में कई सबसे अलग-अलग सबसेट में विभाजित करने के लिए बहुत सारे अंतर होते हैं, या जब डेटा आबादी के बीच केवल एक अलग विशेषता होती है।

उदाहरण के लिए, एक कैंडी कंपनी अपने उत्पाद लाइन के भविष्य का निर्धारण करने के लिए अपने ग्राहकों की खरीद की आदतों का अध्ययन करना चाह सकती है। यदि 10, 000 ग्राहक हैं, तो यह उन 100 ग्राहकों को यादृच्छिक नमूने के रूप में चुन सकता है। यह तब लागू हो सकता है जो इसे उन 100 ग्राहकों से इसके आधार के बाकी हिस्सों में पाता है। स्तरीकरण के विपरीत, यह 100 सदस्यों को उनकी व्यक्तिगत विशेषताओं के बिना किसी भी संबंध में यादृच्छिक रूप से नमूना देगा।

आनुपातिक और अनुपातहीन स्तरीकरण

स्तरीकृत यादृच्छिक नमूना सुनिश्चित करता है कि किसी दिए गए आबादी के प्रत्येक उपसमूह को एक शोध अध्ययन के पूरे नमूना आबादी के भीतर पर्याप्त रूप से दर्शाया गया है। स्तरीकरण आनुपातिक या अनुपातहीन हो सकता है। एक आनुपातिक स्तरीकृत विधि में, प्रत्येक स्ट्रैटम का नमूना आकार स्ट्रैटम के जनसंख्या आकार के अनुपात में है।

उदाहरण के लिए, यदि शोधकर्ता आयु सीमा का उपयोग करते हुए 50, 000 स्नातकों का एक नमूना चाहता था, तो इस सूत्र का उपयोग करके आनुपातिक स्तरीकृत यादृच्छिक नमूना प्राप्त किया जाएगा: (नमूना आकार / जनसंख्या आकार) एक्स स्ट्रेटम आकार। नीचे दी गई तालिका में प्रति वर्ष 180, 000 एमबीए स्नातकों की जनसंख्या का आकार माना जाता है।

आयु वर्ग

24-28

29-33

34-37

संपूर्ण

लोगों की संख्या स्ट्रेटम में

90, 000

60, 000

30, 000

180, 000

स्ट्रेटा नमूना आकार

25, 000

16, 667

8333

50, 000

24 से 28 वर्ष की आयु के एमबीए स्नातकों के लिए स्ट्रेट सैंपल साइज़ (50, 000 / 180, 000) x 90, 000 / 25, 000 के रूप में गणना की जाती है। उसी विधि का उपयोग अन्य आयु सीमा समूहों के लिए किया जाता है। अब जब स्ट्रैट सैंपल साइज का पता चल गया है, तो शोधकर्ता अपने सर्वेक्षण प्रतिभागियों का चयन करने के लिए प्रत्येक स्ट्रैटम में सरल यादृच्छिक नमूना प्रदर्शन कर सकते हैं। दूसरे शब्दों में, 24-28 आयु वर्ग के 25, 000 स्नातकों को पूरी आबादी से यादृच्छिक रूप से चुना जाएगा, 29-33 आयु वर्ग के 16, 667 स्नातकों को यादृच्छिक रूप से आबादी से चुना जाएगा, और इसी तरह।

एक अव्यवस्थित स्तरीकृत नमूने में, प्रत्येक स्ट्रेटम का आकार जनसंख्या में इसके आकार के अनुपात में नहीं होता है। शोधकर्ता 34-37 आयु वर्ग के भीतर स्नातकों में से 1/2 का नमूना और 29-33 आयु वर्ग में 1/3 स्नातकों का नमूना लेने का निर्णय ले सकता है।

यह ध्यान रखना महत्वपूर्ण है कि एक व्यक्ति कई स्तरों में फिट नहीं हो सकता है। प्रत्येक इकाई को केवल एक स्ट्रैटम में फिट होना चाहिए। ओवरगैपिंग उप-समूह होने का मतलब है कि कुछ व्यक्तियों को सर्वेक्षण के लिए चुने जाने की अधिक संभावना होगी, जो एक प्रकार की संभावना नमूने के रूप में स्तरीकृत नमूने की अवधारणा को पूरी तरह से नकार देता है।

[महत्वपूर्ण: पोर्टफोलियो प्रबंधक एक इंडेक्स जैसे बॉन्ड इंडेक्स की प्रतिकृति बनाकर पोर्टफोलियो बनाने के लिए स्तरीकृत यादृच्छिक नमूने का उपयोग कर सकते हैं।]

स्तरीकृत यादृच्छिक नमूनाकरण के लाभ

स्तरीकृत यादृच्छिक नमूने का मुख्य लाभ यह है कि यह नमूने में प्रमुख जनसंख्या विशेषताओं को कैप्चर करता है। एक भारित औसत के समान, नमूनाकरण की यह विधि नमूने में विशेषताओं का उत्पादन करती है जो समग्र आबादी के आनुपातिक हैं। स्तरीकृत यादृच्छिक नमूना विभिन्न प्रकार की विशेषताओं के साथ आबादी के लिए अच्छी तरह से काम करता है, लेकिन अन्यथा अप्रभावी है यदि उपसमूह का गठन नहीं किया जा सकता है।

स्तरीकरण अनुमान में एक छोटी सी त्रुटि देता है और सरल यादृच्छिक नमूना विधि की तुलना में अधिक सटीक होता है। स्ट्रैट के बीच अंतर जितना अधिक होगा, परिशुद्धता में अधिक लाभ होगा।

स्तरीकृत यादृच्छिक नमूनाकरण के नुकसान

दुर्भाग्य से, अनुसंधान की इस पद्धति का उपयोग हर अध्ययन में नहीं किया जा सकता है। विधि का नुकसान यह है कि इसे ठीक से उपयोग करने के लिए कई शर्तें पूरी होनी चाहिए। शोधकर्ताओं को अध्ययन की जा रही आबादी के प्रत्येक सदस्य की पहचान करनी चाहिए और उनमें से प्रत्येक को एक में वर्गीकृत करना चाहिए, और केवल एक, उप-विभाजन। परिणामस्वरूप, स्तरीकृत यादृच्छिक नमूना नुकसानदायक होता है जब शोधकर्ता जनसंख्या के प्रत्येक सदस्य को विश्वासपूर्वक उपसमूह में वर्गीकृत नहीं कर सकते। इसके अलावा, संपूर्ण आबादी की एक विस्तृत और निश्चित सूची को खोजना चुनौतीपूर्ण हो सकता है।

ओवरलैपिंग एक मुद्दा हो सकता है यदि ऐसे विषय हैं जो कई उपसमूहों में आते हैं। जब सरल यादृच्छिक नमूना किया जाता है, तो जो कई उपसमूहों में होते हैं उन्हें चुने जाने की अधिक संभावना होती है। परिणाम आबादी का गलत चित्रण या गलत प्रतिबिंब हो सकता है।

उपरोक्त उदाहरण इसे आसान बनाते हैं: स्नातक, स्नातक, पुरुष और महिला स्पष्ट रूप से परिभाषित समूह हैं। अन्य स्थितियों में, हालांकि, यह कहीं अधिक कठिन हो सकता है। दौड़, जातीयता या धर्म जैसी विशेषताओं को शामिल करने की कल्पना करें। छँटाई प्रक्रिया अधिक कठिन हो जाती है, स्तरीकृत यादृच्छिक नमूने को अप्रभावी और आदर्श विधि से कम प्रदान करता है।

इन्वेस्टमेंट अकाउंट्स प्रोवाइडर नाम की तुलना करें। विज्ञापनदाता का विवरण × इस तालिका में दिखाई देने वाले प्रस्ताव उन साझेदारियों से हैं जिनसे इन्वेस्टोपेडिया को मुआवजा मिलता है।

स्तरीय अनियमित नमूने का चुनाव

स्तरीय अनियमित नमूने का चुनाव

कैसे स्तरीकृत यादृच्छिक नमूनाकरण कार्य करता है

चाबी छीन लेना

स्तरीकृत यादृच्छिक नमूनाकरण का उदाहरण

सरल यादृच्छिक बनाम स्तरीकृत यादृच्छिक नमूने

आनुपातिक और अनुपातहीन स्तरीकरण

स्तरीकृत यादृच्छिक नमूनाकरण के लाभ

स्तरीकृत यादृच्छिक नमूनाकरण के नुकसान

संबंधित शर्तें