मुख्य » एल्गोरिथम ट्रेडिंग » स्तरीय अनियमित नमूने का चुनाव

स्तरीय अनियमित नमूने का चुनाव

एल्गोरिथम ट्रेडिंग : स्तरीय अनियमित नमूने का चुनाव
स्तरीकृत यादृच्छिक नमूनाकरण क्या है?

स्तरीकृत यादृच्छिक नमूनाकरण नमूनाकरण की एक विधि है जिसमें एक आबादी के विभाजन को छोटे उप समूहों में शामिल किया जाता है जिन्हें स्ट्रेट के रूप में जाना जाता है। स्तरीकृत यादृच्छिक नमूनाकरण या स्तरीकरण में, स्ट्रेट का गठन सदस्यों की साझा विशेषताओं या विशेषताओं जैसे आय या शैक्षिक प्राप्ति के आधार पर किया जाता है।

स्तरीकृत यादृच्छिक नमूनाकरण को आनुपातिक यादृच्छिक नमूनाकरण या कोटा यादृच्छिक नमूनाकरण भी कहा जाता है।

[महत्वपूर्ण: स्तरीकृत नमूनाकरण का उपयोग आबादी में समूहों के बीच अंतर को उजागर करने के लिए किया जाता है, जैसा कि सरल यादृच्छिक नमूनाकरण के विपरीत होता है, जो जनसंख्या के सभी सदस्यों को समान माना जाता है, जिसका नमूना होने की समान संभावना है।]

1:40

स्तरीय अनियमित नमूने का चुनाव

कैसे स्तरीकृत यादृच्छिक नमूनाकरण कार्य करता है

समान विशेषताओं वाली संस्थाओं के समूह पर विश्लेषण या अनुसंधान पूरा करते समय, एक शोधकर्ता यह पा सकता है कि जनसंख्या का आकार बहुत बड़ा है जिसके लिए अनुसंधान पूरा करना है। समय और धन बचाने के लिए, एक विश्लेषक आबादी से एक छोटे समूह का चयन करके अधिक व्यवहार्य दृष्टिकोण पर ले जा सकता है। छोटे समूह को एक नमूना आकार के रूप में संदर्भित किया जाता है, जो आबादी का एक सबसेट है जो संपूर्ण आबादी का प्रतिनिधित्व करने के लिए उपयोग किया जाता है। एक नमूने को जनसंख्या से कई तरीकों से चुना जा सकता है, जिनमें से एक स्तरीकृत यादृच्छिक नमूना विधि है।

एक स्तरीकृत रैंडम सैंपलिंग में पूरी आबादी को समतामूलक समूहों में विभाजित किया जाता है जिसे स्ट्रैटा ( स्ट्रैटम के लिए बहुवचन ) कहा जाता है यादृच्छिक नमूने तब प्रत्येक स्ट्रैटम से चुने जाते हैं। उदाहरण के लिए, एक अकादमिक शोधकर्ता पर विचार करें, जो 2007 में एमबीए के छात्रों की संख्या जानना चाहते हैं, जिन्होंने स्नातक होने के तीन महीने के भीतर नौकरी की पेशकश की थी।

वह जल्द ही पाएंगे कि वर्ष के लिए लगभग 200, 000 एमबीए स्नातक थे। वह सिर्फ 50, 000 स्नातकों का एक सरल यादृच्छिक नमूना लेने और एक सर्वेक्षण चलाने का फैसला कर सकता है। अभी भी बेहतर है, वह आबादी को तबाह कर सकता है और तबके से एक यादृच्छिक नमूना ले सकता है। ऐसा करने के लिए, वह लिंग, आयु सीमा, नस्ल, राष्ट्रीयता के देश, और कैरियर की पृष्ठभूमि के आधार पर जनसंख्या समूह बनाएगा। जनसंख्या की तुलना में प्रत्येक स्ट्रैटम से एक रैंडम सैंपल स्ट्रैटम के आकार के अनुपात में लिया जाता है। तब स्ट्रैट के इन सबसेट को रैंडम सैंपल बनाने के लिए रखा जाता है।

चाबी छीन लेना

  • स्तरीकृत यादृच्छिक नमूना शोधकर्ताओं को एक नमूना आबादी प्राप्त करने की अनुमति देता है जो अध्ययन की जा रही पूरी आबादी का सबसे अच्छा प्रतिनिधित्व करता है।
  • स्तरीकृत यादृच्छिक नमूनाकरण में संपूर्ण आबादी को समरूप समूहों में विभाजित करना शामिल है जिन्हें समता कहा जाता है।
  • स्तरीकृत यादृच्छिक नमूना सरल यादृच्छिक नमूने से भिन्न होता है, जिसमें संपूर्ण आबादी से डेटा का यादृच्छिक चयन शामिल होता है, इसलिए प्रत्येक संभावित नमूना समान रूप से होने की संभावना है।

स्तरीकृत यादृच्छिक नमूनाकरण का उदाहरण

मान लीजिए कि एक शोध टीम अमेरिका भर में कॉलेज के छात्रों के GPA का निर्धारण करना चाहती है, शोध टीम को सभी 21 मिलियन कॉलेज छात्रों से डेटा एकत्र करने में कठिनाई होती है; यह 4, 000 छात्रों का उपयोग करके जनसंख्या का यादृच्छिक नमूना लेने का निर्णय करता है।

अब मान लें कि टीम नमूना प्रतिभागियों और चमत्कारों की विभिन्न विशेषताओं को देखती है अगर जीपीए और छात्रों की बड़ी कंपनियों में कोई मतभेद हैं। मान लीजिए कि यह पता चलता है कि 560 छात्र इंग्लिश मैजर्स हैं, 1, 135 साइंस मैजर्स हैं, 800 कंप्यूटर साइंस मैजर्स हैं, 1, 090 इंजीनियरिंग मैजर्स हैं और 415 मैथ मेजर हैं। टीम एक आनुपातिक स्तरीकृत यादृच्छिक नमूने का उपयोग करना चाहती है, जहां नमूने की परत आबादी में यादृच्छिक नमूने के लिए आनुपातिक है।

मान लें कि टीम अमेरिका में कॉलेज के छात्रों की जनसांख्यिकी पर शोध करती है और अंग्रेजी में 12% प्रमुख, विज्ञान में 28% प्रमुख, कंप्यूटर विज्ञान में 24% प्रमुख, इंजीनियरिंग में 21% प्रमुख, और 15% प्रमुख में प्रतिशत का पता लगाती है। गणित में। इस प्रकार, पांच स्तरीकृत स्तरीकृत यादृच्छिक नमूनाकरण प्रक्रिया से बनाए जाते हैं।

टीम को तब यह पुष्टि करने की आवश्यकता होती है कि जनसंख्या का स्ट्रैटम नमूने में स्ट्रेटम के अनुपात में है; हालाँकि, वे पाते हैं कि अनुपात समान नहीं हैं। इसके बाद टीम को जनसंख्या से 4, 000 छात्रों को फिर से नमूना लेने और 480 अंग्रेजी, 1, 120 विज्ञान, 960 कंप्यूटर विज्ञान, 840 इंजीनियरिंग, और 600 गणित के छात्रों का चयन करने की आवश्यकता है।

उन लोगों के साथ, इसमें कॉलेज के छात्रों का एक आनुपातिक स्तरीकृत यादृच्छिक नमूना होता है, जो यूएस में छात्रों के कॉलेज की बड़ी संख्या का बेहतर प्रतिनिधित्व प्रदान करता है। शोधकर्ता विशिष्ट स्ट्रैटम को उजागर कर सकते हैं, यूएस कॉलेज के छात्रों के अलग-अलग अध्ययनों का निरीक्षण कर सकते हैं और विभिन्न ग्रेड बिंदु औसत का निरीक्षण कर सकते हैं। ।

सरल यादृच्छिक बनाम स्तरीकृत यादृच्छिक नमूने

सरल यादृच्छिक नमूने और स्तरीकृत यादृच्छिक नमूने दोनों सांख्यिकीय माप उपकरण हैं। संपूर्ण डेटा आबादी का प्रतिनिधित्व करने के लिए एक सरल यादृच्छिक नमूना का उपयोग किया जाता है। एक स्तरीकृत यादृच्छिक नमूना साझा विशेषताओं के आधार पर जनसंख्या को छोटे समूहों या वर्गों में विभाजित करता है।

सरल यादृच्छिक नमूना अक्सर उपयोग किया जाता है जब डेटा आबादी के बारे में बहुत कम जानकारी उपलब्ध होती है, जब डेटा आबादी में कई सबसे अलग-अलग सबसेट में विभाजित करने के लिए बहुत सारे अंतर होते हैं, या जब डेटा आबादी के बीच केवल एक अलग विशेषता होती है।

उदाहरण के लिए, एक कैंडी कंपनी अपने उत्पाद लाइन के भविष्य का निर्धारण करने के लिए अपने ग्राहकों की खरीद की आदतों का अध्ययन करना चाह सकती है। यदि 10, 000 ग्राहक हैं, तो यह उन 100 ग्राहकों को यादृच्छिक नमूने के रूप में चुन सकता है। यह तब लागू हो सकता है जो इसे उन 100 ग्राहकों से इसके आधार के बाकी हिस्सों में पाता है। स्तरीकरण के विपरीत, यह 100 सदस्यों को उनकी व्यक्तिगत विशेषताओं के बिना किसी भी संबंध में यादृच्छिक रूप से नमूना देगा।

आनुपातिक और अनुपातहीन स्तरीकरण

स्तरीकृत यादृच्छिक नमूना सुनिश्चित करता है कि किसी दिए गए आबादी के प्रत्येक उपसमूह को एक शोध अध्ययन के पूरे नमूना आबादी के भीतर पर्याप्त रूप से दर्शाया गया है। स्तरीकरण आनुपातिक या अनुपातहीन हो सकता है। एक आनुपातिक स्तरीकृत विधि में, प्रत्येक स्ट्रैटम का नमूना आकार स्ट्रैटम के जनसंख्या आकार के अनुपात में है।

उदाहरण के लिए, यदि शोधकर्ता आयु सीमा का उपयोग करते हुए 50, 000 स्नातकों का एक नमूना चाहता था, तो इस सूत्र का उपयोग करके आनुपातिक स्तरीकृत यादृच्छिक नमूना प्राप्त किया जाएगा: (नमूना आकार / जनसंख्या आकार) एक्स स्ट्रेटम आकार। नीचे दी गई तालिका में प्रति वर्ष 180, 000 एमबीए स्नातकों की जनसंख्या का आकार माना जाता है।

आयु वर्ग


24-28


29-33


34-37


संपूर्ण


लोगों की संख्या स्ट्रेटम में


90, 000


60, 000


30, 000


180, 000


स्ट्रेटा नमूना आकार


25, 000


16, 667


8333


50, 000


24 से 28 वर्ष की आयु के एमबीए स्नातकों के लिए स्ट्रेट सैंपल साइज़ (50, 000 / 180, 000) x 90, 000 / 25, 000 के रूप में गणना की जाती है। उसी विधि का उपयोग अन्य आयु सीमा समूहों के लिए किया जाता है। अब जब स्ट्रैट सैंपल साइज का पता चल गया है, तो शोधकर्ता अपने सर्वेक्षण प्रतिभागियों का चयन करने के लिए प्रत्येक स्ट्रैटम में सरल यादृच्छिक नमूना प्रदर्शन कर सकते हैं। दूसरे शब्दों में, 24-28 आयु वर्ग के 25, 000 स्नातकों को पूरी आबादी से यादृच्छिक रूप से चुना जाएगा, 29-33 आयु वर्ग के 16, 667 स्नातकों को यादृच्छिक रूप से आबादी से चुना जाएगा, और इसी तरह।

एक अव्यवस्थित स्तरीकृत नमूने में, प्रत्येक स्ट्रेटम का आकार जनसंख्या में इसके आकार के अनुपात में नहीं होता है। शोधकर्ता 34-37 आयु वर्ग के भीतर स्नातकों में से 1/2 का नमूना और 29-33 आयु वर्ग में 1/3 स्नातकों का नमूना लेने का निर्णय ले सकता है।

यह ध्यान रखना महत्वपूर्ण है कि एक व्यक्ति कई स्तरों में फिट नहीं हो सकता है। प्रत्येक इकाई को केवल एक स्ट्रैटम में फिट होना चाहिए। ओवरगैपिंग उप-समूह होने का मतलब है कि कुछ व्यक्तियों को सर्वेक्षण के लिए चुने जाने की अधिक संभावना होगी, जो एक प्रकार की संभावना नमूने के रूप में स्तरीकृत नमूने की अवधारणा को पूरी तरह से नकार देता है।

[महत्वपूर्ण: पोर्टफोलियो प्रबंधक एक इंडेक्स जैसे बॉन्ड इंडेक्स की प्रतिकृति बनाकर पोर्टफोलियो बनाने के लिए स्तरीकृत यादृच्छिक नमूने का उपयोग कर सकते हैं।]

स्तरीकृत यादृच्छिक नमूनाकरण के लाभ

स्तरीकृत यादृच्छिक नमूने का मुख्य लाभ यह है कि यह नमूने में प्रमुख जनसंख्या विशेषताओं को कैप्चर करता है। एक भारित औसत के समान, नमूनाकरण की यह विधि नमूने में विशेषताओं का उत्पादन करती है जो समग्र आबादी के आनुपातिक हैं। स्तरीकृत यादृच्छिक नमूना विभिन्न प्रकार की विशेषताओं के साथ आबादी के लिए अच्छी तरह से काम करता है, लेकिन अन्यथा अप्रभावी है यदि उपसमूह का गठन नहीं किया जा सकता है।

स्तरीकरण अनुमान में एक छोटी सी त्रुटि देता है और सरल यादृच्छिक नमूना विधि की तुलना में अधिक सटीक होता है। स्ट्रैट के बीच अंतर जितना अधिक होगा, परिशुद्धता में अधिक लाभ होगा।

स्तरीकृत यादृच्छिक नमूनाकरण के नुकसान

दुर्भाग्य से, अनुसंधान की इस पद्धति का उपयोग हर अध्ययन में नहीं किया जा सकता है। विधि का नुकसान यह है कि इसे ठीक से उपयोग करने के लिए कई शर्तें पूरी होनी चाहिए। शोधकर्ताओं को अध्ययन की जा रही आबादी के प्रत्येक सदस्य की पहचान करनी चाहिए और उनमें से प्रत्येक को एक में वर्गीकृत करना चाहिए, और केवल एक, उप-विभाजन। परिणामस्वरूप, स्तरीकृत यादृच्छिक नमूना नुकसानदायक होता है जब शोधकर्ता जनसंख्या के प्रत्येक सदस्य को विश्वासपूर्वक उपसमूह में वर्गीकृत नहीं कर सकते। इसके अलावा, संपूर्ण आबादी की एक विस्तृत और निश्चित सूची को खोजना चुनौतीपूर्ण हो सकता है।

ओवरलैपिंग एक मुद्दा हो सकता है यदि ऐसे विषय हैं जो कई उपसमूहों में आते हैं। जब सरल यादृच्छिक नमूना किया जाता है, तो जो कई उपसमूहों में होते हैं उन्हें चुने जाने की अधिक संभावना होती है। परिणाम आबादी का गलत चित्रण या गलत प्रतिबिंब हो सकता है।

उपरोक्त उदाहरण इसे आसान बनाते हैं: स्नातक, स्नातक, पुरुष और महिला स्पष्ट रूप से परिभाषित समूह हैं। अन्य स्थितियों में, हालांकि, यह कहीं अधिक कठिन हो सकता है। दौड़, जातीयता या धर्म जैसी विशेषताओं को शामिल करने की कल्पना करें। छँटाई प्रक्रिया अधिक कठिन हो जाती है, स्तरीकृत यादृच्छिक नमूने को अप्रभावी और आदर्श विधि से कम प्रदान करता है।

इन्वेस्टमेंट अकाउंट्स प्रोवाइडर नाम की तुलना करें। विज्ञापनदाता का विवरण × इस तालिका में दिखाई देने वाले प्रस्ताव उन साझेदारियों से हैं जिनसे इन्वेस्टोपेडिया को मुआवजा मिलता है।

संबंधित शर्तें

नमूना एक नमूना एक बड़े समूह का एक छोटा, प्रबंधनीय संस्करण है। नमूने का उपयोग सांख्यिकीय परीक्षण में किया जाता है जब जनसंख्या का आकार बहुत बड़ा होता है। अधिक सरल रैंडम नमूने कैसे काम करते हैं एक साधारण यादृच्छिक नमूना एक सांख्यिकीय आबादी का एक सबसेट होता है, जिसमें सबसेट के प्रत्येक सदस्य को चुने जाने की समान संभावना होती है। एक साधारण यादृच्छिक नमूना एक समूह का निष्पक्ष प्रतिनिधित्व करने के लिए होता है। अधिक प्रतिनिधि नमूना अक्सर व्यापक भावना को फैलाने के लिए उपयोग किया जाता है एक प्रतिनिधि नमूना आबादी का एक सबसेट है जो संपूर्ण आबादी की विशेषताओं को दर्शाता है। अधिक सिस्टमैटिक सैंपलिंग का इन्स एंड आउट्स सिस्टमैटिक सैंपलिंग एक संभाव्यता सैंपलिंग विधि है जिसमें बड़ी आबादी से एक यादृच्छिक नमूना चुना जाता है। अधिक नमूनाकरण परिभाषा नमूनाकरण एक ऐसी प्रक्रिया है जिसका उपयोग सांख्यिकीय विश्लेषण में किया जाता है जिसमें टिप्पणियों का एक समूह एक बड़ी आबादी से निकाला जाता है। अधिक टी-टेस्ट डेफिनिशन एक टी-टेस्ट एक प्रकार का अनुमानात्मक आँकड़ा है जिसका उपयोग यह निर्धारित करने के लिए किया जाता है कि क्या दो समूहों के साधनों के बीच एक महत्वपूर्ण अंतर है, जो कुछ विशेषताओं में संबंधित हो सकता है। अधिक साथी लिंक
अनुशंसित
अपनी टिप्पणी छोड़ दो