मुख्य » एल्गोरिथम ट्रेडिंग » वित्त में परिकल्पना परीक्षण: संकल्पना और उदाहरण

वित्त में परिकल्पना परीक्षण: संकल्पना और उदाहरण

एल्गोरिथम ट्रेडिंग : वित्त में परिकल्पना परीक्षण: संकल्पना और उदाहरण

आपका निवेश सलाहकार आपको एक मासिक आय निवेश योजना का प्रस्ताव देता है जो हर महीने एक वैरिएबल रिटर्न का वादा करता है। आप इसमें तभी निवेश करेंगे जब आपको औसतन $ 180 मासिक आय का आश्वासन दिया जाए। आपका सलाहकार आपको यह भी बताता है कि पिछले 300 महीनों के लिए, इस योजना में $ 190 के औसत मूल्य और $ 75 के मानक विचलन के साथ निवेश रिटर्न था। क्या आपको इस योजना में निवेश करना चाहिए? इस तरह के निर्णय लेने के लिए परिकल्पना परीक्षण सहायता के लिए आता है।

यह लेख एक सामान्य वितरण तालिका, सूत्र, पी-मूल्य और आंकड़ों की संबंधित बुनियादी बातों की अवधारणाओं के साथ पाठकों की परिचितता को मानता है।

परिकल्पना परीक्षण क्या है?

हाइपोथिसिस या महत्व परीक्षण एक नमूना सेट में मापा गया डेटा का उपयोग करके किसी दिए गए जनसंख्या सेट में रुचि के पैरामीटर के बारे में दावे, विचार या परिकल्पना का परीक्षण करने के लिए एक गणितीय मॉडल है। पूरी आबादी की विशेषताओं के बारे में अधिक निर्णायक जानकारी इकट्ठा करने के लिए चयनित नमूनों पर गणना की जाती है, जो संपूर्ण डेटासेट के बारे में दावों या विचारों का परीक्षण करने का एक व्यवस्थित तरीका सक्षम करता है।

यहाँ एक सरल उदाहरण है: एक स्कूल के प्रिंसिपल की रिपोर्ट है कि उसके स्कूल के छात्र परीक्षा में 10 में से औसतन 7 अंक हासिल करते हैं। इस "परिकल्पना" का परीक्षण करने के लिए, हम स्कूल के पूरे छात्र आबादी (कहते हैं 300) से 30 छात्रों (नमूना) के निशान रिकॉर्ड करते हैं और उस नमूने के माध्य की गणना करते हैं। हम तब (परिकलित) नमूना माध्य (रिपोर्ट की गई) जनसंख्या माध्य की तुलना कर सकते हैं और परिकल्पना की पुष्टि करने का प्रयास कर सकते हैं।

एक और उदाहरण लेने के लिए, किसी विशेष म्यूचुअल फंड का वार्षिक रिटर्न 8% है। मान लें कि म्यूचुअल फंड 20 साल से अस्तित्व में है। हम कहते हैं, पांच साल (नमूना) के लिए म्यूचुअल फंड के वार्षिक रिटर्न का एक यादृच्छिक नमूना लेते हैं और इसके मतलब की गणना करते हैं। हम तब (गणना की गई) नमूना की तुलना (दावा की गई) जनसंख्या की परिकल्पना को सत्यापित करने के लिए करते हैं।

निर्णय लेने के मानदंड को डेटासेट के कुछ मापदंडों पर आधारित होना चाहिए।

परिकल्पना परीक्षण के लिए अलग-अलग तरीके मौजूद हैं, लेकिन एक ही चार बुनियादी कदम शामिल हैं:

चरण 1: परिकल्पना को परिभाषित करें

आमतौर पर, रिपोर्ट किए गए मान (या दावे के आंकड़े) को परिकल्पना के रूप में कहा जाता है और इसे सच माना जाता है। उपरोक्त उदाहरणों के लिए, यह परिकल्पना होगी:

  • उदाहरण A: स्कूल के छात्र परीक्षा में 10 में से औसतन 7 अंक हासिल करते हैं।
  • उदाहरण बी: म्यूचुअल फंड का वार्षिक रिटर्न 8% प्रति वर्ष है।

यह वर्णित विवरण " नल परिकल्पना (एच 0 ) " का गठन करता है और इसे सच माना जाता है - जिस तरह से एक जूरी ट्रायल में एक प्रतिवादी को निर्दोष माना जाता है, जब तक कि अदालत में प्रस्तुत सबूतों द्वारा दोषी साबित न हो जाए। इसी तरह, परिकल्पना परीक्षण एक "शून्य परिकल्पना" बताते हुए और मानकर शुरू होता है और फिर यह प्रक्रिया निर्धारित करती है कि क्या धारणा सही या गलत होने की संभावना है।

ध्यान देने वाली महत्वपूर्ण बात यह है कि हम अशक्त परिकल्पना का परीक्षण कर रहे हैं क्योंकि इसकी वैधता के बारे में संदेह का एक तत्व है। जो भी जानकारी कथित शून्य परिकल्पना के खिलाफ है, वह वैकल्पिक परिकल्पना (एच 1 ) में कैद है उपरोक्त उदाहरणों के लिए, वैकल्पिक परिकल्पना इस प्रकार होगी:

  • छात्र एक औसत स्कोर करते हैं जो 7 के बराबर नहीं है
  • म्यूचुअल फंड का वार्षिक रिटर्न 8% प्रति वर्ष के बराबर नहीं है

दूसरे शब्दों में, वैकल्पिक परिकल्पना शून्य परिकल्पना का प्रत्यक्ष विरोधाभास है।

जैसा कि एक परीक्षण में, जूरी ने प्रतिवादी की मासूमियत (अशक्त परिकल्पना) को मान लिया। अभियोजक को अन्यथा साबित करना होगा (वैकल्पिक परिकल्पना)। इसी तरह, शोधकर्ता को यह साबित करना होगा कि अशक्त परिकल्पना या तो सही है या गलत है। यदि अभियोजक वैकल्पिक परिकल्पना को साबित करने में विफल रहता है, तो जूरी को प्रतिवादी को जाने देना है (अशक्त परिकल्पना पर निर्णय को आधार बनाते हुए)। इसी तरह, यदि शोधकर्ता एक वैकल्पिक परिकल्पना साबित करने में विफल रहता है (या बस कुछ नहीं करता है), तो शून्य परिकल्पना को सच माना जाता है।

चरण 2: मानदंड सेट करें

निर्णय लेने के मानदंड को डेटासेट के कुछ मापदंडों पर आधारित होना चाहिए और यह वह जगह है जहां सामान्य वितरण का कनेक्शन चित्र में आता है।

नमूने के वितरण के बारे में मानक आंकड़ों के अनुसार, "किसी भी नमूना आकार n के लिए, X̅ का नमूना वितरण सामान्य है यदि जनसंख्या X जिसमें से नमूना सामान्य रूप से वितरित किया गया है।" इसलिए, अन्य सभी संभावित नमूने की संभावनाओं का मतलब है। एक का चयन कर सकते हैं आम तौर पर वितरित कर रहे हैं।

उदाहरण के लिए, यह निर्धारित करें कि XYZ शेयर बाजार में सूचीबद्ध किसी भी शेयर का औसत दैनिक रिटर्न, नए साल के दिन 2% से अधिक है।

एच 0 : अशक्त परिकल्पना: मतलब = 2%

एच 1 : वैकल्पिक परिकल्पना: मतलब> 2% (यही हम साबित करना चाहते हैं)

नमूना लें (कुल 500 में से 50 स्टॉक कहें) और नमूना के माध्य की गणना करें।

एक सामान्य वितरण के लिए, 95% मान का मतलब आबादी के दो मानक विचलन के भीतर है। इसलिए, नमूना डेटासेट के लिए यह सामान्य वितरण और केंद्रीय सीमा धारणा हमें एक महत्व स्तर के रूप में 5% स्थापित करने की अनुमति देती है। यह समझ में आता है, इस धारणा के तहत, आउटलेयर होने की 5% से कम संभावना (100-95) है जो आबादी के मतलब से दो मानक विचलन से परे हैं। डेटासेट की प्रकृति के आधार पर, अन्य महत्व के स्तर को 1%, 5% या 10% पर लिया जा सकता है। वित्तीय गणना (व्यवहार वित्त सहित) के लिए, 5% आम तौर पर स्वीकृत सीमा है। यदि हम कोई भी गणना पाते हैं जो सामान्य दो मानक विचलन से परे हैं, तो हमारे पास नल की परिकल्पना को अस्वीकार करने के लिए आउटलेर का एक मजबूत मामला है।

आलेखीय रूप से, इसे निम्नानुसार दर्शाया गया है:

उपरोक्त उदाहरण में, यदि नमूने का मतलब 2% (3.5% कहते हैं) की तुलना में बहुत बड़ा है, तो हम अशक्त परिकल्पना को अस्वीकार करते हैं। वैकल्पिक परिकल्पना (मतलब> 2%) को स्वीकार किया जाता है, जो पुष्टि करता है कि शेयरों की औसत दैनिक वापसी वास्तव में 2% से ऊपर है।

हालांकि, यदि नमूने का मतलब 2% से अधिक होने की संभावना नहीं है (और इस पर रहता है, कहते हैं, लगभग 2.2%), तो हम शून्य परिकल्पना को अस्वीकार नहीं कर सकते। इस तरह के करीबी रेंज के मामलों को तय करने की चुनौती है। चयनित नमूनों और परिणामों से निष्कर्ष निकालने के लिए, महत्व का एक स्तर निर्धारित किया जाना है, जो एक निष्कर्ष को परिकल्पना के बारे में बनाने में सक्षम बनाता है। वैकल्पिक परिकल्पना इस तरह के करीबी रेंज के मामलों पर निर्णय लेने के लिए महत्व के स्तर या "महत्वपूर्ण मूल्य" अवधारणा को स्थापित करने में सक्षम बनाती है।

पाठ्यपुस्तक की मानक परिभाषा के अनुसार, “एक महत्वपूर्ण मूल्य एक कटऑफ मूल्य है जो सीमाओं को परिभाषित करता है जिसके आगे 5% से कम नमूना साधन प्राप्त किए जा सकते हैं यदि अशक्त परिकल्पना सच है। नमूना का अर्थ है कि एक महत्वपूर्ण मूल्य से परे, शून्य परिकल्पना को अस्वीकार करने के निर्णय के परिणामस्वरूप होगा। "उपरोक्त उदाहरण में, यदि हमने महत्वपूर्ण मान को 2.1% के रूप में परिभाषित किया है, और गणना का अर्थ 2.2% है, तो हम शून्य परिकल्पना को अस्वीकार करते हैं। एक महत्वपूर्ण मूल्य स्वीकृति या अस्वीकृति के बारे में एक स्पष्ट सीमांकन स्थापित करता है।

चरण 3: सांख्यिकी की गणना करें

इस चरण में चयनित आंकड़े के लिए आवश्यक आंकड़े (जैसे), परीक्षण आंकड़ों (जैसे माध्य, जेड-स्कोर, पी-मूल्य, आदि) की गणना करना शामिल है। (हम बाद के अनुभाग में इन्हें प्राप्त करेंगे।)

चरण 4: किसी निष्कर्ष पर पहुँचें

गणना किए गए मान के साथ, शून्य परिकल्पना पर निर्णय लें। यदि नमूना माध्य प्राप्त करने की संभावना 5% से कम है, तो निष्कर्ष शून्य परिकल्पना को अस्वीकार करना है। अन्यथा, शून्य परिकल्पना को स्वीकार और बनाए रखें।

त्रुटियों के प्रकार

नमूना-आधारित निर्णय लेने में चार संभावित परिणाम हो सकते हैं, पूरी आबादी के लिए सही प्रयोज्यता के संबंध में:

रिटेन करने का निर्णय


अस्वीकार करने का निर्णय


संपूर्ण जनसंख्या पर लागू होता है


सही बात


ग़लत

(टाइप 1 त्रुटि - ए)


संपूर्ण जनसंख्या पर लागू नहीं होता है


ग़लत

(टाइप 2 त्रुटि - बी)


सही बात


"सही" मामले वे हैं जहां नमूनों पर लिए गए निर्णय सही मायने में पूरी आबादी पर लागू होते हैं। त्रुटियों के मामले तब सामने आते हैं जब कोई नमूना गणना के आधार पर अशक्त परिकल्पना को बनाए रखने (या अस्वीकार) का फैसला करता है, लेकिन यह निर्णय वास्तव में पूरी आबादी के लिए लागू नहीं होता है। ये मामले टाइप 1 (अल्फा) और टाइप 2 (बीटा) त्रुटियों का गठन करते हैं, जैसा कि ऊपर दी गई तालिका में दिखाया गया है।

सही महत्वपूर्ण मान का चयन करने से टाइप -1 अल्फा त्रुटियों को समाप्त करने या उन्हें स्वीकार्य सीमा तक सीमित करने की अनुमति मिलती है।

अल्फा महत्व के स्तर पर त्रुटि को दर्शाता है और शोधकर्ता द्वारा निर्धारित किया जाता है। संभाव्यता गणना के लिए मानक 5% महत्व या विश्वास स्तर बनाए रखने के लिए, इसे 5% पर बनाए रखा जाता है।

लागू निर्णय लेने वाले मानदंड और परिभाषा के अनुसार:

  • "यह (अल्फा) मानदंड आमतौर पर 0.05 (a = 0.05) पर सेट किया जाता है, और हम अल्फा स्तर की तुलना पी-मान से करते हैं। जब टाइप I त्रुटि की संभावना 5% से कम है (p <0.05), तो हम अशक्त परिकल्पना को अस्वीकार करने का निर्णय लेते हैं; अन्यथा, हम अशक्त परिकल्पना को बनाए रखते हैं। "
  • इस प्रायिकता के लिए प्रयुक्त तकनीकी शब्द पी-वैल्यू है । इसे "एक नमूना परिणाम प्राप्त करने की संभावना के रूप में परिभाषित किया गया है, यह देखते हुए कि शून्य परिकल्पना में कहा गया मूल्य सत्य है। नमूना परिणाम प्राप्त करने के लिए पी-मूल्य महत्व के स्तर की तुलना में है। "
  • टाइप II त्रुटि, या बीटा त्रुटि, को "गलत ढंग से अशक्त परिकल्पना को बनाए रखने की संभावना के रूप में परिभाषित किया गया है, जब वास्तव में यह पूरी आबादी पर लागू नहीं होता है।"

कुछ और उदाहरण इस और अन्य गणनाओं को प्रदर्शित करेंगे।

उदाहरण 1

एक मासिक आय निवेश योजना मौजूद है जो चर मासिक रिटर्न का वादा करती है। एक निवेशक इसमें तभी निवेश करेगा जब उसे औसत $ 180 मासिक आय का आश्वासन दिया जाए। उनके पास 300 महीने के रिटर्न का एक नमूना है, जिसका मूल्य $ 190 है और $ 75 का मानक विचलन है। क्या उसे इस योजना में निवेश करना चाहिए ">

आइए समस्या को सेट करें। निवेशक इस योजना में निवेश करेगा यदि उसे अपने वांछित $ 180 औसत रिटर्न का आश्वासन दिया गया है।

एच 0 : अशक्त परिकल्पना: मतलब = 180

एच 1 : वैकल्पिक परिकल्पना: मतलब> 180

विधि 1: महत्वपूर्ण मान दृष्टिकोण

नमूना माध्य के लिए एक महत्वपूर्ण मान X L की पहचान करें, जो अशक्त परिकल्पना को अस्वीकार करने के लिए पर्याप्त है - अर्थात यदि नमूना अर्थ> = महत्वपूर्ण मान X L की अशक्त परिकल्पना को अस्वीकार करते हैं।

P (एक प्रकार I अल्फा त्रुटि की पहचान करें) = P (H 0 को अस्वीकार कर दिया गया कि H 0 सत्य है),

यह तब प्राप्त किया जाएगा जब नमूना माध्य महत्वपूर्ण सीमा से अधिक हो।

= P (यह देखते हुए कि H 0 सत्य है) = अल्फ़ा

आलेखीय रूप से, यह निम्नानुसार दिखाई देता है:

अल्फा लेना = ०.०५ (यानी ५% महत्व स्तर), जेड ०.०५ = १.६४५ (जेड-टेबल या सामान्य वितरण तालिका से)

=> X L = 180 + 1.645 * (75 / sqrt (300)) = 187.12

चूंकि नमूना माध्य (190) महत्वपूर्ण मूल्य (187.12) से अधिक है, अशक्त परिकल्पना को खारिज कर दिया गया है, और निष्कर्ष यह है कि औसत मासिक रिटर्न वास्तव में $ 180 से अधिक है, इसलिए निवेशक इस योजना में निवेश करने पर विचार कर सकते हैं।

विधि 2: मानकीकृत परीक्षण सांख्यिकी का उपयोग करना

एक भी मानकीकृत मूल्य z का उपयोग कर सकता है।

टेस्ट स्टेटिस्टिक, Z = (नमूना माध्य - जनसंख्या माध्य) / (std-dev / sqrt (सं। नमूनों की संख्या))।

फिर, अस्वीकृति क्षेत्र निम्नलिखित बन जाता है:

Z = (190 - 180) / (75 / वर्गर्ट (300)) = 2.309

5% महत्व के स्तर पर हमारा अस्वीकृति क्षेत्र Z> Z 0.05 = 1.645 है।

चूंकि Z = 2.309 1.645 से अधिक है, इसलिए उपर्युक्त समान निष्कर्ष के साथ अशक्त परिकल्पना को अस्वीकार किया जा सकता है।

विधि 3: P- मान गणना

हमारा उद्देश्य P (नमूना माध्य> = 190, जब माध्य = 180) की पहचान करना है।

= P (Z> = (190- 180) / (75 / sqrt (300))

= P (Z> = 2.309) = 0.0084 = 0.84%

पी-मान की गणना करने के लिए निम्न तालिका यह निष्कर्ष निकालती है कि औसत मासिक रिटर्न 180 से अधिक होने का पुष्ट प्रमाण है:

पी-मूल्य


अनुमान


1 से कम%


वैकल्पिक परिकल्पना का समर्थन करने वाले पुष्ट प्रमाण


1% से 5% के बीच


वैकल्पिक परिकल्पना का समर्थन करने वाले मजबूत सबूत


5% से 10% के बीच


वैकल्पिक परिकल्पना का समर्थन करने वाले कमजोर साक्ष्य


10% से अधिक


वैकल्पिक परिकल्पना का समर्थन करने वाला कोई सबूत नहीं


उदाहरण 2

एक नए स्टॉकब्रोकर (XYZ) का दावा है कि उसकी ब्रोकरेज फीस आपके वर्तमान स्टॉक ब्रोकर की (ABC) की तुलना में कम है। एक स्वतंत्र अनुसंधान फर्म से उपलब्ध डेटा इंगित करता है कि सभी एबीसी ब्रोकर क्लाइंट का औसत और एसटी-देव क्रमशः $ 18 और $ 6 है।

एबीसी के 100 ग्राहकों का एक नमूना लिया जाता है और ब्रोकरेज शुल्क की गणना XYZ ब्रोकर की नई दरों के साथ की जाती है। यदि नमूने का मतलब $ 18.75 है और std-dev समान ($ 6) है, तो क्या ABC और XYZ ब्रोकर के बीच औसत ब्रोकरेज बिल में अंतर के बारे में कोई अनुमान लगाया जा सकता है ">

एच 0 : अशक्त परिकल्पना: मीन = 18

एच 1 : वैकल्पिक परिकल्पना: मतलब 18 (यह वही है जिसे हम साबित करना चाहते हैं।)

अस्वीकृति क्षेत्र: Z <= - Z 2.5 और Z> = Z 2.5 (5% महत्व स्तर मानकर, प्रत्येक पक्ष पर 2.5 विभाजित करें)।

Z = (नमूना माध्य - माध्य) / (std-dev / sqrt (नमूनों की संख्या))

= (18.75 - 18) / (6 / (sqrt (100)) = 1.25

यह परिकलित Z मान द्वारा परिभाषित दो सीमाओं के बीच आता है:

- जेड 2.5 = -1.96 और जेड 2.5 = 1.96।

इससे यह निष्कर्ष निकलता है कि यह अनुमान लगाने के लिए अपर्याप्त सबूत हैं कि आपके मौजूदा ब्रोकर और नए ब्रोकर की दरों में कोई अंतर है।

वैकल्पिक रूप से, पी-मान = P (Z1.25)

= 2 * 0.1056 = 0.2112 = 21.12% जो 0.05 या 5% से अधिक है, उसी निष्कर्ष पर पहुंचा।

आलेखीय रूप से, यह निम्नलिखित द्वारा दर्शाया गया है:

काल्पनिक परीक्षण विधि के लिए आलोचना अंक:

  • मान्यताओं पर आधारित एक सांख्यिकीय पद्धति
  • अल्फा और बीटा त्रुटियों के संदर्भ में त्रुटि-प्रवण
  • पी-वैल्यू की व्याख्या अस्पष्ट हो सकती है, जिससे भ्रमित परिणाम हो सकते हैं

तल - रेखा

परिकल्पना परीक्षण एक गणितीय मॉडल को एक निश्चित आत्मविश्वास स्तर के साथ एक दावे या विचार को मान्य करने की अनुमति देता है। हालांकि, अधिकांश सांख्यिकीय उपकरण और मॉडल की तरह, यह कुछ सीमाओं से बंधा है। वित्तीय निर्णय लेने के लिए इस मॉडल के उपयोग को सभी निर्भरताओं को ध्यान में रखते हुए, एक महत्वपूर्ण आंख के साथ विचार किया जाना चाहिए। इसी तरह के विश्लेषण के लिए बायेसियन इन्वेंशन जैसे वैकल्पिक तरीके भी खोज करने लायक हैं।

इनवेस्टमेंट अकाउंट्स प्रोवाइडर नाम की तुलना करें। विज्ञापनदाता का विवरण × इस तालिका में दिखाई देने वाले प्रस्ताव उन साझेदारियों से हैं जिनसे इन्वेस्टोपेडिया को मुआवजा मिलता है।
अनुशंसित
अपनी टिप्पणी छोड़ दो