मुख्य » एल्गोरिथम ट्रेडिंग » व्यवसाय विश्लेषण के लिए प्रतिगमन मूल बातें

व्यवसाय विश्लेषण के लिए प्रतिगमन मूल बातें

एल्गोरिथम ट्रेडिंग : व्यवसाय विश्लेषण के लिए प्रतिगमन मूल बातें

यदि आपने कभी सोचा है कि डेटा के दो या दो से अधिक टुकड़े एक-दूसरे से कैसे संबंधित हैं (जैसे कि जीडीपी बेरोजगारी और मुद्रास्फीति में परिवर्तन से कैसे प्रभावित होती है), या यदि आपने कभी भी अपने बॉस से आपको पूर्वानुमान बनाने या भविष्यवाणियों का विश्लेषण करने के लिए कहा है चर के बीच संबंधों पर, फिर प्रतिगमन विश्लेषण सीखना आपके समय के लायक होगा।

इस लेख में, आप साधारण रेखीय प्रतिगमन की मूल बातें सीखेंगे, जिसे कभी-कभी 'साधारण न्यूनतम वर्ग' या ओएलएस प्रतिगमन कहा जाता है - एक उपकरण जो आमतौर पर पूर्वानुमान और वित्तीय विश्लेषण में उपयोग किया जाता है। हम प्रतिगमन के मुख्य सिद्धांतों को सीखना शुरू करेंगे, पहले सहसंयोजक और सहसंबंध के बारे में सीखेंगे, और फिर एक प्रतिगमन आउटपुट के निर्माण और व्याख्या की ओर बढ़ेंगे। Microsoft Excel जैसे लोकप्रिय व्यवसाय सॉफ़्टवेयर आपके लिए सभी प्रतिगमन गणना और आउटपुट कर सकते हैं, लेकिन अंतर्निहित मैकेनिक्स सीखना अभी भी महत्वपूर्ण है।

चर

एक प्रतिगमन मॉडल के दिल में दो अलग-अलग चर के बीच संबंध होता है, जिसे आश्रित और स्वतंत्र चर कहा जाता है। उदाहरण के लिए, मान लीजिए कि आप अपनी कंपनी के लिए बिक्री का पूर्वानुमान लगाना चाहते हैं और आपने निष्कर्ष निकाला है कि जीडीपी में बदलाव के आधार पर आपकी कंपनी की बिक्री ऊपर और नीचे जाती है।

आप जिस बिक्री का पूर्वानुमान लगा रहे हैं वह निर्भर चर होगा क्योंकि उनका मूल्य जीडीपी के मूल्य पर "निर्भर करता है" और जीडीपी स्वतंत्र चर होगा। फिर आपको बिक्री का पूर्वानुमान लगाने के लिए इन दो चर के बीच संबंधों की ताकत निर्धारित करने की आवश्यकता होगी। यदि जीडीपी 1% बढ़ जाती है / घट जाती है, तो आपकी बिक्री कितनी बढ़ेगी या घटेगी?

सहप्रसरण

Cov (x, y) = ∑ (xn u xu) (yn x yu) N \ start {align} & Cov (x, y) = \ sum \ frac {(x_n - x_u) (y_n - y_u)} {N } \\ \ अंत {संरेखित} कोव (x, y) = xN (xn uxu) (yn yyu)

दो चर के बीच संबंध की गणना करने के सूत्र को कोवरियन कहा जाता है। यह गणना आपको संबंध की दिशा दिखाती है। यदि एक चर बढ़ जाता है और दूसरा चर भी बढ़ जाता है, तो सहसंयोजक सकारात्मक होगा। यदि एक चर ऊपर जाता है और दूसरा नीचे जाता है, तो सहसंयोजक नकारात्मक होगा।

यह गणना करने से आपको प्राप्त वास्तविक संख्या की व्याख्या करना कठिन हो सकता है क्योंकि यह मानकीकृत नहीं है। मिसाल के तौर पर, पांच की एक सहसंयोजक की व्याख्या एक सकारात्मक संबंध के रूप में की जा सकती है, लेकिन रिश्ते की मजबूती को केवल तभी मजबूत कहा जा सकता है जब संख्या छह थी या संख्या से कम थी।

सहसंबंध गुणांक

सहसंबंध = ρxy = Covxysxsy \ start {align} & Correlation = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ का अंत {गठबंधन} ρxy = sx sy Covxy

हमें बेहतर व्याख्या करने और पूर्वानुमान में इसका उपयोग करने की अनुमति देने के लिए सहसंयोजक को मानकीकृत करने की आवश्यकता है, और परिणाम सहसंबंध गणना है। सहसंबंध गणना केवल सहसंयोजक लेता है और इसे दो चर के मानक विचलन के उत्पाद द्वारा विभाजित करता है। यह -1 और +1 के मान के बीच सहसंबंध को बांध देगा।

+1 के सहसंबंध को यह बताने के लिए व्याख्या किया जा सकता है कि दोनों चर एक दूसरे के साथ पूरी तरह से सकारात्मक रूप से चलते हैं और -1 का तात्पर्य है कि वे पूरी तरह से नकारात्मक रूप से सहसंबद्ध हैं। हमारे पिछले उदाहरण में, यदि सहसंबंध +1 है और जीडीपी 1% बढ़ जाता है, तो बिक्री 1% बढ़ जाएगी। यदि सहसंबंध -1 है, तो जीडीपी में 1% वृद्धि से बिक्री में 1% की कमी आएगी - सटीक विपरीत।

प्रतिगमन समीकरण

अब जब हम जानते हैं कि दो चर के बीच के सापेक्ष संबंध की गणना कैसे की जाती है, तो हम उस चर का पूर्वानुमान लगाने या भविष्यवाणी करने के लिए एक प्रतिगमन समीकरण विकसित कर सकते हैं जिसकी हम इच्छा करते हैं। नीचे एक सरल रैखिक प्रतिगमन के लिए सूत्र दिया गया है। "Y" वह मूल्य है जिसे हम पूर्वानुमान करने का प्रयास कर रहे हैं, "b" प्रतिगमन रेखा का ढलान है, "x" हमारे स्वतंत्र मूल्य का मूल्य है, और "a" y- अवरोधन का प्रतिनिधित्व करता है। प्रतिगमन समीकरण केवल आश्रित चर (y) और स्वतंत्र चर (x) के बीच के संबंध का वर्णन करता है।

y = bx + a \ start {align} & y = bx + a \\ \ end {संरेखित} y = bx + a

यदि x (स्वतंत्र चर) का मान शून्य है, और इसलिए कभी-कभी इसे 'स्थिरांक' के रूप में संदर्भित किया जाता है, तो अवरोधन, या "a, ", y (निर्भर चर) का मान है। इसलिए यदि जीडीपी में कोई बदलाव नहीं हुआ, तो आपकी कंपनी अभी भी कुछ बिक्री करेगी - यह मूल्य, जब जीडीपी में परिवर्तन शून्य है, तो अवरोधक है। प्रतिगमन समीकरण के चित्रमय चित्रण को देखने के लिए नीचे दिए गए ग्राफ़ पर एक नज़र डालें। इस ग्राफ़ में, ग्राफ़ पर पाँच बिंदुओं द्वारा दर्शाए गए केवल पाँच डेटा बिंदु हैं। रेखीय प्रतिगमन एक पंक्ति का अनुमान लगाने का प्रयास करता है जो डेटा (सर्वोत्तम फिट की एक पंक्ति) को फिट करता है और उस रेखा के समीकरण के परिणामस्वरूप प्रतिगमन समीकरण होता है।

चित्र 1: सबसे अच्छी फिट की रेखा

स्रोत: इन्वेस्टोपेडिया

एक्सेल में नियम

अब जब आप कुछ पृष्ठभूमि को समझते हैं जो एक प्रतिगमन विश्लेषण में जाता है, तो चलो एक्सेल के प्रतिगमन टूल का उपयोग करके एक सरल उदाहरण करते हैं। हम सकल घरेलू उत्पाद में बदलाव के आधार पर अगले साल की बिक्री का पूर्वानुमान लगाने के पिछले उदाहरण पर निर्माण करेंगे। अगली तालिका कुछ कृत्रिम डेटा बिंदुओं को सूचीबद्ध करती है, लेकिन ये संख्या वास्तविक जीवन में आसानी से सुलभ हो सकती है।

सालबिक्रीसकल घरेलू उत्पाद
20141001.00%
20152501.90%
20162752.40%
20172002.60%
20183002.90%

बस तालिका को नेत्रहीन करते हुए, आप देख सकते हैं कि बिक्री और जीडीपी के बीच एक सकारात्मक संबंध होने जा रहा है। दोनों साथ-साथ चलते हैं। एक्सेल का उपयोग करते हुए, आपको बस इतना करना है कि उपकरण ड्रॉप-डाउन मेनू पर क्लिक करें, डेटा विश्लेषण का चयन करें और वहां से प्रतिगमन चुनें। पॉपअप बॉक्स को वहां से भरना आसान है; आपका इनपुट वाई रेंज आपका "सेल्स" कॉलम है और आपका इनपुट एक्स रेंज जीडीपी कॉलम में परिवर्तन है; जहां आप डेटा को अपनी स्प्रैडशीट पर दिखाना चाहते हैं, उसके लिए आउटपुट रेंज चुनें और ओके दबाएं। आपको नीचे दी गई तालिका में दी गई चीज़ों के समान कुछ देखना चाहिए:

प्रतिगमन सांख्यिकी गुणांक

मल्टीपल आर0.8292243अवरोधन३४.५८, ४०९

आर स्कवेयर


0.687613सकल घरेलू उत्पाद८८.१५, ५५२
समायोजित
आर स्कवेयर


0.583484

-


-


मानक त्रुटि51.021807-

-


टिप्पणियों5

-


-


व्याख्या

साधारण रेखीय प्रतिगमन के लिए आपको जिन प्रमुख आउटपुट की आवश्यकता है, वे हैं आर-स्क्वैयर, इंटरसेप्ट (स्थिर) और जीडीपी का बीटा (बी) गुणांक। इस उदाहरण में R- वर्ग संख्या 68.7% है - यह दर्शाता है कि हमारा मॉडल भविष्य की बिक्री की भविष्यवाणी या पूर्वानुमान कैसे करता है, यह सुझाव देता है कि मॉडल में व्याख्यात्मक चर निर्भर चर में भिन्नता का 68.7% की भविष्यवाणी करते हैं। अगला, हमारे पास 34.58 का एक अवरोधन है, जो हमें बताता है कि यदि जीडीपी में परिवर्तन शून्य होने का अनुमान लगाया गया था, तो हमारी बिक्री लगभग 35 इकाई होगी। और अंत में, 88.15 का जीडीपी बीटा या सहसंबंध गुणांक हमें बताता है कि यदि जीडीपी में 1% की वृद्धि होती है, तो बिक्री लगभग 88 इकाइयों द्वारा बढ़ जाएगी।

तल - रेखा

तो आप इस सरल मॉडल को अपने व्यवसाय में कैसे उपयोग करेंगे ">

बेशक, यह सिर्फ एक सरल प्रतिगमन है और ऐसे मॉडल हैं जो आप कई रैखिक चर कहे जाने वाले कई स्वतंत्र चर का उपयोग कर सकते हैं। लेकिन कई रेखीय प्रतिगमन अधिक जटिल हैं और कई मुद्दों पर चर्चा करने के लिए एक और लेख की आवश्यकता होगी।

इनवेस्टमेंट अकाउंट्स प्रोवाइडर नाम की तुलना करें। विज्ञापनदाता का विवरण × इस तालिका में दिखाई देने वाले प्रस्ताव उन साझेदारियों से हैं जिनसे इन्वेस्टोपेडिया को मुआवजा मिलता है।
अनुशंसित
अपनी टिप्पणी छोड़ दो