Overfitting

एल्गोरिथम ट्रेडिंग : Overfitting
ओवरफिटिंग क्या है?

ओवरफिटिंग एक मॉडलिंग त्रुटि है जो तब होती है जब कोई फ़ंक्शन डेटा बिंदुओं के सीमित सेट के बहुत करीब होता है। मॉडल को ओवरफिट करने से आम तौर पर अध्ययन के तहत डेटा में आइडिओसिप्रेसिस को समझाने के लिए एक अति जटिल मॉडल बनाने का रूप ले लेता है।

वास्तव में, अक्सर अध्ययन किए गए डेटा में कुछ हद तक त्रुटि या यादृच्छिक शोर होता है। इस प्रकार, मॉडल को थोड़े से गलत डेटा के बहुत करीब से अनुरूप बनाने का प्रयास मॉडल को पर्याप्त त्रुटियों के साथ संक्रमित कर सकता है और इसकी पूर्वानुमान शक्ति को कम कर सकता है।

[महत्वपूर्ण: वित्तीय पेशेवरों को हमेशा सीमित आंकड़ों के आधार पर एक मॉडल को ओवरफिट करने के खतरों के बारे में पता होना चाहिए।]

ओवरफिटिंग को समझना

उदाहरण के लिए, पैटर्न खोजने के लिए एक सामान्य समस्या ऐतिहासिक बाजार डेटा के व्यापक डेटाबेस को खोजने के लिए कंप्यूटर एल्गोरिदम का उपयोग कर रही है। पर्याप्त अध्ययन को देखते हुए, अक्सर विस्तृत प्रमेयों को विकसित करना संभव है जो स्टॉक मार्केट में रिटर्न जैसी चीजों की भविष्यवाणी करने के लिए दिखाई देते हैं।

हालांकि, जब नमूने के बाहर डेटा के लिए आवेदन किया जाता है, तो ऐसे प्रमेय संभवतः एक मॉडल के ओवरफिटिंग के रूप में साबित हो सकते हैं कि वास्तव में क्या मौका होता है। सभी मामलों में, डेटा के खिलाफ एक मॉडल का परीक्षण करना महत्वपूर्ण है जो इसे विकसित करने के लिए उपयोग किए गए नमूने के बाहर है।

चाबी छीन लेना

  • ओवरफिटिंग एक मॉडलिंग त्रुटि है जो तब होती है जब कोई फ़ंक्शन डेटा बिंदुओं के सीमित सेट के बहुत करीब होता है।
  • वित्तीय पेशेवरों को हमेशा सीमित डेटा के आधार पर एक मॉडल को ओवरफिट करने के खतरों के बारे में पता होना चाहिए।
इनवेस्टमेंट अकाउंट्स प्रोवाइडर नाम की तुलना करें। विज्ञापनदाता का विवरण × इस तालिका में दिखाई देने वाले प्रस्ताव उन साझेदारियों से हैं जिनसे इन्वेस्टोपेडिया को मुआवजा मिलता है।

संबंधित शर्तें

सांख्यिकीय महत्व मायने रखता है सांख्यिकीय महत्व एक परिणाम को संदर्भित करता है जो यादृच्छिक रूप से होने की संभावना नहीं है, बल्कि एक विशिष्ट कारण के कारण होने की संभावना है। डेटा सेट से शोर निकालने के लिए एल्गोरिथ्म का उपयोग करके डेटा स्मूथिंग कैसे काम करता है। यह महत्वपूर्ण पैटर्न को बाहर खड़ा करने की अनुमति देता है। डेटा स्मूथिंग का उपयोग रुझानों की भविष्यवाणी करने में मदद करने के लिए किया जा सकता है, जैसे कि प्रतिभूतियों की कीमतों में पाया जाता है। अधिक नमूना एक नमूना एक बड़े समूह का एक छोटा, प्रबंधनीय संस्करण है। नमूने का उपयोग सांख्यिकीय परीक्षण में किया जाता है जब जनसंख्या का आकार बहुत बड़ा होता है। अधिक Heteroskedasticity आंकड़ों में, विषमयुग्मता तब होती है जब एक चर की मानक विचलन, समय की एक विशिष्ट राशि पर नजर रखी जाती है, गैर-अस्थिर होती है। स्तरीकृत रैंडम सैंपलिंग में अधिक पढ़ना स्तरीकृत रैंडम सैंपलिंग नमूनाकरण की एक विधि है जिसमें एक आबादी के विभाजन को स्ट्रैट के रूप में जाना जाता है। अधिक सरल रैंडम नमूने कैसे काम करते हैं एक साधारण यादृच्छिक नमूना एक सांख्यिकीय आबादी का एक सबसेट होता है, जिसमें सबसेट के प्रत्येक सदस्य को चुने जाने की समान संभावना होती है। एक साधारण यादृच्छिक नमूना एक समूह का निष्पक्ष प्रतिनिधित्व करने के लिए होता है। अधिक साथी लिंक
अनुशंसित
अपनी टिप्पणी छोड़ दो