मैनुअल न्यूनतम वर्ग विधि. रेखीय प्रतिगमन

न्यूनतम वर्ग विधि

न्यूनतम वर्ग विधि ( ओएलएस, ओएलएस, साधारण न्यूनतम वर्ग) - नमूना डेटा का उपयोग करके प्रतिगमन मॉडल के अज्ञात मापदंडों का अनुमान लगाने के लिए प्रतिगमन विश्लेषण के बुनियादी तरीकों में से एक। यह विधि प्रतिगमन अवशेषों के वर्गों के योग को न्यूनतम करने पर आधारित है।

यह ध्यान दिया जाना चाहिए कि न्यूनतम वर्ग विधि को किसी भी क्षेत्र में किसी समस्या को हल करने के लिए एक विधि कहा जा सकता है यदि समाधान आवश्यक चर के कुछ कार्यों के वर्गों के योग को कम करने के लिए कुछ मानदंडों को पूरा करता है या संतुष्ट करता है। इसलिए, कम से कम वर्ग विधि का उपयोग अन्य (सरल) कार्यों द्वारा किसी दिए गए फ़ंक्शन के अनुमानित प्रतिनिधित्व (अनुमान) के लिए भी किया जा सकता है, जब समीकरणों या बाधाओं को संतुष्ट करने वाली मात्राओं का एक सेट ढूंढते हैं, जिनकी संख्या इन मात्राओं की संख्या से अधिक होती है , वगैरह।

एमएनसी का सार

(स्पष्ट) चर के बीच संभाव्य (प्रतिगमन) संबंध का कुछ (पैरामीट्रिक) मॉडल दिया जाए यऔर कई कारक (व्याख्यात्मक चर) एक्स

अज्ञात मॉडल मापदंडों का वेक्टर कहां है

- यादृच्छिक मॉडल त्रुटि.

इन चरों के मानों का नमूना अवलोकन भी होने दें। मान लीजिए अवलोकन संख्या ()। फिर वें अवलोकन में चर के मान हैं। फिर, पैरामीटर बी के दिए गए मानों के लिए, समझाए गए चर y के सैद्धांतिक (मॉडल) मानों की गणना करना संभव है:

अवशेषों का आकार पैरामीटर बी के मूल्यों पर निर्भर करता है।

न्यूनतम वर्ग विधि (साधारण, शास्त्रीय) का सार ऐसे पैरामीटर बी को ढूंढना है जिसके लिए अवशेषों के वर्गों का योग (इंग्लैंड)। वर्गों का अवशिष्ट योग) न्यूनतम होगा:

सामान्य स्थिति में, इस समस्या को संख्यात्मक अनुकूलन (न्यूनतमीकरण) विधियों द्वारा हल किया जा सकता है। ऐसे में वे बात करते हैं अरैखिक न्यूनतम वर्ग(एनएलएस या एनएलएलएस - अंग्रेजी) अरैखिक न्यूनतम वर्ग). कई मामलों में विश्लेषणात्मक समाधान प्राप्त करना संभव है। न्यूनीकरण समस्या को हल करने के लिए, फ़ंक्शन के स्थिर बिंदुओं को अज्ञात पैरामीटर बी के संबंध में विभेदित करके, डेरिवेटिव को शून्य के बराबर करना और समीकरणों की परिणामी प्रणाली को हल करना आवश्यक है:

यदि मॉडल की यादृच्छिक त्रुटियां सामान्य रूप से वितरित की जाती हैं, समान भिन्नता होती है, और असंबद्ध होती हैं, तो ओएलएस पैरामीटर अनुमान अधिकतम संभावना अनुमान (एमएलएम) के समान होते हैं।

रैखिक मॉडल के मामले में ओएलएस

प्रतिगमन निर्भरता को रैखिक होने दें:

होने देना यसमझाए गए चर के अवलोकनों का एक कॉलम वेक्टर है, और कारक अवलोकनों का एक मैट्रिक्स है (मैट्रिक्स की पंक्तियां किसी दिए गए अवलोकन में कारक मानों के वेक्टर हैं, कॉलम किसी दिए गए कारक के मानों के वेक्टर हैं सभी अवलोकनों में)। रैखिक मॉडल का मैट्रिक्स प्रतिनिधित्व है:

तब समझाए गए चर के अनुमानों का वेक्टर और प्रतिगमन अवशेषों का वेक्टर बराबर होगा

तदनुसार, प्रतिगमन अवशेषों के वर्गों का योग बराबर होगा

मापदंडों के वेक्टर के संबंध में इस फ़ंक्शन को अलग करने और डेरिवेटिव को शून्य के बराबर करने पर, हम समीकरणों की एक प्रणाली प्राप्त करते हैं (मैट्रिक्स रूप में):

समीकरणों की इस प्रणाली का समाधान एक रैखिक मॉडल के लिए न्यूनतम वर्ग अनुमान के लिए सामान्य सूत्र देता है:

विश्लेषणात्मक उद्देश्यों के लिए, इस सूत्र का बाद वाला प्रतिनिधित्व उपयोगी है। यदि प्रतिगमन मॉडल में डेटा केंद्रित, तो इस प्रतिनिधित्व में पहले मैट्रिक्स में कारकों के एक नमूना सहप्रसरण मैट्रिक्स का अर्थ है, और दूसरा आश्रित चर के साथ कारकों के सहप्रसरण का एक वेक्टर है। यदि इसके अतिरिक्त डेटा भी है सामान्यीकृतएमएसई के लिए (अर्थात, अंततः मानकीकृत), तो पहले मैट्रिक्स में कारकों के नमूना सहसंबंध मैट्रिक्स का अर्थ है, दूसरा वेक्टर - आश्रित चर के साथ कारकों के नमूना सहसंबंध का एक वेक्टर।

मॉडलों के लिए ओएलएस अनुमान की एक महत्वपूर्ण संपत्ति स्थिरांक के साथ- निर्मित प्रतिगमन रेखा नमूना डेटा के गुरुत्वाकर्षण के केंद्र से होकर गुजरती है, अर्थात समानता संतुष्ट है:

विशेष रूप से, चरम मामले में, जब एकमात्र प्रतिगामी एक स्थिरांक होता है, तो हम पाते हैं कि एकमात्र पैरामीटर (स्थिरांक स्वयं) का ओएलएस अनुमान समझाए गए चर के औसत मूल्य के बराबर है। अर्थात्, बड़ी संख्या के नियमों से अपने अच्छे गुणों के लिए जाना जाने वाला अंकगणितीय माध्य भी एक न्यूनतम वर्ग अनुमान है - यह इससे वर्ग विचलन के न्यूनतम योग की कसौटी को पूरा करता है।

उदाहरण: सरलतम (जोड़ीवार) प्रतिगमन

युग्मित रैखिक प्रतिगमन के मामले में, गणना सूत्र सरल हो जाते हैं (आप मैट्रिक्स बीजगणित के बिना कर सकते हैं):

ओएलएस अनुमानकों के गुण

सबसे पहले, हम ध्यान दें कि रैखिक मॉडल के लिए, ओएलएस अनुमान रैखिक अनुमान हैं, जैसा कि उपरोक्त सूत्र से पता चलता है। निष्पक्ष ओएलएस अनुमानों के लिए, प्रतिगमन विश्लेषण की सबसे महत्वपूर्ण शर्त को पूरा करना आवश्यक और पर्याप्त है: कारकों पर सशर्त एक यादृच्छिक त्रुटि की गणितीय अपेक्षा, शून्य के बराबर होनी चाहिए। यह शर्त, विशेष रूप से, संतुष्ट होती है यदि

यादृच्छिक त्रुटियों की गणितीय अपेक्षा शून्य है, और
कारक और यादृच्छिक त्रुटियाँ स्वतंत्र यादृच्छिक चर हैं।

दूसरी स्थिति - कारकों की बहिर्जातता की स्थिति - मौलिक है। यदि यह संपत्ति पूरी नहीं होती है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी हमें इस मामले में उच्च-गुणवत्ता वाले अनुमान प्राप्त करने की अनुमति नहीं देता है) ). शास्त्रीय मामले में, यादृच्छिक त्रुटि के विपरीत, कारकों के नियतत्ववाद के बारे में एक मजबूत धारणा बनाई जाती है, जिसका स्वचालित रूप से मतलब है कि बहिर्जातता की स्थिति पूरी हो गई है। सामान्य मामले में, अनुमानों की स्थिरता के लिए, नमूना आकार अनंत तक बढ़ने पर मैट्रिक्स के कुछ गैर-एकवचन मैट्रिक्स में अभिसरण के साथ बहिर्जातता की स्थिति को संतुष्ट करना पर्याप्त है।

निरंतरता और निष्पक्षता के अलावा, (सामान्य) न्यूनतम वर्गों के अनुमान भी प्रभावी होने के लिए (रैखिक निष्पक्ष अनुमानों की श्रेणी में सर्वोत्तम), यादृच्छिक त्रुटि के अतिरिक्त गुणों को पूरा किया जाना चाहिए:

इन धारणाओं को यादृच्छिक त्रुटि वेक्टर के सहप्रसरण मैट्रिक्स के लिए तैयार किया जा सकता है

एक रैखिक मॉडल जो इन शर्तों को पूरा करता है उसे कहा जाता है क्लासिक. शास्त्रीय रैखिक प्रतिगमन के लिए ओएलएस अनुमान निष्पक्ष, सुसंगत और सभी रैखिक निष्पक्ष अनुमानों की श्रेणी में सबसे प्रभावी अनुमान हैं (अंग्रेजी साहित्य में कभी-कभी संक्षिप्त नाम का उपयोग किया जाता है) नीला (सर्वश्रेष्ठ लीनियर अनबाइज्ड एस्टीमेटर) - सर्वोत्तम रैखिक निष्पक्ष अनुमान; रूसी साहित्य में गॉस-मार्कोव प्रमेय को अक्सर उद्धृत किया जाता है)। जैसा कि दिखाना आसान है, गुणांक अनुमान के वेक्टर का सहप्रसरण मैट्रिक्स इसके बराबर होगा:

सामान्यीकृत ओएलएस

न्यूनतम वर्ग विधि व्यापक सामान्यीकरण की अनुमति देती है। अवशेषों के वर्गों के योग को कम करने के बजाय, कोई अवशेषों के वेक्टर के कुछ सकारात्मक निश्चित द्विघात रूप को कम कर सकता है, जहां कुछ सममित सकारात्मक निश्चित वजन मैट्रिक्स है। पारंपरिक न्यूनतम वर्ग इस दृष्टिकोण का एक विशेष मामला है, जहां भार मैट्रिक्स पहचान मैट्रिक्स के समानुपाती होता है। जैसा कि सममित मैट्रिक्स (या ऑपरेटरों) के सिद्धांत से जाना जाता है, ऐसे मैट्रिक्स के लिए एक अपघटन होता है। नतीजतन, निर्दिष्ट फ़ंक्शनल को निम्नानुसार दर्शाया जा सकता है, अर्थात, इस फ़ंक्शनल को कुछ रूपांतरित "शेषों" के वर्गों के योग के रूप में दर्शाया जा सकता है। इस प्रकार, हम न्यूनतम वर्ग विधियों के एक वर्ग को अलग कर सकते हैं - एलएस विधियाँ (न्यूनतम वर्ग)।

यह साबित हो चुका है (ऐटकेन का प्रमेय) कि एक सामान्यीकृत रैखिक प्रतिगमन मॉडल (जिसमें यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स पर कोई प्रतिबंध नहीं लगाया जाता है) के लिए, सबसे प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में) तथाकथित अनुमान हैं। सामान्यीकृत न्यूनतम वर्ग (जीएलएस - सामान्यीकृत न्यूनतम वर्ग)- यादृच्छिक त्रुटियों के व्युत्क्रम सहप्रसरण मैट्रिक्स के बराबर भार मैट्रिक्स के साथ एलएस विधि:।

यह दिखाया जा सकता है कि एक रैखिक मॉडल के मापदंडों के जीएलएस अनुमान के सूत्र का रूप है

इन अनुमानों का सहप्रसरण मैट्रिक्स तदनुसार बराबर होगा

वास्तव में, ओएलएस का सार मूल डेटा के एक निश्चित (रैखिक) परिवर्तन (पी) और रूपांतरित डेटा पर साधारण ओएलएस के अनुप्रयोग में निहित है। इस परिवर्तन का उद्देश्य यह है कि रूपांतरित डेटा के लिए, यादृच्छिक त्रुटियां पहले से ही शास्त्रीय मान्यताओं को संतुष्ट करती हैं।

भारित ओएलएस

एक विकर्ण भार मैट्रिक्स (और इसलिए यादृच्छिक त्रुटियों का एक सहप्रसरण मैट्रिक्स) के मामले में, हमारे पास तथाकथित भारित न्यूनतम वर्ग (डब्ल्यूएलएस) हैं। इस मामले में, मॉडल अवशेषों के वर्गों का भारित योग कम से कम किया जाता है, अर्थात, प्रत्येक अवलोकन को एक "वजन" प्राप्त होता है जो इस अवलोकन में यादृच्छिक त्रुटि के विचरण के व्युत्क्रमानुपाती होता है:। वास्तव में, डेटा को अवलोकनों को भारित करके (यादृच्छिक त्रुटियों के अनुमानित मानक विचलन के आनुपातिक राशि से विभाजित करके) रूपांतरित किया जाता है, और सामान्य ओएलएस को भारित डेटा पर लागू किया जाता है।

व्यवहार में बहुराष्ट्रीय कंपनी का उपयोग करने के कुछ विशेष मामले

रैखिक निर्भरता का अनुमान

आइए उस मामले पर विचार करें, जब एक निश्चित स्केलर मात्रा पर एक निश्चित स्केलर मात्रा की निर्भरता का अध्ययन करने के परिणामस्वरूप (यह हो सकता है, उदाहरण के लिए, वर्तमान ताकत पर वोल्टेज की निर्भरता:, जहां एक स्थिर मूल्य है, का प्रतिरोध कंडक्टर), इन मात्राओं का मापन किया गया, जिसके परिणामस्वरूप मूल्य और उनके संबंधित मूल्य। माप डेटा को एक तालिका में दर्ज किया जाना चाहिए।

मेज़। माप परिणाम।

माप नं.
1
2
3
4
5
6

प्रश्न यह है कि निर्भरता का सर्वोत्तम वर्णन करने के लिए गुणांक का कौन सा मान चुना जा सकता है? न्यूनतम वर्ग विधि के अनुसार यह मान इस प्रकार होना चाहिए कि मानों के वर्ग विचलनों का योग मानों से हो

न्यूनतम था

वर्ग विचलनों के योग का एक चरम होता है - न्यूनतम, जो हमें इस सूत्र का उपयोग करने की अनुमति देता है। आइए इस सूत्र से गुणांक का मान ज्ञात करें। ऐसा करने के लिए, हम इसके बाईं ओर को इस प्रकार बदलते हैं:

अंतिम सूत्र हमें गुणांक का मान ज्ञात करने की अनुमति देता है, जो कि समस्या में आवश्यक था।

कहानी

19वीं सदी की शुरुआत तक. वैज्ञानिकों के पास समीकरणों की ऐसी प्रणाली को हल करने के लिए कुछ निश्चित नियम नहीं थे जिनमें अज्ञात की संख्या समीकरणों की संख्या से कम हो; उस समय तक, निजी तकनीकों का उपयोग किया जाता था जो समीकरणों के प्रकार और कैलकुलेटर की बुद्धि पर निर्भर करती थीं, और इसलिए एक ही अवलोकन संबंधी डेटा के आधार पर अलग-अलग कैलकुलेटर अलग-अलग निष्कर्ष पर आते थे। गॉस (1795) इस पद्धति का उपयोग करने वाले पहले व्यक्ति थे, और लीजेंड्रे (1805) ने स्वतंत्र रूप से इसे इसके आधुनिक नाम (फ्रेंच) के तहत खोजा और प्रकाशित किया। मेथोड डेस मोइंड्रेस क्वारेस ) . लाप्लास ने विधि को संभाव्यता सिद्धांत से संबंधित किया, और अमेरिकी गणितज्ञ एड्रेन (1808) ने इसके संभाव्यता-सैद्धांतिक अनुप्रयोगों पर विचार किया। एनके, बेसेल, हैनसेन और अन्य के आगे के शोध से यह विधि व्यापक हो गई और इसमें सुधार हुआ।

ओएलएस का वैकल्पिक उपयोग

न्यूनतम वर्ग विधि के विचार का उपयोग अन्य मामलों में भी किया जा सकता है जो सीधे प्रतिगमन विश्लेषण से संबंधित नहीं हैं। तथ्य यह है कि वर्गों का योग वैक्टर के लिए सबसे आम निकटता उपायों में से एक है (परिमित-आयामी स्थानों में यूक्लिडियन मीट्रिक)।

एक अनुप्रयोग रैखिक समीकरणों की प्रणालियों का "समाधान" है जिसमें समीकरणों की संख्या चर की संख्या से अधिक है

जहां मैट्रिक्स वर्गाकार नहीं, बल्कि आयताकार आकार का है।

सामान्य स्थिति में, समीकरणों की ऐसी प्रणाली का कोई समाधान नहीं होता है (यदि रैंक वास्तव में चर की संख्या से अधिक है)। इसलिए, इस प्रणाली को केवल ऐसे वेक्टर को चुनने के अर्थ में "हल" किया जा सकता है जो वैक्टर और के बीच "दूरी" को कम करता है। ऐसा करने के लिए, आप सिस्टम समीकरणों के बाएँ और दाएँ पक्षों के बीच अंतर के वर्गों के योग को न्यूनतम करने की कसौटी लागू कर सकते हैं। यह दिखाना आसान है कि इस न्यूनतमकरण समस्या को हल करने से समीकरणों की निम्नलिखित प्रणाली को हल किया जा सकता है

प्रयोगात्मक डेटा का अनुमान प्रयोगात्मक रूप से प्राप्त डेटा को एक विश्लेषणात्मक फ़ंक्शन के साथ प्रतिस्थापित करने पर आधारित एक विधि है जो मूल मूल्यों (किसी प्रयोग या प्रयोग के दौरान प्राप्त डेटा) के साथ नोडल बिंदुओं पर सबसे निकट से गुजरती है या मेल खाती है। वर्तमान में, किसी विश्लेषणात्मक फ़ंक्शन को परिभाषित करने के दो तरीके हैं:

एक एन-डिग्री इंटरपोलेशन बहुपद का निर्माण करके जो गुजरता है सभी बिंदुओं के माध्यम से सीधेएक दी गई डेटा सरणी. इस मामले में, अनुमानित फ़ंक्शन को इस रूप में प्रस्तुत किया जाता है: लैग्रेंज रूप में एक इंटरपोलेशन बहुपद या न्यूटन फॉर्म में एक इंटरपोलेशन बहुपद।

एक n-डिग्री सन्निकट बहुपद का निर्माण करके जो गुजरता है बिंदुओं के तत्काल आसपास मेंकिसी दिए गए डेटा सरणी से. इस प्रकार, अनुमानित फ़ंक्शन प्रयोग के दौरान उत्पन्न होने वाले सभी यादृच्छिक शोर (या त्रुटियों) को सुचारू कर देता है: प्रयोग के दौरान मापा गया मान यादृच्छिक कारकों पर निर्भर करता है जो अपने स्वयं के यादृच्छिक कानूनों (माप या उपकरण त्रुटियां, अशुद्धि या प्रयोगात्मक) के अनुसार उतार-चढ़ाव करते हैं त्रुटियाँ)। इस मामले में, अनुमानित फ़ंक्शन न्यूनतम वर्ग विधि का उपयोग करके निर्धारित किया जाता है।

न्यूनतम वर्ग विधि(अंग्रेजी साहित्य ऑर्डिनरी लीस्ट स्क्वेयर्स, ओएलएस में) अनुमानित फ़ंक्शन को निर्धारित करने पर आधारित एक गणितीय विधि है, जिसका निर्माण प्रयोगात्मक डेटा के दिए गए सरणी से बिंदुओं के निकटतम निकटता में किया जाता है। मूल और अनुमानित कार्यों F(x) की निकटता एक संख्यात्मक माप द्वारा निर्धारित की जाती है, अर्थात्: अनुमानित वक्र F(x) से प्रयोगात्मक डेटा के वर्ग विचलन का योग सबसे छोटा होना चाहिए।

न्यूनतम वर्ग विधि का उपयोग करके अनुमानित वक्र का निर्माण

न्यूनतम वर्ग विधि का उपयोग किया जाता है:

जब समीकरणों की संख्या अज्ञात की संख्या से अधिक हो तो समीकरणों की अतिनिर्धारित प्रणालियों को हल करना;

समीकरणों की सामान्य (अतिनिर्धारित नहीं) अरेखीय प्रणालियों के मामले में समाधान ढूंढना;

कुछ अनुमानित फ़ंक्शन के साथ बिंदु मानों का अनुमान लगाना।

न्यूनतम वर्ग विधि का उपयोग करके अनुमानित फ़ंक्शन प्रयोगात्मक डेटा के दिए गए सरणी से गणना की गई अनुमानित फ़ंक्शन के वर्ग विचलन के न्यूनतम योग की स्थिति से निर्धारित किया जाता है। न्यूनतम वर्ग विधि का यह मानदंड निम्नलिखित अभिव्यक्ति के रूप में लिखा गया है:

नोडल बिंदुओं पर परिकलित सन्निकटन फ़ंक्शन के मान,

नोडल बिंदुओं पर प्रयोगात्मक डेटा की एक दी गई सारणी।

द्विघात मानदंड में कई "अच्छे" गुण होते हैं, जैसे कि भिन्नता, बहुपद सन्निकटन कार्यों के साथ सन्निकटन समस्या का एक अनूठा समाधान प्रदान करता है।

समस्या की स्थितियों के आधार पर, सन्निकटन फलन घात m का एक बहुपद है

अनुमानित फ़ंक्शन की डिग्री नोडल बिंदुओं की संख्या पर निर्भर नहीं करती है, लेकिन इसका आयाम हमेशा किसी दिए गए प्रयोगात्मक डेटा सरणी के आयाम (अंकों की संख्या) से कम होना चाहिए।

∙ यदि अनुमानित फ़ंक्शन की डिग्री m=1 है, तो हम सारणीबद्ध फ़ंक्शन को एक सीधी रेखा (रैखिक प्रतिगमन) के साथ अनुमानित करते हैं।

∙ यदि सन्निकटन फ़ंक्शन की डिग्री m=2 है, तो हम तालिका फ़ंक्शन को द्विघात परवलय (द्विघात सन्निकटन) के साथ अनुमानित करते हैं।

∙ यदि सन्निकटन फ़ंक्शन की डिग्री m=3 है, तो हम एक घन परवलय (घन सन्निकटन) के साथ तालिका फ़ंक्शन का अनुमान लगाते हैं।

सामान्य स्थिति में, जब दिए गए तालिका मानों के लिए घात m का एक अनुमानित बहुपद बनाना आवश्यक होता है, तो सभी नोडल बिंदुओं पर वर्ग विचलन के योग की न्यूनतम स्थिति को निम्नलिखित रूप में फिर से लिखा जाता है:

- डिग्री एम के अनुमानित बहुपद के अज्ञात गुणांक;

निर्दिष्ट तालिका मानों की संख्या.

किसी फ़ंक्शन के न्यूनतम अस्तित्व के लिए एक आवश्यक शर्त अज्ञात चर के संबंध में इसके आंशिक डेरिवेटिव के शून्य की समानता है . परिणामस्वरूप, हमें समीकरणों की निम्नलिखित प्रणाली प्राप्त होती है:

आइए समीकरणों की परिणामी रैखिक प्रणाली को रूपांतरित करें: कोष्ठक खोलें और मुक्त पदों को अभिव्यक्ति के दाईं ओर ले जाएँ। परिणामस्वरूप, रैखिक बीजगणितीय अभिव्यक्तियों की परिणामी प्रणाली निम्नलिखित रूप में लिखी जाएगी:

रैखिक बीजगणितीय अभिव्यक्तियों की इस प्रणाली को मैट्रिक्स रूप में फिर से लिखा जा सकता है:

परिणामस्वरूप, आयाम m+1 के रैखिक समीकरणों की एक प्रणाली प्राप्त हुई, जिसमें m+1 अज्ञात शामिल हैं। इस प्रणाली को रैखिक बीजगणितीय समीकरणों को हल करने के लिए किसी भी विधि का उपयोग करके हल किया जा सकता है (उदाहरण के लिए, गाऊसी विधि)। समाधान के परिणामस्वरूप, अनुमानित फ़ंक्शन के अज्ञात पैरामीटर पाए जाएंगे जो मूल डेटा से अनुमानित फ़ंक्शन के वर्ग विचलन का न्यूनतम योग प्रदान करते हैं, अर्थात। सर्वोत्तम संभव द्विघात सन्निकटन. यह याद रखना चाहिए कि यदि स्रोत डेटा का एक भी मान बदलता है, तो सभी गुणांक अपने मान बदल देंगे, क्योंकि वे पूरी तरह से स्रोत डेटा द्वारा निर्धारित होते हैं।

रैखिक निर्भरता द्वारा स्रोत डेटा का अनुमान

(रेखीय प्रतिगमन)

एक उदाहरण के रूप में, आइए अनुमानित फ़ंक्शन को निर्धारित करने की तकनीक पर विचार करें, जो एक रैखिक निर्भरता के रूप में निर्दिष्ट है। न्यूनतम वर्ग विधि के अनुसार, वर्ग विचलनों के योग के न्यूनतम की शर्त निम्नलिखित रूप में लिखी जाती है:

तालिका नोड्स के निर्देशांक;

अनुमानित फ़ंक्शन के अज्ञात गुणांक, जो एक रैखिक निर्भरता के रूप में निर्दिष्ट हैं।

किसी फ़ंक्शन के न्यूनतम अस्तित्व के लिए एक आवश्यक शर्त अज्ञात चर के संबंध में इसके आंशिक डेरिवेटिव के शून्य की समानता है। परिणामस्वरूप, हमें समीकरणों की निम्नलिखित प्रणाली प्राप्त होती है:

आइए हम समीकरणों की परिणामी रैखिक प्रणाली को रूपांतरित करें।

हम रैखिक समीकरणों की परिणामी प्रणाली को हल करते हैं। विश्लेषणात्मक रूप में अनुमानित फ़ंक्शन के गुणांक निम्नानुसार निर्धारित किए जाते हैं (क्रैमर विधि):

ये गुणांक दिए गए सारणीबद्ध मानों (प्रायोगिक डेटा) से अनुमानित फ़ंक्शन के वर्गों के योग को न्यूनतम करने की कसौटी के अनुसार एक रैखिक अनुमानित फ़ंक्शन का निर्माण सुनिश्चित करते हैं।

न्यूनतम वर्ग विधि को लागू करने के लिए एल्गोरिदम

1. प्रारंभिक डेटा:

माप एन की संख्या के साथ प्रयोगात्मक डेटा की एक सरणी निर्दिष्ट की गई है

सन्निकटन बहुपद (एम) की डिग्री निर्दिष्ट है

2. गणना एल्गोरिथ्म:

2.1. आयामों के साथ समीकरणों की एक प्रणाली के निर्माण के लिए गुणांक निर्धारित किए जाते हैं

समीकरणों की प्रणाली के गुणांक (समीकरण के बाईं ओर)

- समीकरणों की प्रणाली के वर्ग मैट्रिक्स के स्तंभ संख्या का सूचकांक

रैखिक समीकरणों की प्रणाली के मुक्त पद (समीकरण का दाहिना भाग)

- समीकरणों की प्रणाली के वर्ग मैट्रिक्स की पंक्ति संख्या का सूचकांक

2.2. आयाम के साथ रैखिक समीकरणों की एक प्रणाली का गठन।

2.3. डिग्री एम के एक अनुमानित बहुपद के अज्ञात गुणांक निर्धारित करने के लिए रैखिक समीकरणों की एक प्रणाली को हल करना।

2.4. सभी नोडल बिंदुओं पर मूल मानों से अनुमानित बहुपद के वर्ग विचलन का योग निर्धारित करना

वर्ग विचलनों के योग का पाया गया मान न्यूनतम संभव है।

अन्य कार्यों का उपयोग करके अनुमान लगाना

यह ध्यान दिया जाना चाहिए कि मूल डेटा को कम से कम वर्ग विधि के अनुसार अनुमानित करते समय, लघुगणक फ़ंक्शन, घातीय फ़ंक्शन और पावर फ़ंक्शन को कभी-कभी अनुमानित फ़ंक्शन के रूप में उपयोग किया जाता है।

लघुगणकीय सन्निकटन

आइए उस मामले पर विचार करें जब अनुमानित फ़ंक्शन फॉर्म के लॉगरिदमिक फ़ंक्शन द्वारा दिया जाता है:

इसके कई अनुप्रयोग हैं, क्योंकि यह किसी दिए गए फ़ंक्शन को अन्य सरल कार्यों द्वारा अनुमानित रूप से प्रस्तुत करने की अनुमति देता है। एलएसएम अवलोकनों को संसाधित करने में बेहद उपयोगी हो सकता है, और इसका उपयोग यादृच्छिक त्रुटियों वाले अन्य मापों के परिणामों के आधार पर कुछ मात्राओं का अनुमान लगाने के लिए सक्रिय रूप से किया जाता है। इस लेख में, आप सीखेंगे कि एक्सेल में न्यूनतम वर्ग गणना कैसे लागू करें।

एक विशिष्ट उदाहरण का उपयोग करके समस्या का विवरण

मान लीजिए कि दो संकेतक हैं विशिष्ट समस्या.

तो, मान लीजिए कि X एक किराने की दुकान का खुदरा स्थान है, जिसे वर्ग मीटर में मापा जाता है, और Y वार्षिक कारोबार है, जिसे लाखों रूबल में मापा जाता है।

यदि स्टोर में यह या वह खुदरा स्थान है तो इसका पूर्वानुमान लगाना आवश्यक है कि स्टोर का टर्नओवर (Y) कितना होगा। जाहिर है, फ़ंक्शन Y = f (X) बढ़ रहा है, क्योंकि हाइपरमार्केट स्टॉल की तुलना में अधिक सामान बेचता है।

भविष्यवाणी के लिए उपयोग किए गए प्रारंभिक डेटा की शुद्धता के बारे में कुछ शब्द

मान लीजिए कि हमारे पास n स्टोर्स के लिए डेटा का उपयोग करके बनाई गई एक तालिका है।

गणितीय आंकड़ों के अनुसार, यदि कम से कम 5-6 वस्तुओं के डेटा की जांच की जाए तो परिणाम कमोबेश सही होंगे। इसके अलावा, "विसंगतिपूर्ण" परिणामों का उपयोग नहीं किया जा सकता है। विशेष रूप से, एक विशिष्ट छोटे बुटीक का टर्नओवर "मासमार्केट" वर्ग के बड़े खुदरा दुकानों के टर्नओवर से कई गुना अधिक हो सकता है।

विधि का सार

तालिका डेटा को कार्टेशियन विमान पर बिंदु M 1 (x 1, y 1), ... M n (x n, y n) के रूप में दर्शाया जा सकता है। अब समस्या का समाधान एक अनुमानित फ़ंक्शन y = f (x) के चयन तक कम हो जाएगा, जिसमें ग्राफ़ बिंदु M 1, M 2, .. M n के जितना संभव हो उतना करीब से गुजर रहा है।

बेशक, आप एक उच्च-डिग्री बहुपद का उपयोग कर सकते हैं, लेकिन यह विकल्प न केवल लागू करना मुश्किल है, बल्कि गलत भी है, क्योंकि यह उस मुख्य प्रवृत्ति को प्रतिबिंबित नहीं करेगा जिसे पता लगाने की आवश्यकता है। सबसे उचित समाधान सीधी रेखा y = ax + b की खोज करना है, जो प्रयोगात्मक डेटा, या अधिक सटीक रूप से, गुणांक a और b का सबसे अच्छा अनुमान लगाता है।

सटीकता मूल्यांकन

किसी भी अनुमान के साथ, उसकी सटीकता का आकलन करना विशेष महत्व रखता है। आइए हम बिंदु x i के लिए कार्यात्मक और प्रायोगिक मानों के बीच अंतर (विचलन) को e i से निरूपित करें, अर्थात e i = y i - f (x i)।

जाहिर है, अनुमान की सटीकता का आकलन करने के लिए, आप विचलन के योग का उपयोग कर सकते हैं, यानी, वाई पर एक्स की निर्भरता के अनुमानित प्रतिनिधित्व के लिए एक सीधी रेखा चुनते समय, आपको सबसे छोटे मूल्य वाले को प्राथमिकता देने की आवश्यकता है विचाराधीन सभी बिंदुओं पर योग ई। हालाँकि, सब कुछ इतना सरल नहीं है, क्योंकि सकारात्मक विचलन के साथ-साथ नकारात्मक विचलन भी होंगे।

विचलन मॉड्यूल या उनके वर्गों का उपयोग करके समस्या को हल किया जा सकता है। अंतिम विधि सबसे व्यापक रूप से उपयोग की जाती है। इसका उपयोग कई क्षेत्रों में किया जाता है, जिसमें प्रतिगमन विश्लेषण (दो अंतर्निहित कार्यों का उपयोग करके एक्सेल में कार्यान्वित) शामिल है, और लंबे समय से इसकी प्रभावशीलता साबित हुई है।

न्यूनतम वर्ग विधि

एक्सेल, जैसा कि आप जानते हैं, में एक अंतर्निहित ऑटोसम फ़ंक्शन है जो आपको चयनित सीमा में स्थित सभी मानों के मानों की गणना करने की अनुमति देता है। इस प्रकार, कोई भी चीज़ हमें अभिव्यक्ति के मूल्य की गणना करने से नहीं रोकेगी (ई 1 2 + ई 2 2 + ई 3 2 + ... ई एन 2)।

गणितीय संकेतन में यह इस प्रकार दिखता है:

चूँकि निर्णय शुरू में एक सीधी रेखा का उपयोग करके अनुमानित किया गया था, हमारे पास है:

इस प्रकार, उस सीधी रेखा को खोजने का कार्य जो मात्राओं

ऐसा करने के लिए, आपको नए चर ए और बी के संबंध में आंशिक व्युत्पन्न को शून्य के बराबर करना होगा, और फॉर्म के 2 अज्ञात के साथ दो समीकरणों से युक्त एक आदिम प्रणाली को हल करना होगा:

कुछ सरल परिवर्तनों के बाद, जिसमें 2 से भाग देना और योगों में हेरफेर करना शामिल है, हमें मिलता है:

इसे हल करते हुए, उदाहरण के लिए, क्रैमर विधि का उपयोग करके, हम कुछ गुणांक a * और b * के साथ एक स्थिर बिंदु प्राप्त करते हैं। यह न्यूनतम है, यानी यह अनुमान लगाने के लिए कि एक निश्चित क्षेत्र के लिए किसी स्टोर का टर्नओवर कितना होगा, सीधी रेखा y = a * x + b * उपयुक्त है, जो प्रश्न में उदाहरण के लिए एक प्रतिगमन मॉडल है। बेशक, यह आपको सटीक परिणाम खोजने की अनुमति नहीं देगा, लेकिन यह आपको यह अंदाजा लगाने में मदद करेगा कि स्टोर क्रेडिट पर एक विशिष्ट क्षेत्र खरीदने से लाभ मिलेगा या नहीं।

एक्सेल में न्यूनतम वर्ग कैसे लागू करें

एक्सेल में न्यूनतम वर्गों का उपयोग करके मानों की गणना करने का एक फ़ंक्शन है। इसका निम्नलिखित रूप है: "TREND" (ज्ञात Y मान; ज्ञात X मान; नए X मान; स्थिरांक)। आइए एक्सेल में ओएलएस की गणना के लिए सूत्र को अपनी तालिका में लागू करें।

ऐसा करने के लिए, उस सेल में "=" चिह्न दर्ज करें जिसमें Excel में न्यूनतम वर्ग विधि का उपयोग करके गणना का परिणाम प्रदर्शित होना चाहिए और "TREND" फ़ंक्शन का चयन करें। खुलने वाली विंडो में, हाइलाइट करते हुए उपयुक्त फ़ील्ड भरें:

Y के लिए ज्ञात मानों की सीमा (इस मामले में, व्यापार टर्नओवर के लिए डेटा);
रेंज x 1 , …x n , यानी खुदरा स्थान का आकार;
x के ज्ञात और अज्ञात दोनों मान, जिसके लिए आपको टर्नओवर का आकार पता लगाना होगा (वर्कशीट पर उनके स्थान के बारे में जानकारी के लिए, नीचे देखें)।

इसके अलावा, सूत्र में तार्किक चर "कॉन्स्ट" शामिल है। यदि आप संबंधित फ़ील्ड में 1 दर्ज करते हैं, तो इसका मतलब यह होगा कि आपको बी = 0 मानते हुए गणना करनी चाहिए।

यदि आपको एक से अधिक x मान के लिए पूर्वानुमान जानने की आवश्यकता है, तो सूत्र दर्ज करने के बाद आपको "एंटर" नहीं दबाना चाहिए, बल्कि आपको कीबोर्ड पर संयोजन "Shift" + "कंट्रोल" + "एंटर" टाइप करना होगा।

कुछ सुविधाएं

प्रतिगमन विश्लेषण नौसिखियों के लिए भी सुलभ हो सकता है। अज्ञात चरों की एक श्रृंखला के मूल्य की भविष्यवाणी करने के लिए एक्सेल फॉर्मूला-ट्रेंड-का उपयोग उन लोगों द्वारा भी किया जा सकता है जिन्होंने कभी भी कम से कम वर्गों के बारे में नहीं सुना है। इसके काम की कुछ विशेषताओं को जानना ही काफी है। विशेष रूप से:

यदि आप वेरिएबल y के ज्ञात मानों की श्रेणी को एक पंक्ति या कॉलम में व्यवस्थित करते हैं, तो x के ज्ञात मानों वाली प्रत्येक पंक्ति (कॉलम) को प्रोग्राम द्वारा एक अलग वैरिएबल के रूप में माना जाएगा।
यदि ज्ञात x के साथ एक श्रेणी TREND विंडो में निर्दिष्ट नहीं है, तो Excel में किसी फ़ंक्शन का उपयोग करते समय, प्रोग्राम इसे पूर्णांकों से युक्त एक सरणी के रूप में मानेगा, जिसकी संख्या दिए गए मानों के साथ सीमा से मेल खाती है y परिवर्तनशील.
"अनुमानित" मानों की एक श्रृंखला को आउटपुट करने के लिए, प्रवृत्ति की गणना के लिए अभिव्यक्ति को एक सरणी सूत्र के रूप में दर्ज किया जाना चाहिए।
यदि नए x मान निर्दिष्ट नहीं हैं, तो TREND फ़ंक्शन उन्हें ज्ञात मानों के बराबर मानता है। यदि वे निर्दिष्ट नहीं हैं, तो सरणी 1 को एक तर्क के रूप में लिया जाता है; 2; 3; 4;…, जो पहले से निर्दिष्ट मापदंडों y के साथ सीमा के अनुरूप है।
नए x मानों वाली श्रेणी में दिए गए y मानों वाली श्रेणी के समान या अधिक पंक्तियाँ या स्तंभ होने चाहिए। दूसरे शब्दों में, यह स्वतंत्र चर के समानुपाती होना चाहिए।
ज्ञात x मानों वाली एक सरणी में एकाधिक चर हो सकते हैं। हालाँकि, यदि हम केवल एक के बारे में बात कर रहे हैं, तो यह आवश्यक है कि x और y के दिए गए मानों वाली श्रेणियाँ आनुपातिक हों। कई चर के मामले में, यह आवश्यक है कि दिए गए y मान वाली सीमा एक कॉलम या एक पंक्ति में फिट हो।

भविष्यवाणी समारोह

कई फ़ंक्शंस का उपयोग करके कार्यान्वित किया गया। उनमें से एक को "भविष्यवाणी" कहा जाता है। यह "TREND" के समान है, अर्थात यह न्यूनतम वर्ग विधि का उपयोग करके गणना का परिणाम देता है। हालाँकि, केवल एक X के लिए, जिसके लिए Y का मान अज्ञात है।

अब आप डमी के लिए एक्सेल में सूत्र जानते हैं जो आपको एक रैखिक प्रवृत्ति के अनुसार किसी विशेष संकेतक के भविष्य के मूल्य की भविष्यवाणी करने की अनुमति देते हैं।

प्रतिगमन फ़ंक्शन के प्रकार को चुनने के बाद, अर्थात। एक्स पर वाई (या वाई पर एक्स) की निर्भरता के विचारित मॉडल का प्रकार, उदाहरण के लिए, एक रैखिक मॉडल वाई एक्स =ए+बीएक्स, मॉडल गुणांक के विशिष्ट मूल्यों को निर्धारित करना आवश्यक है।

ए और बी के विभिन्न मूल्यों के लिए, फॉर्म y x = a + bx की अनंत संख्या में निर्भरता का निर्माण करना संभव है, यानी समन्वय विमान पर अनंत संख्या में सीधी रेखाएं हैं, लेकिन हमें एक ऐसी निर्भरता की आवश्यकता है जो सर्वोत्तम हो देखे गए मूल्यों से मेल खाता है। इस प्रकार, कार्य सर्वोत्तम गुणांकों का चयन करने का हो जाता है।

हम केवल उपलब्ध अवलोकनों की एक निश्चित संख्या के आधार पर रैखिक फलन a+bx की तलाश करते हैं। प्रेक्षित मानों के लिए सबसे उपयुक्त फ़ंक्शन को खोजने के लिए, हम न्यूनतम वर्ग विधि का उपयोग करते हैं।

आइए निरूपित करें: Y i - समीकरण Y i =a+bx i द्वारा परिकलित मान। y i - मापा गया मान, ε i =y i -Y i - समीकरण का उपयोग करके मापा और परिकलित मानों के बीच अंतर, ε i =y i -a-bx i .

न्यूनतम वर्ग विधि के लिए आवश्यक है कि ε i, मापे गए y i और समीकरण से परिकलित मान Y i के बीच का अंतर न्यूनतम हो। इसलिए, हम गुणांक ए और बी पाते हैं ताकि सीधी प्रतिगमन रेखा पर मूल्यों से देखे गए मूल्यों के वर्ग विचलन का योग सबसे छोटा हो:

डेरिवेटिव का उपयोग करके तर्क ए और चरम के लिए इस फ़ंक्शन की जांच करके, हम यह साबित कर सकते हैं कि यदि गुणांक ए और बी सिस्टम के समाधान हैं तो फ़ंक्शन न्यूनतम मान लेता है:

(2)

यदि हम सामान्य समीकरण के दोनों पक्षों को n से विभाजित करते हैं, तो हमें मिलता है:

ध्यान में रख कर (3)

हम पाते हैं , यहां से, पहले समीकरण में a का मान प्रतिस्थापित करने पर, हमें मिलता है:

इस मामले में, b को प्रतिगमन गुणांक कहा जाता है; a को प्रतिगमन समीकरण का मुक्त पद कहा जाता है और इसकी गणना सूत्र का उपयोग करके की जाती है:

परिणामी सीधी रेखा सैद्धांतिक प्रतिगमन रेखा के लिए एक अनुमान है। हमारे पास है:

इसलिए, एक रेखीय प्रतिगमन समीकरण है.

प्रतिगमन प्रत्यक्ष (बी>0) और उल्टा (बी उदाहरण 1) हो सकता है। एक्स और वाई के मूल्यों को मापने के परिणाम तालिका में दिए गए हैं:

एक्स मैं	-2	0	1	2	4
यी	0.5	1	1.5	2	3

यह मानते हुए कि X और Y y=a+bx के बीच एक रैखिक संबंध है, न्यूनतम वर्ग विधि का उपयोग करके गुणांक a और b निर्धारित करें।

समाधान। यहाँ n=5
x i =-2+0+1+2+4=5;
x i 2 =4+0+1+4+16=25
x i y i =-2 0.5+0 1+1 1.5+2 2+4 3=16.5
y i =0.5+1+1.5+2+3=8

और सामान्य प्रणाली (2) का रूप है

इस प्रणाली को हल करने पर, हमें मिलता है: b=0.425, a=1.175। इसलिए y=1.175+0.425x.

उदाहरण 2. आर्थिक संकेतकों (एक्स) और (वाई) के 10 अवलोकनों का एक नमूना है।

एक्स मैं	180	172	173	169	175	170	179	170	167	174
यी	186	180	176	171	182	166	182	172	169	177

आपको X पर Y का एक नमूना प्रतिगमन समीकरण ढूंढने की आवश्यकता है। X पर Y की एक नमूना प्रतिगमन रेखा बनाएं।

समाधान। 1. आइए डेटा को x i और y i मानों के अनुसार क्रमबद्ध करें। हमें एक नई तालिका मिलती है:

एक्स मैं	167	169	170	170	172	173	174	175	179	180
यी	169	171	166	172	180	176	177	182	182	186

गणनाओं को सरल बनाने के लिए, हम एक गणना तालिका तैयार करेंगे जिसमें हम आवश्यक संख्यात्मक मान दर्ज करेंगे।

एक्स मैं	यी	एक्स मैं 2	एक्स मैं वाई मैं
167	169	27889	28223
169	171	28561	28899
170	166	28900	28220
170	172	28900	29240
172	180	29584	30960
173	176	29929	30448
174	177	30276	30798
175	182	30625	31850
179	182	32041	32578
180	186	32400	33480
∑x मैं =1729	∑y मैं =1761	∑x i 2 299105	∑x i y i =304696
x=172.9	y=176.1	एक्स मैं 2 =29910.5	xy=30469.6

सूत्र (4) के अनुसार, हम प्रतिगमन गुणांक की गणना करते हैं

और सूत्र के अनुसार (5)

इस प्रकार, नमूना प्रतिगमन समीकरण y=-59.34+1.3804x है।
आइए निर्देशांक तल पर बिंदु (x i ; y i) आलेखित करें और प्रतिगमन रेखा को चिह्नित करें।

चित्र 4

चित्र 4 दिखाता है कि प्रेक्षित मान प्रतिगमन रेखा के सापेक्ष कैसे स्थित हैं। Y i से y i के विचलन का संख्यात्मक रूप से आकलन करने के लिए, जहां y i मनाया जाता है और Y i प्रतिगमन द्वारा निर्धारित मान हैं, हम एक तालिका बनाते हैं:

एक्स मैं	यी	यी	वाई आई -वाई आई
167	169	168.055	-0.945
169	171	170.778	-0.222
170	166	172.140	6.140
170	172	172.140	0.140
172	180	174.863	-5.137
173	176	176.225	0.225
174	177	177.587	0.587
175	182	178.949	-3.051
179	182	184.395	2.395
180	186	185.757	-0.243

यी मान की गणना प्रतिगमन समीकरण के अनुसार की जाती है।

प्रतिगमन रेखा से कुछ प्रेक्षित मानों के ध्यान देने योग्य विचलन को प्रेक्षणों की छोटी संख्या द्वारा समझाया गया है। X पर Y की रैखिक निर्भरता की डिग्री का अध्ययन करते समय, टिप्पणियों की संख्या को ध्यान में रखा जाता है। निर्भरता की ताकत सहसंबंध गुणांक के मूल्य से निर्धारित होती है।

उदाहरण।

चर के मूल्यों पर प्रायोगिक डेटा एक्सऔर परतालिका में दिए गए हैं।

इनके संरेखण के फलस्वरूप फलन प्राप्त होता है

का उपयोग करते हुए न्यूनतम वर्ग विधि, इन आंकड़ों को एक रैखिक निर्भरता द्वारा अनुमानित करें y=ax+b(पैरामीटर खोजें एऔर बी). पता लगाएं कि दोनों में से कौन सी रेखा बेहतर है (न्यूनतम वर्ग विधि के अर्थ में) प्रयोगात्मक डेटा को संरेखित करती है। एक चित्र बनाओ.

न्यूनतम वर्ग विधि (एलएसएम) का सार।

कार्य रैखिक निर्भरता गुणांक को ढूंढना है जिस पर दो चर का कार्य होता है एऔर बी सबसे छोटा मान लेता है. अर्थात् दिया हुआ एऔर बीपाई गई सीधी रेखा से प्रयोगात्मक डेटा के वर्ग विचलन का योग सबसे छोटा होगा। यह न्यूनतम वर्ग विधि का संपूर्ण बिंदु है।

इस प्रकार, उदाहरण को हल करने से दो चर वाले फ़ंक्शन का चरम ज्ञात हो जाता है।

गुणांक ज्ञात करने के लिए सूत्र व्युत्पन्न करना।

दो अज्ञात वाले दो समीकरणों की एक प्रणाली संकलित और हल की जाती है। चरों के संबंध में किसी फ़ंक्शन के आंशिक व्युत्पन्न ढूँढना एऔर बी, हम इन व्युत्पन्नों को शून्य के बराबर करते हैं।

हम समीकरणों की परिणामी प्रणाली को किसी भी विधि (उदाहरण के लिए) का उपयोग करके हल करते हैं प्रतिस्थापन विधि द्वाराया ) और न्यूनतम वर्ग विधि (एलएसएम) का उपयोग करके गुणांक खोजने के लिए सूत्र प्राप्त करें।

दिया गया एऔर बीसमारोह सबसे छोटा मान लेता है. इस बात का प्रमाण दिया गया है.

यह न्यूनतम वर्गों की पूरी विधि है। पैरामीटर खोजने का सूत्र एइसमें योग , , , और पैरामीटर शामिल हैं एन- प्रयोगात्मक डेटा की मात्रा. हम इन राशियों के मूल्यों की अलग से गणना करने की अनुशंसा करते हैं। गुणक बीगणना के बाद पाया गया ए.

मूल उदाहरण को याद करने का समय आ गया है।

समाधान।

हमारे उदाहरण में एन=5. आवश्यक गुणांकों के सूत्रों में शामिल राशियों की गणना की सुविधा के लिए हम तालिका भरते हैं।

तालिका की चौथी पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों को तीसरी पंक्ति के मानों से गुणा करके प्राप्त किए जाते हैं मैं.

तालिका की पाँचवीं पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों का वर्ग करके प्राप्त किए जाते हैं मैं.

तालिका के अंतिम कॉलम के मान पंक्तियों के मानों का योग हैं।

गुणांक ज्ञात करने के लिए हम न्यूनतम वर्ग विधि के सूत्रों का उपयोग करते हैं एऔर बी. हम तालिका के अंतिम कॉलम से संबंधित मानों को उनमें प्रतिस्थापित करते हैं:

इस तरह, y = 0.165x+2.184- वांछित सन्निकटन सीधी रेखा।

यह पता लगाना बाकी है कि कौन सी पंक्तियाँ हैं y = 0.165x+2.184या मूल डेटा का बेहतर अनुमान लगाना, यानी न्यूनतम वर्ग विधि का उपयोग करके अनुमान लगाना।

न्यूनतम वर्ग विधि का त्रुटि अनुमान.

ऐसा करने के लिए, आपको इन पंक्तियों से मूल डेटा के वर्ग विचलन के योग की गणना करने की आवश्यकता है और , एक छोटा मान उस रेखा से मेल खाता है जो न्यूनतम वर्ग विधि के अर्थ में मूल डेटा का बेहतर अनुमान लगाता है।

चूँकि , तो सीधा y = 0.165x+2.184मूल डेटा का बेहतर अनुमान लगाएं।

न्यूनतम वर्ग (एलएस) विधि का ग्राफिक चित्रण।

ग्राफ़ पर सब कुछ स्पष्ट रूप से दिखाई देता है। लाल रेखा पाई गई सीधी रेखा है y = 0.165x+2.184, नीली रेखा है , गुलाबी बिंदु मूल डेटा हैं।

इसकी आवश्यकता क्यों है, ये सभी अनुमान क्यों हैं?

मैं व्यक्तिगत रूप से इसका उपयोग डेटा स्मूथिंग, इंटरपोलेशन और एक्सट्रपलेशन समस्याओं की समस्याओं को हल करने के लिए करता हूं (मूल उदाहरण में उन्हें देखे गए मूल्य का मूल्य खोजने के लिए कहा गया होगा) यपर एक्स=3या जब एक्स=6न्यूनतम वर्ग विधि का उपयोग करके)। लेकिन हम इसके बारे में बाद में साइट के दूसरे अनुभाग में अधिक बात करेंगे।

सबूत।

ताकि जब मिले एऔर बीफ़ंक्शन सबसे छोटा मान लेता है, यह आवश्यक है कि इस बिंदु पर फ़ंक्शन के लिए दूसरे क्रम के अंतर के द्विघात रूप का मैट्रिक्स सकारात्मक निश्चित था. चलिए दिखाते हैं.