मैनुअल न्यूनतम वर्ग विधि. रेखीय प्रतिगमन

न्यूनतम वर्ग विधि

न्यूनतम वर्ग विधि ( ओएलएस, ओएलएस, साधारण न्यूनतम वर्ग) - नमूना डेटा का उपयोग करके प्रतिगमन मॉडल के अज्ञात मापदंडों का अनुमान लगाने के लिए प्रतिगमन विश्लेषण के बुनियादी तरीकों में से एक। यह विधि प्रतिगमन अवशेषों के वर्गों के योग को न्यूनतम करने पर आधारित है।

यह ध्यान दिया जाना चाहिए कि न्यूनतम वर्ग विधि को किसी भी क्षेत्र में किसी समस्या को हल करने के लिए एक विधि कहा जा सकता है यदि समाधान आवश्यक चर के कुछ कार्यों के वर्गों के योग को कम करने के लिए कुछ मानदंडों को पूरा करता है या संतुष्ट करता है। इसलिए, कम से कम वर्ग विधि का उपयोग अन्य (सरल) कार्यों द्वारा किसी दिए गए फ़ंक्शन के अनुमानित प्रतिनिधित्व (अनुमान) के लिए भी किया जा सकता है, जब समीकरणों या बाधाओं को संतुष्ट करने वाली मात्राओं का एक सेट ढूंढते हैं, जिनकी संख्या इन मात्राओं की संख्या से अधिक होती है , वगैरह।

एमएनसी का सार

(स्पष्ट) चर के बीच संभाव्य (प्रतिगमन) संबंध का कुछ (पैरामीट्रिक) मॉडल दिया जाए और कई कारक (व्याख्यात्मक चर) एक्स

अज्ञात मॉडल मापदंडों का वेक्टर कहां है

- यादृच्छिक मॉडल त्रुटि.

इन चरों के मानों का नमूना अवलोकन भी होने दें। मान लीजिए अवलोकन संख्या ()। फिर वें अवलोकन में चर के मान हैं। फिर, पैरामीटर बी के दिए गए मानों के लिए, समझाए गए चर y के सैद्धांतिक (मॉडल) मानों की गणना करना संभव है:

अवशेषों का आकार पैरामीटर बी के मूल्यों पर निर्भर करता है।

न्यूनतम वर्ग विधि (साधारण, शास्त्रीय) का सार ऐसे पैरामीटर बी को ढूंढना है जिसके लिए अवशेषों के वर्गों का योग (इंग्लैंड)। वर्गों का अवशिष्ट योग) न्यूनतम होगा:

सामान्य स्थिति में, इस समस्या को संख्यात्मक अनुकूलन (न्यूनतमीकरण) विधियों द्वारा हल किया जा सकता है। ऐसे में वे बात करते हैं अरैखिक न्यूनतम वर्ग(एनएलएस या एनएलएलएस - अंग्रेजी) अरैखिक न्यूनतम वर्ग). कई मामलों में विश्लेषणात्मक समाधान प्राप्त करना संभव है। न्यूनीकरण समस्या को हल करने के लिए, फ़ंक्शन के स्थिर बिंदुओं को अज्ञात पैरामीटर बी के संबंध में विभेदित करके, डेरिवेटिव को शून्य के बराबर करना और समीकरणों की परिणामी प्रणाली को हल करना आवश्यक है:

यदि मॉडल की यादृच्छिक त्रुटियां सामान्य रूप से वितरित की जाती हैं, समान भिन्नता होती है, और असंबद्ध होती हैं, तो ओएलएस पैरामीटर अनुमान अधिकतम संभावना अनुमान (एमएलएम) के समान होते हैं।

रैखिक मॉडल के मामले में ओएलएस

प्रतिगमन निर्भरता को रैखिक होने दें:

होने देना समझाए गए चर के अवलोकनों का एक कॉलम वेक्टर है, और कारक अवलोकनों का एक मैट्रिक्स है (मैट्रिक्स की पंक्तियां किसी दिए गए अवलोकन में कारक मानों के वेक्टर हैं, कॉलम किसी दिए गए कारक के मानों के वेक्टर हैं सभी अवलोकनों में)। रैखिक मॉडल का मैट्रिक्स प्रतिनिधित्व है:

तब समझाए गए चर के अनुमानों का वेक्टर और प्रतिगमन अवशेषों का वेक्टर बराबर होगा

तदनुसार, प्रतिगमन अवशेषों के वर्गों का योग बराबर होगा

मापदंडों के वेक्टर के संबंध में इस फ़ंक्शन को अलग करने और डेरिवेटिव को शून्य के बराबर करने पर, हम समीकरणों की एक प्रणाली प्राप्त करते हैं (मैट्रिक्स रूप में):

.

समीकरणों की इस प्रणाली का समाधान एक रैखिक मॉडल के लिए न्यूनतम वर्ग अनुमान के लिए सामान्य सूत्र देता है:

विश्लेषणात्मक उद्देश्यों के लिए, इस सूत्र का बाद वाला प्रतिनिधित्व उपयोगी है। यदि प्रतिगमन मॉडल में डेटा केंद्रित, तो इस प्रतिनिधित्व में पहले मैट्रिक्स में कारकों के एक नमूना सहप्रसरण मैट्रिक्स का अर्थ है, और दूसरा आश्रित चर के साथ कारकों के सहप्रसरण का एक वेक्टर है। यदि इसके अतिरिक्त डेटा भी है सामान्यीकृतएमएसई के लिए (अर्थात, अंततः मानकीकृत), तो पहले मैट्रिक्स में कारकों के नमूना सहसंबंध मैट्रिक्स का अर्थ है, दूसरा वेक्टर - आश्रित चर के साथ कारकों के नमूना सहसंबंध का एक वेक्टर।

मॉडलों के लिए ओएलएस अनुमान की एक महत्वपूर्ण संपत्ति स्थिरांक के साथ- निर्मित प्रतिगमन रेखा नमूना डेटा के गुरुत्वाकर्षण के केंद्र से होकर गुजरती है, अर्थात समानता संतुष्ट है:

विशेष रूप से, चरम मामले में, जब एकमात्र प्रतिगामी एक स्थिरांक होता है, तो हम पाते हैं कि एकमात्र पैरामीटर (स्थिरांक स्वयं) का ओएलएस अनुमान समझाए गए चर के औसत मूल्य के बराबर है। अर्थात्, बड़ी संख्या के नियमों से अपने अच्छे गुणों के लिए जाना जाने वाला अंकगणितीय माध्य भी एक न्यूनतम वर्ग अनुमान है - यह इससे वर्ग विचलन के न्यूनतम योग की कसौटी को पूरा करता है।

उदाहरण: सरलतम (जोड़ीवार) प्रतिगमन

युग्मित रैखिक प्रतिगमन के मामले में, गणना सूत्र सरल हो जाते हैं (आप मैट्रिक्स बीजगणित के बिना कर सकते हैं):

ओएलएस अनुमानकों के गुण

सबसे पहले, हम ध्यान दें कि रैखिक मॉडल के लिए, ओएलएस अनुमान रैखिक अनुमान हैं, जैसा कि उपरोक्त सूत्र से पता चलता है। निष्पक्ष ओएलएस अनुमानों के लिए, प्रतिगमन विश्लेषण की सबसे महत्वपूर्ण शर्त को पूरा करना आवश्यक और पर्याप्त है: कारकों पर सशर्त एक यादृच्छिक त्रुटि की गणितीय अपेक्षा, शून्य के बराबर होनी चाहिए। यह शर्त, विशेष रूप से, संतुष्ट होती है यदि

  1. यादृच्छिक त्रुटियों की गणितीय अपेक्षा शून्य है, और
  2. कारक और यादृच्छिक त्रुटियाँ स्वतंत्र यादृच्छिक चर हैं।

दूसरी स्थिति - कारकों की बहिर्जातता की स्थिति - मौलिक है। यदि यह संपत्ति पूरी नहीं होती है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी हमें इस मामले में उच्च-गुणवत्ता वाले अनुमान प्राप्त करने की अनुमति नहीं देता है) ). शास्त्रीय मामले में, यादृच्छिक त्रुटि के विपरीत, कारकों के नियतत्ववाद के बारे में एक मजबूत धारणा बनाई जाती है, जिसका स्वचालित रूप से मतलब है कि बहिर्जातता की स्थिति पूरी हो गई है। सामान्य मामले में, अनुमानों की स्थिरता के लिए, नमूना आकार अनंत तक बढ़ने पर मैट्रिक्स के कुछ गैर-एकवचन मैट्रिक्स में अभिसरण के साथ बहिर्जातता की स्थिति को संतुष्ट करना पर्याप्त है।

निरंतरता और निष्पक्षता के अलावा, (सामान्य) न्यूनतम वर्गों के अनुमान भी प्रभावी होने के लिए (रैखिक निष्पक्ष अनुमानों की श्रेणी में सर्वोत्तम), यादृच्छिक त्रुटि के अतिरिक्त गुणों को पूरा किया जाना चाहिए:

इन धारणाओं को यादृच्छिक त्रुटि वेक्टर के सहप्रसरण मैट्रिक्स के लिए तैयार किया जा सकता है

एक रैखिक मॉडल जो इन शर्तों को पूरा करता है उसे कहा जाता है क्लासिक. शास्त्रीय रैखिक प्रतिगमन के लिए ओएलएस अनुमान निष्पक्ष, सुसंगत और सभी रैखिक निष्पक्ष अनुमानों की श्रेणी में सबसे प्रभावी अनुमान हैं (अंग्रेजी साहित्य में कभी-कभी संक्षिप्त नाम का उपयोग किया जाता है) नीला (सर्वश्रेष्ठ लीनियर अनबाइज्ड एस्टीमेटर) - सर्वोत्तम रैखिक निष्पक्ष अनुमान; रूसी साहित्य में गॉस-मार्कोव प्रमेय को अक्सर उद्धृत किया जाता है)। जैसा कि दिखाना आसान है, गुणांक अनुमान के वेक्टर का सहप्रसरण मैट्रिक्स इसके बराबर होगा:

सामान्यीकृत ओएलएस

न्यूनतम वर्ग विधि व्यापक सामान्यीकरण की अनुमति देती है। अवशेषों के वर्गों के योग को कम करने के बजाय, कोई अवशेषों के वेक्टर के कुछ सकारात्मक निश्चित द्विघात रूप को कम कर सकता है, जहां कुछ सममित सकारात्मक निश्चित वजन मैट्रिक्स है। पारंपरिक न्यूनतम वर्ग इस दृष्टिकोण का एक विशेष मामला है, जहां भार मैट्रिक्स पहचान मैट्रिक्स के समानुपाती होता है। जैसा कि सममित मैट्रिक्स (या ऑपरेटरों) के सिद्धांत से जाना जाता है, ऐसे मैट्रिक्स के लिए एक अपघटन होता है। नतीजतन, निर्दिष्ट फ़ंक्शनल को निम्नानुसार दर्शाया जा सकता है, अर्थात, इस फ़ंक्शनल को कुछ रूपांतरित "शेषों" के वर्गों के योग के रूप में दर्शाया जा सकता है। इस प्रकार, हम न्यूनतम वर्ग विधियों के एक वर्ग को अलग कर सकते हैं - एलएस विधियाँ (न्यूनतम वर्ग)।

यह साबित हो चुका है (ऐटकेन का प्रमेय) कि एक सामान्यीकृत रैखिक प्रतिगमन मॉडल (जिसमें यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स पर कोई प्रतिबंध नहीं लगाया जाता है) के लिए, सबसे प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में) तथाकथित अनुमान हैं। सामान्यीकृत न्यूनतम वर्ग (जीएलएस - सामान्यीकृत न्यूनतम वर्ग)- यादृच्छिक त्रुटियों के व्युत्क्रम सहप्रसरण मैट्रिक्स के बराबर भार मैट्रिक्स के साथ एलएस विधि:।

यह दिखाया जा सकता है कि एक रैखिक मॉडल के मापदंडों के जीएलएस अनुमान के सूत्र का रूप है

इन अनुमानों का सहप्रसरण मैट्रिक्स तदनुसार बराबर होगा

वास्तव में, ओएलएस का सार मूल डेटा के एक निश्चित (रैखिक) परिवर्तन (पी) और रूपांतरित डेटा पर साधारण ओएलएस के अनुप्रयोग में निहित है। इस परिवर्तन का उद्देश्य यह है कि रूपांतरित डेटा के लिए, यादृच्छिक त्रुटियां पहले से ही शास्त्रीय मान्यताओं को संतुष्ट करती हैं।

भारित ओएलएस

एक विकर्ण भार मैट्रिक्स (और इसलिए यादृच्छिक त्रुटियों का एक सहप्रसरण मैट्रिक्स) के मामले में, हमारे पास तथाकथित भारित न्यूनतम वर्ग (डब्ल्यूएलएस) हैं। इस मामले में, मॉडल अवशेषों के वर्गों का भारित योग कम से कम किया जाता है, अर्थात, प्रत्येक अवलोकन को एक "वजन" प्राप्त होता है जो इस अवलोकन में यादृच्छिक त्रुटि के विचरण के व्युत्क्रमानुपाती होता है:। वास्तव में, डेटा को अवलोकनों को भारित करके (यादृच्छिक त्रुटियों के अनुमानित मानक विचलन के आनुपातिक राशि से विभाजित करके) रूपांतरित किया जाता है, और सामान्य ओएलएस को भारित डेटा पर लागू किया जाता है।

व्यवहार में बहुराष्ट्रीय कंपनी का उपयोग करने के कुछ विशेष मामले

रैखिक निर्भरता का अनुमान

आइए उस मामले पर विचार करें, जब एक निश्चित स्केलर मात्रा पर एक निश्चित स्केलर मात्रा की निर्भरता का अध्ययन करने के परिणामस्वरूप (यह हो सकता है, उदाहरण के लिए, वर्तमान ताकत पर वोल्टेज की निर्भरता:, जहां एक स्थिर मूल्य है, का प्रतिरोध कंडक्टर), इन मात्राओं का मापन किया गया, जिसके परिणामस्वरूप मूल्य और उनके संबंधित मूल्य। माप डेटा को एक तालिका में दर्ज किया जाना चाहिए।

मेज़। माप परिणाम।

माप नं.
1
2
3
4
5
6

प्रश्न यह है कि निर्भरता का सर्वोत्तम वर्णन करने के लिए गुणांक का कौन सा मान चुना जा सकता है? न्यूनतम वर्ग विधि के अनुसार यह मान इस प्रकार होना चाहिए कि मानों के वर्ग विचलनों का योग मानों से हो

न्यूनतम था

वर्ग विचलनों के योग का एक चरम होता है - न्यूनतम, जो हमें इस सूत्र का उपयोग करने की अनुमति देता है। आइए इस सूत्र से गुणांक का मान ज्ञात करें। ऐसा करने के लिए, हम इसके बाईं ओर को इस प्रकार बदलते हैं:

अंतिम सूत्र हमें गुणांक का मान ज्ञात करने की अनुमति देता है, जो कि समस्या में आवश्यक था।

कहानी

19वीं सदी की शुरुआत तक. वैज्ञानिकों के पास समीकरणों की ऐसी प्रणाली को हल करने के लिए कुछ निश्चित नियम नहीं थे जिनमें अज्ञात की संख्या समीकरणों की संख्या से कम हो; उस समय तक, निजी तकनीकों का उपयोग किया जाता था जो समीकरणों के प्रकार और कैलकुलेटर की बुद्धि पर निर्भर करती थीं, और इसलिए एक ही अवलोकन संबंधी डेटा के आधार पर अलग-अलग कैलकुलेटर अलग-अलग निष्कर्ष पर आते थे। गॉस (1795) इस पद्धति का उपयोग करने वाले पहले व्यक्ति थे, और लीजेंड्रे (1805) ने स्वतंत्र रूप से इसे इसके आधुनिक नाम (फ्रेंच) के तहत खोजा और प्रकाशित किया। मेथोड डेस मोइंड्रेस क्वारेस ) . लाप्लास ने विधि को संभाव्यता सिद्धांत से संबंधित किया, और अमेरिकी गणितज्ञ एड्रेन (1808) ने इसके संभाव्यता-सैद्धांतिक अनुप्रयोगों पर विचार किया। एनके, बेसेल, हैनसेन और अन्य के आगे के शोध से यह विधि व्यापक हो गई और इसमें सुधार हुआ।

ओएलएस का वैकल्पिक उपयोग

न्यूनतम वर्ग विधि के विचार का उपयोग अन्य मामलों में भी किया जा सकता है जो सीधे प्रतिगमन विश्लेषण से संबंधित नहीं हैं। तथ्य यह है कि वर्गों का योग वैक्टर के लिए सबसे आम निकटता उपायों में से एक है (परिमित-आयामी स्थानों में यूक्लिडियन मीट्रिक)।

एक अनुप्रयोग रैखिक समीकरणों की प्रणालियों का "समाधान" है जिसमें समीकरणों की संख्या चर की संख्या से अधिक है

जहां मैट्रिक्स वर्गाकार नहीं, बल्कि आयताकार आकार का है।

सामान्य स्थिति में, समीकरणों की ऐसी प्रणाली का कोई समाधान नहीं होता है (यदि रैंक वास्तव में चर की संख्या से अधिक है)। इसलिए, इस प्रणाली को केवल ऐसे वेक्टर को चुनने के अर्थ में "हल" किया जा सकता है जो वैक्टर और के बीच "दूरी" को कम करता है। ऐसा करने के लिए, आप सिस्टम समीकरणों के बाएँ और दाएँ पक्षों के बीच अंतर के वर्गों के योग को न्यूनतम करने की कसौटी लागू कर सकते हैं। यह दिखाना आसान है कि इस न्यूनतमकरण समस्या को हल करने से समीकरणों की निम्नलिखित प्रणाली को हल किया जा सकता है

प्रयोगात्मक डेटा का अनुमान प्रयोगात्मक रूप से प्राप्त डेटा को एक विश्लेषणात्मक फ़ंक्शन के साथ प्रतिस्थापित करने पर आधारित एक विधि है जो मूल मूल्यों (किसी प्रयोग या प्रयोग के दौरान प्राप्त डेटा) के साथ नोडल बिंदुओं पर सबसे निकट से गुजरती है या मेल खाती है। वर्तमान में, किसी विश्लेषणात्मक फ़ंक्शन को परिभाषित करने के दो तरीके हैं:

एक एन-डिग्री इंटरपोलेशन बहुपद का निर्माण करके जो गुजरता है सभी बिंदुओं के माध्यम से सीधेएक दी गई डेटा सरणी. इस मामले में, अनुमानित फ़ंक्शन को इस रूप में प्रस्तुत किया जाता है: लैग्रेंज रूप में एक इंटरपोलेशन बहुपद या न्यूटन फॉर्म में एक इंटरपोलेशन बहुपद।

एक n-डिग्री सन्निकट बहुपद का निर्माण करके जो गुजरता है बिंदुओं के तत्काल आसपास मेंकिसी दिए गए डेटा सरणी से. इस प्रकार, अनुमानित फ़ंक्शन प्रयोग के दौरान उत्पन्न होने वाले सभी यादृच्छिक शोर (या त्रुटियों) को सुचारू कर देता है: प्रयोग के दौरान मापा गया मान यादृच्छिक कारकों पर निर्भर करता है जो अपने स्वयं के यादृच्छिक कानूनों (माप या उपकरण त्रुटियां, अशुद्धि या प्रयोगात्मक) के अनुसार उतार-चढ़ाव करते हैं त्रुटियाँ)। इस मामले में, अनुमानित फ़ंक्शन न्यूनतम वर्ग विधि का उपयोग करके निर्धारित किया जाता है।

न्यूनतम वर्ग विधि(अंग्रेजी साहित्य ऑर्डिनरी लीस्ट स्क्वेयर्स, ओएलएस में) अनुमानित फ़ंक्शन को निर्धारित करने पर आधारित एक गणितीय विधि है, जिसका निर्माण प्रयोगात्मक डेटा के दिए गए सरणी से बिंदुओं के निकटतम निकटता में किया जाता है। मूल और अनुमानित कार्यों F(x) की निकटता एक संख्यात्मक माप द्वारा निर्धारित की जाती है, अर्थात्: अनुमानित वक्र F(x) से प्रयोगात्मक डेटा के वर्ग विचलन का योग सबसे छोटा होना चाहिए।

न्यूनतम वर्ग विधि का उपयोग करके अनुमानित वक्र का निर्माण

न्यूनतम वर्ग विधि का उपयोग किया जाता है:

जब समीकरणों की संख्या अज्ञात की संख्या से अधिक हो तो समीकरणों की अतिनिर्धारित प्रणालियों को हल करना;

समीकरणों की सामान्य (अतिनिर्धारित नहीं) अरेखीय प्रणालियों के मामले में समाधान ढूंढना;

कुछ अनुमानित फ़ंक्शन के साथ बिंदु मानों का अनुमान लगाना।

न्यूनतम वर्ग विधि का उपयोग करके अनुमानित फ़ंक्शन प्रयोगात्मक डेटा के दिए गए सरणी से गणना की गई अनुमानित फ़ंक्शन के वर्ग विचलन के न्यूनतम योग की स्थिति से निर्धारित किया जाता है। न्यूनतम वर्ग विधि का यह मानदंड निम्नलिखित अभिव्यक्ति के रूप में लिखा गया है:

नोडल बिंदुओं पर परिकलित सन्निकटन फ़ंक्शन के मान,

नोडल बिंदुओं पर प्रयोगात्मक डेटा की एक दी गई सारणी।

द्विघात मानदंड में कई "अच्छे" गुण होते हैं, जैसे कि भिन्नता, बहुपद सन्निकटन कार्यों के साथ सन्निकटन समस्या का एक अनूठा समाधान प्रदान करता है।

समस्या की स्थितियों के आधार पर, सन्निकटन फलन घात m का एक बहुपद है

अनुमानित फ़ंक्शन की डिग्री नोडल बिंदुओं की संख्या पर निर्भर नहीं करती है, लेकिन इसका आयाम हमेशा किसी दिए गए प्रयोगात्मक डेटा सरणी के आयाम (अंकों की संख्या) से कम होना चाहिए।

∙ यदि अनुमानित फ़ंक्शन की डिग्री m=1 है, तो हम सारणीबद्ध फ़ंक्शन को एक सीधी रेखा (रैखिक प्रतिगमन) के साथ अनुमानित करते हैं।

∙ यदि सन्निकटन फ़ंक्शन की डिग्री m=2 है, तो हम तालिका फ़ंक्शन को द्विघात परवलय (द्विघात सन्निकटन) के साथ अनुमानित करते हैं।

∙ यदि सन्निकटन फ़ंक्शन की डिग्री m=3 है, तो हम एक घन परवलय (घन सन्निकटन) के साथ तालिका फ़ंक्शन का अनुमान लगाते हैं।

सामान्य स्थिति में, जब दिए गए तालिका मानों के लिए घात m का एक अनुमानित बहुपद बनाना आवश्यक होता है, तो सभी नोडल बिंदुओं पर वर्ग विचलन के योग की न्यूनतम स्थिति को निम्नलिखित रूप में फिर से लिखा जाता है:

- डिग्री एम के अनुमानित बहुपद के अज्ञात गुणांक;

निर्दिष्ट तालिका मानों की संख्या.

किसी फ़ंक्शन के न्यूनतम अस्तित्व के लिए एक आवश्यक शर्त अज्ञात चर के संबंध में इसके आंशिक डेरिवेटिव के शून्य की समानता है . परिणामस्वरूप, हमें समीकरणों की निम्नलिखित प्रणाली प्राप्त होती है:

आइए समीकरणों की परिणामी रैखिक प्रणाली को रूपांतरित करें: कोष्ठक खोलें और मुक्त पदों को अभिव्यक्ति के दाईं ओर ले जाएँ। परिणामस्वरूप, रैखिक बीजगणितीय अभिव्यक्तियों की परिणामी प्रणाली निम्नलिखित रूप में लिखी जाएगी:

रैखिक बीजगणितीय अभिव्यक्तियों की इस प्रणाली को मैट्रिक्स रूप में फिर से लिखा जा सकता है:

परिणामस्वरूप, आयाम m+1 के रैखिक समीकरणों की एक प्रणाली प्राप्त हुई, जिसमें m+1 अज्ञात शामिल हैं। इस प्रणाली को रैखिक बीजगणितीय समीकरणों को हल करने के लिए किसी भी विधि का उपयोग करके हल किया जा सकता है (उदाहरण के लिए, गाऊसी विधि)। समाधान के परिणामस्वरूप, अनुमानित फ़ंक्शन के अज्ञात पैरामीटर पाए जाएंगे जो मूल डेटा से अनुमानित फ़ंक्शन के वर्ग विचलन का न्यूनतम योग प्रदान करते हैं, अर्थात। सर्वोत्तम संभव द्विघात सन्निकटन. यह याद रखना चाहिए कि यदि स्रोत डेटा का एक भी मान बदलता है, तो सभी गुणांक अपने मान बदल देंगे, क्योंकि वे पूरी तरह से स्रोत डेटा द्वारा निर्धारित होते हैं।

रैखिक निर्भरता द्वारा स्रोत डेटा का अनुमान

(रेखीय प्रतिगमन)

एक उदाहरण के रूप में, आइए अनुमानित फ़ंक्शन को निर्धारित करने की तकनीक पर विचार करें, जो एक रैखिक निर्भरता के रूप में निर्दिष्ट है। न्यूनतम वर्ग विधि के अनुसार, वर्ग विचलनों के योग के न्यूनतम की शर्त निम्नलिखित रूप में लिखी जाती है:

तालिका नोड्स के निर्देशांक;

अनुमानित फ़ंक्शन के अज्ञात गुणांक, जो एक रैखिक निर्भरता के रूप में निर्दिष्ट हैं।

किसी फ़ंक्शन के न्यूनतम अस्तित्व के लिए एक आवश्यक शर्त अज्ञात चर के संबंध में इसके आंशिक डेरिवेटिव के शून्य की समानता है। परिणामस्वरूप, हमें समीकरणों की निम्नलिखित प्रणाली प्राप्त होती है:

आइए हम समीकरणों की परिणामी रैखिक प्रणाली को रूपांतरित करें।

हम रैखिक समीकरणों की परिणामी प्रणाली को हल करते हैं। विश्लेषणात्मक रूप में अनुमानित फ़ंक्शन के गुणांक निम्नानुसार निर्धारित किए जाते हैं (क्रैमर विधि):

ये गुणांक दिए गए सारणीबद्ध मानों (प्रायोगिक डेटा) से अनुमानित फ़ंक्शन के वर्गों के योग को न्यूनतम करने की कसौटी के अनुसार एक रैखिक अनुमानित फ़ंक्शन का निर्माण सुनिश्चित करते हैं।

न्यूनतम वर्ग विधि को लागू करने के लिए एल्गोरिदम

1. प्रारंभिक डेटा:

माप एन की संख्या के साथ प्रयोगात्मक डेटा की एक सरणी निर्दिष्ट की गई है

सन्निकटन बहुपद (एम) की डिग्री निर्दिष्ट है

2. गणना एल्गोरिथ्म:

2.1. आयामों के साथ समीकरणों की एक प्रणाली के निर्माण के लिए गुणांक निर्धारित किए जाते हैं

समीकरणों की प्रणाली के गुणांक (समीकरण के बाईं ओर)

- समीकरणों की प्रणाली के वर्ग मैट्रिक्स के स्तंभ संख्या का सूचकांक

रैखिक समीकरणों की प्रणाली के मुक्त पद (समीकरण का दाहिना भाग)

- समीकरणों की प्रणाली के वर्ग मैट्रिक्स की पंक्ति संख्या का सूचकांक

2.2. आयाम के साथ रैखिक समीकरणों की एक प्रणाली का गठन।

2.3. डिग्री एम के एक अनुमानित बहुपद के अज्ञात गुणांक निर्धारित करने के लिए रैखिक समीकरणों की एक प्रणाली को हल करना।

2.4. सभी नोडल बिंदुओं पर मूल मानों से अनुमानित बहुपद के वर्ग विचलन का योग निर्धारित करना

वर्ग विचलनों के योग का पाया गया मान न्यूनतम संभव है।

अन्य कार्यों का उपयोग करके अनुमान लगाना

यह ध्यान दिया जाना चाहिए कि मूल डेटा को कम से कम वर्ग विधि के अनुसार अनुमानित करते समय, लघुगणक फ़ंक्शन, घातीय फ़ंक्शन और पावर फ़ंक्शन को कभी-कभी अनुमानित फ़ंक्शन के रूप में उपयोग किया जाता है।

लघुगणकीय सन्निकटन

आइए उस मामले पर विचार करें जब अनुमानित फ़ंक्शन फॉर्म के लॉगरिदमिक फ़ंक्शन द्वारा दिया जाता है:

इसके कई अनुप्रयोग हैं, क्योंकि यह किसी दिए गए फ़ंक्शन को अन्य सरल कार्यों द्वारा अनुमानित रूप से प्रस्तुत करने की अनुमति देता है। एलएसएम अवलोकनों को संसाधित करने में बेहद उपयोगी हो सकता है, और इसका उपयोग यादृच्छिक त्रुटियों वाले अन्य मापों के परिणामों के आधार पर कुछ मात्राओं का अनुमान लगाने के लिए सक्रिय रूप से किया जाता है। इस लेख में, आप सीखेंगे कि एक्सेल में न्यूनतम वर्ग गणना कैसे लागू करें।

एक विशिष्ट उदाहरण का उपयोग करके समस्या का विवरण

मान लीजिए कि दो संकेतक हैं विशिष्ट समस्या.

तो, मान लीजिए कि X एक किराने की दुकान का खुदरा स्थान है, जिसे वर्ग मीटर में मापा जाता है, और Y वार्षिक कारोबार है, जिसे लाखों रूबल में मापा जाता है।

यदि स्टोर में यह या वह खुदरा स्थान है तो इसका पूर्वानुमान लगाना आवश्यक है कि स्टोर का टर्नओवर (Y) कितना होगा। जाहिर है, फ़ंक्शन Y = f (X) बढ़ रहा है, क्योंकि हाइपरमार्केट स्टॉल की तुलना में अधिक सामान बेचता है।

भविष्यवाणी के लिए उपयोग किए गए प्रारंभिक डेटा की शुद्धता के बारे में कुछ शब्द

मान लीजिए कि हमारे पास n स्टोर्स के लिए डेटा का उपयोग करके बनाई गई एक तालिका है।

गणितीय आंकड़ों के अनुसार, यदि कम से कम 5-6 वस्तुओं के डेटा की जांच की जाए तो परिणाम कमोबेश सही होंगे। इसके अलावा, "विसंगतिपूर्ण" परिणामों का उपयोग नहीं किया जा सकता है। विशेष रूप से, एक विशिष्ट छोटे बुटीक का टर्नओवर "मासमार्केट" वर्ग के बड़े खुदरा दुकानों के टर्नओवर से कई गुना अधिक हो सकता है।

विधि का सार

तालिका डेटा को कार्टेशियन विमान पर बिंदु M 1 (x 1, y 1), ... M n (x n, y n) के रूप में दर्शाया जा सकता है। अब समस्या का समाधान एक अनुमानित फ़ंक्शन y = f (x) के चयन तक कम हो जाएगा, जिसमें ग्राफ़ बिंदु M 1, M 2, .. M n के जितना संभव हो उतना करीब से गुजर रहा है।

बेशक, आप एक उच्च-डिग्री बहुपद का उपयोग कर सकते हैं, लेकिन यह विकल्प न केवल लागू करना मुश्किल है, बल्कि गलत भी है, क्योंकि यह उस मुख्य प्रवृत्ति को प्रतिबिंबित नहीं करेगा जिसे पता लगाने की आवश्यकता है। सबसे उचित समाधान सीधी रेखा y = ax + b की खोज करना है, जो प्रयोगात्मक डेटा, या अधिक सटीक रूप से, गुणांक a और b का सबसे अच्छा अनुमान लगाता है।

सटीकता मूल्यांकन

किसी भी अनुमान के साथ, उसकी सटीकता का आकलन करना विशेष महत्व रखता है। आइए हम बिंदु x i के लिए कार्यात्मक और प्रायोगिक मानों के बीच अंतर (विचलन) को e i से निरूपित करें, अर्थात e i = y i - f (x i)।

जाहिर है, अनुमान की सटीकता का आकलन करने के लिए, आप विचलन के योग का उपयोग कर सकते हैं, यानी, वाई पर एक्स की निर्भरता के अनुमानित प्रतिनिधित्व के लिए एक सीधी रेखा चुनते समय, आपको सबसे छोटे मूल्य वाले को प्राथमिकता देने की आवश्यकता है विचाराधीन सभी बिंदुओं पर योग ई। हालाँकि, सब कुछ इतना सरल नहीं है, क्योंकि सकारात्मक विचलन के साथ-साथ नकारात्मक विचलन भी होंगे।

विचलन मॉड्यूल या उनके वर्गों का उपयोग करके समस्या को हल किया जा सकता है। अंतिम विधि सबसे व्यापक रूप से उपयोग की जाती है। इसका उपयोग कई क्षेत्रों में किया जाता है, जिसमें प्रतिगमन विश्लेषण (दो अंतर्निहित कार्यों का उपयोग करके एक्सेल में कार्यान्वित) शामिल है, और लंबे समय से इसकी प्रभावशीलता साबित हुई है।

न्यूनतम वर्ग विधि

एक्सेल, जैसा कि आप जानते हैं, में एक अंतर्निहित ऑटोसम फ़ंक्शन है जो आपको चयनित सीमा में स्थित सभी मानों के मानों की गणना करने की अनुमति देता है। इस प्रकार, कोई भी चीज़ हमें अभिव्यक्ति के मूल्य की गणना करने से नहीं रोकेगी (ई 1 2 + ई 2 2 + ई 3 2 + ... ई एन 2)।

गणितीय संकेतन में यह इस प्रकार दिखता है:

चूँकि निर्णय शुरू में एक सीधी रेखा का उपयोग करके अनुमानित किया गया था, हमारे पास है:

इस प्रकार, उस सीधी रेखा को खोजने का कार्य जो मात्राओं

ऐसा करने के लिए, आपको नए चर ए और बी के संबंध में आंशिक व्युत्पन्न को शून्य के बराबर करना होगा, और फॉर्म के 2 अज्ञात के साथ दो समीकरणों से युक्त एक आदिम प्रणाली को हल करना होगा:

कुछ सरल परिवर्तनों के बाद, जिसमें 2 से भाग देना और योगों में हेरफेर करना शामिल है, हमें मिलता है:

इसे हल करते हुए, उदाहरण के लिए, क्रैमर विधि का उपयोग करके, हम कुछ गुणांक a * और b * के साथ एक स्थिर बिंदु प्राप्त करते हैं। यह न्यूनतम है, यानी यह अनुमान लगाने के लिए कि एक निश्चित क्षेत्र के लिए किसी स्टोर का टर्नओवर कितना होगा, सीधी रेखा y = a * x + b * उपयुक्त है, जो प्रश्न में उदाहरण के लिए एक प्रतिगमन मॉडल है। बेशक, यह आपको सटीक परिणाम खोजने की अनुमति नहीं देगा, लेकिन यह आपको यह अंदाजा लगाने में मदद करेगा कि स्टोर क्रेडिट पर एक विशिष्ट क्षेत्र खरीदने से लाभ मिलेगा या नहीं।

एक्सेल में न्यूनतम वर्ग कैसे लागू करें

एक्सेल में न्यूनतम वर्गों का उपयोग करके मानों की गणना करने का एक फ़ंक्शन है। इसका निम्नलिखित रूप है: "TREND" (ज्ञात Y मान; ज्ञात X मान; नए X मान; स्थिरांक)। आइए एक्सेल में ओएलएस की गणना के लिए सूत्र को अपनी तालिका में लागू करें।

ऐसा करने के लिए, उस सेल में "=" चिह्न दर्ज करें जिसमें Excel में न्यूनतम वर्ग विधि का उपयोग करके गणना का परिणाम प्रदर्शित होना चाहिए और "TREND" फ़ंक्शन का चयन करें। खुलने वाली विंडो में, हाइलाइट करते हुए उपयुक्त फ़ील्ड भरें:

  • Y के लिए ज्ञात मानों की सीमा (इस मामले में, व्यापार टर्नओवर के लिए डेटा);
  • रेंज x 1 , …x n , यानी खुदरा स्थान का आकार;
  • x के ज्ञात और अज्ञात दोनों मान, जिसके लिए आपको टर्नओवर का आकार पता लगाना होगा (वर्कशीट पर उनके स्थान के बारे में जानकारी के लिए, नीचे देखें)।

इसके अलावा, सूत्र में तार्किक चर "कॉन्स्ट" शामिल है। यदि आप संबंधित फ़ील्ड में 1 दर्ज करते हैं, तो इसका मतलब यह होगा कि आपको बी = 0 मानते हुए गणना करनी चाहिए।

यदि आपको एक से अधिक x मान के लिए पूर्वानुमान जानने की आवश्यकता है, तो सूत्र दर्ज करने के बाद आपको "एंटर" नहीं दबाना चाहिए, बल्कि आपको कीबोर्ड पर संयोजन "Shift" + "कंट्रोल" + "एंटर" टाइप करना होगा।

कुछ सुविधाएं

प्रतिगमन विश्लेषण नौसिखियों के लिए भी सुलभ हो सकता है। अज्ञात चरों की एक श्रृंखला के मूल्य की भविष्यवाणी करने के लिए एक्सेल फॉर्मूला-ट्रेंड-का उपयोग उन लोगों द्वारा भी किया जा सकता है जिन्होंने कभी भी कम से कम वर्गों के बारे में नहीं सुना है। इसके काम की कुछ विशेषताओं को जानना ही काफी है। विशेष रूप से:

  • यदि आप वेरिएबल y के ज्ञात मानों की श्रेणी को एक पंक्ति या कॉलम में व्यवस्थित करते हैं, तो x के ज्ञात मानों वाली प्रत्येक पंक्ति (कॉलम) को प्रोग्राम द्वारा एक अलग वैरिएबल के रूप में माना जाएगा।
  • यदि ज्ञात x के साथ एक श्रेणी TREND विंडो में निर्दिष्ट नहीं है, तो Excel में किसी फ़ंक्शन का उपयोग करते समय, प्रोग्राम इसे पूर्णांकों से युक्त एक सरणी के रूप में मानेगा, जिसकी संख्या दिए गए मानों के साथ सीमा से मेल खाती है y परिवर्तनशील.
  • "अनुमानित" मानों की एक श्रृंखला को आउटपुट करने के लिए, प्रवृत्ति की गणना के लिए अभिव्यक्ति को एक सरणी सूत्र के रूप में दर्ज किया जाना चाहिए।
  • यदि नए x मान निर्दिष्ट नहीं हैं, तो TREND फ़ंक्शन उन्हें ज्ञात मानों के बराबर मानता है। यदि वे निर्दिष्ट नहीं हैं, तो सरणी 1 को एक तर्क के रूप में लिया जाता है; 2; 3; 4;…, जो पहले से निर्दिष्ट मापदंडों y के साथ सीमा के अनुरूप है।
  • नए x मानों वाली श्रेणी में दिए गए y मानों वाली श्रेणी के समान या अधिक पंक्तियाँ या स्तंभ होने चाहिए। दूसरे शब्दों में, यह स्वतंत्र चर के समानुपाती होना चाहिए।
  • ज्ञात x मानों वाली एक सरणी में एकाधिक चर हो सकते हैं। हालाँकि, यदि हम केवल एक के बारे में बात कर रहे हैं, तो यह आवश्यक है कि x और y के दिए गए मानों वाली श्रेणियाँ आनुपातिक हों। कई चर के मामले में, यह आवश्यक है कि दिए गए y मान वाली सीमा एक कॉलम या एक पंक्ति में फिट हो।

भविष्यवाणी समारोह

कई फ़ंक्शंस का उपयोग करके कार्यान्वित किया गया। उनमें से एक को "भविष्यवाणी" कहा जाता है। यह "TREND" के समान है, अर्थात यह न्यूनतम वर्ग विधि का उपयोग करके गणना का परिणाम देता है। हालाँकि, केवल एक X के लिए, जिसके लिए Y का मान अज्ञात है।

अब आप डमी के लिए एक्सेल में सूत्र जानते हैं जो आपको एक रैखिक प्रवृत्ति के अनुसार किसी विशेष संकेतक के भविष्य के मूल्य की भविष्यवाणी करने की अनुमति देते हैं।

प्रतिगमन फ़ंक्शन के प्रकार को चुनने के बाद, अर्थात। एक्स पर वाई (या वाई पर एक्स) की निर्भरता के विचारित मॉडल का प्रकार, उदाहरण के लिए, एक रैखिक मॉडल वाई एक्स =ए+बीएक्स, मॉडल गुणांक के विशिष्ट मूल्यों को निर्धारित करना आवश्यक है।

ए और बी के विभिन्न मूल्यों के लिए, फॉर्म y x = a + bx की अनंत संख्या में निर्भरता का निर्माण करना संभव है, यानी समन्वय विमान पर अनंत संख्या में सीधी रेखाएं हैं, लेकिन हमें एक ऐसी निर्भरता की आवश्यकता है जो सर्वोत्तम हो देखे गए मूल्यों से मेल खाता है। इस प्रकार, कार्य सर्वोत्तम गुणांकों का चयन करने का हो जाता है।

हम केवल उपलब्ध अवलोकनों की एक निश्चित संख्या के आधार पर रैखिक फलन a+bx की तलाश करते हैं। प्रेक्षित मानों के लिए सबसे उपयुक्त फ़ंक्शन को खोजने के लिए, हम न्यूनतम वर्ग विधि का उपयोग करते हैं।

आइए निरूपित करें: Y i - समीकरण Y i =a+bx i द्वारा परिकलित मान। y i - मापा गया मान, ε i =y i -Y i - समीकरण का उपयोग करके मापा और परिकलित मानों के बीच अंतर, ε i =y i -a-bx i .

न्यूनतम वर्ग विधि के लिए आवश्यक है कि ε i, मापे गए y i और समीकरण से परिकलित मान Y i के बीच का अंतर न्यूनतम हो। इसलिए, हम गुणांक ए और बी पाते हैं ताकि सीधी प्रतिगमन रेखा पर मूल्यों से देखे गए मूल्यों के वर्ग विचलन का योग सबसे छोटा हो:

डेरिवेटिव का उपयोग करके तर्क ए और चरम के लिए इस फ़ंक्शन की जांच करके, हम यह साबित कर सकते हैं कि यदि गुणांक ए और बी सिस्टम के समाधान हैं तो फ़ंक्शन न्यूनतम मान लेता है:

(2)

यदि हम सामान्य समीकरण के दोनों पक्षों को n से विभाजित करते हैं, तो हमें मिलता है:

ध्यान में रख कर (3)

हम पाते हैं , यहां से, पहले समीकरण में a का मान प्रतिस्थापित करने पर, हमें मिलता है:

इस मामले में, b को प्रतिगमन गुणांक कहा जाता है; a को प्रतिगमन समीकरण का मुक्त पद कहा जाता है और इसकी गणना सूत्र का उपयोग करके की जाती है:

परिणामी सीधी रेखा सैद्धांतिक प्रतिगमन रेखा के लिए एक अनुमान है। हमारे पास है:

इसलिए, एक रेखीय प्रतिगमन समीकरण है.

प्रतिगमन प्रत्यक्ष (बी>0) और उल्टा (बी उदाहरण 1) हो सकता है। एक्स और वाई के मूल्यों को मापने के परिणाम तालिका में दिए गए हैं:

एक्स मैं -2 0 1 2 4
यी 0.5 1 1.5 2 3

यह मानते हुए कि X और Y y=a+bx के बीच एक रैखिक संबंध है, न्यूनतम वर्ग विधि का उपयोग करके गुणांक a और b निर्धारित करें।

समाधान। यहाँ n=5
x i =-2+0+1+2+4=5;
x i 2 =4+0+1+4+16=25
x i y i =-2 0.5+0 1+1 1.5+2 2+4 3=16.5
y i =0.5+1+1.5+2+3=8

और सामान्य प्रणाली (2) का रूप है

इस प्रणाली को हल करने पर, हमें मिलता है: b=0.425, a=1.175। इसलिए y=1.175+0.425x.

उदाहरण 2. आर्थिक संकेतकों (एक्स) और (वाई) के 10 अवलोकनों का एक नमूना है।

एक्स मैं 180 172 173 169 175 170 179 170 167 174
यी 186 180 176 171 182 166 182 172 169 177

आपको X पर Y का एक नमूना प्रतिगमन समीकरण ढूंढने की आवश्यकता है। X पर Y की एक नमूना प्रतिगमन रेखा बनाएं।

समाधान। 1. आइए डेटा को x i और y i मानों के अनुसार क्रमबद्ध करें। हमें एक नई तालिका मिलती है:

एक्स मैं 167 169 170 170 172 173 174 175 179 180
यी 169 171 166 172 180 176 177 182 182 186

गणनाओं को सरल बनाने के लिए, हम एक गणना तालिका तैयार करेंगे जिसमें हम आवश्यक संख्यात्मक मान दर्ज करेंगे।

एक्स मैं यी एक्स मैं 2 एक्स मैं वाई मैं
167 169 27889 28223
169 171 28561 28899
170 166 28900 28220
170 172 28900 29240
172 180 29584 30960
173 176 29929 30448
174 177 30276 30798
175 182 30625 31850
179 182 32041 32578
180 186 32400 33480
∑x मैं =1729 ∑y मैं =1761 ∑x i 2 299105 ∑x i y i =304696
x=172.9 y=176.1 एक्स मैं 2 =29910.5 xy=30469.6

सूत्र (4) के अनुसार, हम प्रतिगमन गुणांक की गणना करते हैं

और सूत्र के अनुसार (5)

इस प्रकार, नमूना प्रतिगमन समीकरण y=-59.34+1.3804x है।
आइए निर्देशांक तल पर बिंदु (x i ; y i) आलेखित करें और प्रतिगमन रेखा को चिह्नित करें।


चित्र 4

चित्र 4 दिखाता है कि प्रेक्षित मान प्रतिगमन रेखा के सापेक्ष कैसे स्थित हैं। Y i से y i के विचलन का संख्यात्मक रूप से आकलन करने के लिए, जहां y i मनाया जाता है और Y i प्रतिगमन द्वारा निर्धारित मान हैं, हम एक तालिका बनाते हैं:

एक्स मैं यी यी वाई आई -वाई आई
167 169 168.055 -0.945
169 171 170.778 -0.222
170 166 172.140 6.140
170 172 172.140 0.140
172 180 174.863 -5.137
173 176 176.225 0.225
174 177 177.587 0.587
175 182 178.949 -3.051
179 182 184.395 2.395
180 186 185.757 -0.243

यी मान की गणना प्रतिगमन समीकरण के अनुसार की जाती है।

प्रतिगमन रेखा से कुछ प्रेक्षित मानों के ध्यान देने योग्य विचलन को प्रेक्षणों की छोटी संख्या द्वारा समझाया गया है। X पर Y की रैखिक निर्भरता की डिग्री का अध्ययन करते समय, टिप्पणियों की संख्या को ध्यान में रखा जाता है। निर्भरता की ताकत सहसंबंध गुणांक के मूल्य से निर्धारित होती है।

उदाहरण।

चर के मूल्यों पर प्रायोगिक डेटा एक्सऔर परतालिका में दिए गए हैं।

इनके संरेखण के फलस्वरूप फलन प्राप्त होता है

का उपयोग करते हुए न्यूनतम वर्ग विधि, इन आंकड़ों को एक रैखिक निर्भरता द्वारा अनुमानित करें y=ax+b(पैरामीटर खोजें और बी). पता लगाएं कि दोनों में से कौन सी रेखा बेहतर है (न्यूनतम वर्ग विधि के अर्थ में) प्रयोगात्मक डेटा को संरेखित करती है। एक चित्र बनाओ.

न्यूनतम वर्ग विधि (एलएसएम) का सार।

कार्य रैखिक निर्भरता गुणांक को ढूंढना है जिस पर दो चर का कार्य होता है और बी सबसे छोटा मान लेता है. अर्थात् दिया हुआ और बीपाई गई सीधी रेखा से प्रयोगात्मक डेटा के वर्ग विचलन का योग सबसे छोटा होगा। यह न्यूनतम वर्ग विधि का संपूर्ण बिंदु है।

इस प्रकार, उदाहरण को हल करने से दो चर वाले फ़ंक्शन का चरम ज्ञात हो जाता है।

गुणांक ज्ञात करने के लिए सूत्र व्युत्पन्न करना।

दो अज्ञात वाले दो समीकरणों की एक प्रणाली संकलित और हल की जाती है। चरों के संबंध में किसी फ़ंक्शन के आंशिक व्युत्पन्न ढूँढना और बी, हम इन व्युत्पन्नों को शून्य के बराबर करते हैं।

हम समीकरणों की परिणामी प्रणाली को किसी भी विधि (उदाहरण के लिए) का उपयोग करके हल करते हैं प्रतिस्थापन विधि द्वाराया ) और न्यूनतम वर्ग विधि (एलएसएम) का उपयोग करके गुणांक खोजने के लिए सूत्र प्राप्त करें।

दिया गया और बीसमारोह सबसे छोटा मान लेता है. इस बात का प्रमाण दिया गया है.

यह न्यूनतम वर्गों की पूरी विधि है। पैरामीटर खोजने का सूत्र इसमें योग , , , और पैरामीटर शामिल हैं एन- प्रयोगात्मक डेटा की मात्रा. हम इन राशियों के मूल्यों की अलग से गणना करने की अनुशंसा करते हैं। गुणक बीगणना के बाद पाया गया .

मूल उदाहरण को याद करने का समय आ गया है।

समाधान।

हमारे उदाहरण में एन=5. आवश्यक गुणांकों के सूत्रों में शामिल राशियों की गणना की सुविधा के लिए हम तालिका भरते हैं।

तालिका की चौथी पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों को तीसरी पंक्ति के मानों से गुणा करके प्राप्त किए जाते हैं मैं.

तालिका की पाँचवीं पंक्ति के मान प्रत्येक संख्या के लिए दूसरी पंक्ति के मानों का वर्ग करके प्राप्त किए जाते हैं मैं.

तालिका के अंतिम कॉलम के मान पंक्तियों के मानों का योग हैं।

गुणांक ज्ञात करने के लिए हम न्यूनतम वर्ग विधि के सूत्रों का उपयोग करते हैं और बी. हम तालिका के अंतिम कॉलम से संबंधित मानों को उनमें प्रतिस्थापित करते हैं:

इस तरह, y = 0.165x+2.184- वांछित सन्निकटन सीधी रेखा।

यह पता लगाना बाकी है कि कौन सी पंक्तियाँ हैं y = 0.165x+2.184या मूल डेटा का बेहतर अनुमान लगाना, यानी न्यूनतम वर्ग विधि का उपयोग करके अनुमान लगाना।

न्यूनतम वर्ग विधि का त्रुटि अनुमान.

ऐसा करने के लिए, आपको इन पंक्तियों से मूल डेटा के वर्ग विचलन के योग की गणना करने की आवश्यकता है और , एक छोटा मान उस रेखा से मेल खाता है जो न्यूनतम वर्ग विधि के अर्थ में मूल डेटा का बेहतर अनुमान लगाता है।

चूँकि , तो सीधा y = 0.165x+2.184मूल डेटा का बेहतर अनुमान लगाएं।

न्यूनतम वर्ग (एलएस) विधि का ग्राफिक चित्रण।

ग्राफ़ पर सब कुछ स्पष्ट रूप से दिखाई देता है। लाल रेखा पाई गई सीधी रेखा है y = 0.165x+2.184, नीली रेखा है , गुलाबी बिंदु मूल डेटा हैं।

इसकी आवश्यकता क्यों है, ये सभी अनुमान क्यों हैं?

मैं व्यक्तिगत रूप से इसका उपयोग डेटा स्मूथिंग, इंटरपोलेशन और एक्सट्रपलेशन समस्याओं की समस्याओं को हल करने के लिए करता हूं (मूल उदाहरण में उन्हें देखे गए मूल्य का मूल्य खोजने के लिए कहा गया होगा) पर एक्स=3या जब एक्स=6न्यूनतम वर्ग विधि का उपयोग करके)। लेकिन हम इसके बारे में बाद में साइट के दूसरे अनुभाग में अधिक बात करेंगे।

सबूत।

ताकि जब मिले और बीफ़ंक्शन सबसे छोटा मान लेता है, यह आवश्यक है कि इस बिंदु पर फ़ंक्शन के लिए दूसरे क्रम के अंतर के द्विघात रूप का मैट्रिक्स सकारात्मक निश्चित था. चलिए दिखाते हैं.