परीक्षण डिजाइन के सिद्धांत की गणितीय नींव। परीक्षण की सैद्धांतिक नींव

परीक्षण सिद्धांत की बुनियादी अवधारणाएँ।

किसी एथलीट की स्थिति या क्षमता निर्धारित करने के लिए लिया गया माप या परीक्षण परीक्षण कहलाता है। किसी भी परीक्षण में माप शामिल होता है। लेकिन हर परिवर्तन एक परीक्षण के रूप में कार्य नहीं करता है। माप या परीक्षण प्रक्रिया को परीक्षण कहा जाता है।

मोटर कार्यों पर आधारित परीक्षण को मोटर कहा जाता है। मोटर परीक्षणों के तीन समूह हैं:

  • 1. नियंत्रण अभ्यास, जिसमें एथलीट को अधिकतम परिणाम दिखाने का काम सौंपा जाता है।
  • 2. मानक कार्यात्मक परीक्षण, जिसके दौरान कार्य, सभी के लिए समान, या तो किए गए कार्य की मात्रा के अनुसार, या शारीरिक परिवर्तनों के परिमाण के अनुसार निर्धारित किया जाता है।
  • 3. अधिकतम कार्यात्मक परीक्षण, जिसके दौरान एथलीट को अधिकतम परिणाम दिखाना होगा।

उच्च गुणवत्ता परीक्षण के लिए माप सिद्धांत के ज्ञान की आवश्यकता होती है।

माप सिद्धांत की बुनियादी अवधारणाएँ।

मापन एक ओर अध्ययन की जा रही घटना और दूसरी ओर संख्याओं के बीच पत्राचार की पहचान है।

माप सिद्धांत के मूल सिद्धांत तीन अवधारणाएँ हैं: माप पैमाने, माप की इकाइयाँ और माप सटीकता।

माप तराजू.

माप पैमाना एक कानून है जिसके द्वारा मापे गए परिणाम के बढ़ने या घटने पर एक संख्यात्मक मान निर्दिष्ट किया जाता है। आइए खेलों में उपयोग किए जाने वाले कुछ पैमानों पर नजर डालें।

नाम पैमाना (नाममात्र पैमाना)।

यह सभी पैमानों में सबसे सरल है. इसमें, संख्याएं लेबल के रूप में कार्य करती हैं और अध्ययन के तहत वस्तुओं का पता लगाने और अलग करने का काम करती हैं (उदाहरण के लिए, फुटबॉल टीम में खिलाड़ियों की संख्या)। नामकरण पैमाने को बनाने वाली संख्याओं को मेटा द्वारा बदलने की अनुमति है। इस पैमाने में "जैसे कोई रिश्ते नहीं हैं" अधिक कम”, इसलिए कुछ का मानना ​​है कि नामकरण पैमाने के उपयोग को माप नहीं माना जाना चाहिए। पैमाने, नामों का उपयोग करते समय, केवल कुछ गणितीय कार्य ही किए जा सकते हैं। उदाहरण के लिए, इसकी संख्याओं को जोड़ा या घटाया नहीं जा सकता है, लेकिन आप यह गिन सकते हैं कि कोई विशेष संख्या कितनी बार (कितनी बार) आती है।

ऑर्डर स्केल.

ऐसे खेल हैं जहां एथलीट का परिणाम केवल प्रतियोगिता में प्राप्त स्थान से निर्धारित होता है (उदाहरण के लिए, मार्शल आर्ट)। ऐसी प्रतियोगिताओं के बाद यह स्पष्ट हो जाता है कि कौन सा एथलीट मजबूत है और कौन सा कमजोर है। लेकिन यह कितना मजबूत या कमजोर, यह कहना असंभव है। यदि तीन एथलीटों ने क्रमशः पहला, दूसरा और तीसरा स्थान प्राप्त किया, तो उनकी खेल भावना में क्या अंतर है यह स्पष्ट नहीं है: दूसरा एथलीट लगभग पहले के बराबर हो सकता है, या उससे कमजोर हो सकता है और लगभग तीसरे के समान हो सकता है। क्रम पैमाने में व्याप्त स्थानों को रैंक कहा जाता है, और पैमाने को ही रैंक या गैर-मीट्रिक कहा जाता है। ऐसे पैमाने में, इसके घटक संख्याओं को रैंक (यानी, कब्जे वाले स्थानों) के अनुसार क्रमबद्ध किया जाता है, लेकिन उनके बीच के अंतराल को सटीक रूप से मापा नहीं जा सकता है। नामकरण पैमाने के विपरीत, ऑर्डर स्केल न केवल मापी गई वस्तुओं की समानता या असमानता के तथ्य को स्थापित करने की अनुमति देता है, बल्कि निर्णय के रूप में असमानता की प्रकृति को भी निर्धारित करने की अनुमति देता है: "अधिक है कम है," "बेहतर है बदतर है," आदि .

ऑर्डर स्केल का उपयोग करके, आप गुणात्मक संकेतकों को माप सकते हैं जिनके पास सख्त मात्रात्मक माप नहीं है। इन पैमानों का उपयोग विशेष रूप से मानविकी में व्यापक रूप से किया जाता है: शिक्षाशास्त्र, मनोविज्ञान, समाजशास्त्र।

ऑर्डर स्केल को रैंकों पर लागू किया जा सकता है बड़ी संख्यानामकरण पैमाने की संख्याओं की तुलना में गणितीय संक्रियाएँ।

अंतराल पैमाना.

यह एक ऐसा पैमाना है जिसमें संख्याओं को न केवल रैंक के आधार पर क्रमबद्ध किया जाता है, बल्कि कुछ निश्चित अंतरालों से अलग भी किया जाता है। जो विशेषता इसे नीचे वर्णित अनुपात पैमाने से अलग करती है वह यह है कि शून्य बिंदु को मनमाने ढंग से चुना जाता है। उदाहरण हो सकते हैं कैलेंडर समय (विभिन्न कैलेंडरों में कालक्रम की शुरुआत यादृच्छिक कारणों से निर्धारित की गई थी), संयुक्त कोण (प्रकोष्ठ के पूर्ण विस्तार के साथ कोहनी के जोड़ पर कोण शून्य या 180° के बराबर लिया जा सकता है), तापमान, संभावित ऊर्जाउठाया हुआ भार, क्षमता विद्युत क्षेत्रवगैरह।

अनुपातों की गणना को छोड़कर, अंतराल पैमाने पर माप के परिणामों को सभी गणितीय तरीकों से संसाधित किया जा सकता है। ये अंतराल पैमाने प्रश्न का उत्तर प्रदान करते हैं: "कितना अधिक", लेकिन हमें यह बताने की अनुमति नहीं देते हैं कि मापी गई मात्रा का एक मान दूसरे से कई गुना अधिक या कम है। उदाहरण के लिए, यदि तापमान 10 से 20 C तक बढ़ गया, तो यह नहीं कहा जा सकता कि यह दोगुना गर्म हो गया है।

रिश्ते का पैमाना.

यह पैमाना अंतराल स्केल से केवल इस मायने में भिन्न है कि यह शून्य बिंदु की स्थिति को सख्ती से परिभाषित करता है। इसके लिए धन्यवाद, अनुपात पैमाना अवलोकन परिणामों को संसाधित करने के लिए उपयोग किए जाने वाले गणितीय उपकरण पर कोई प्रतिबंध नहीं लगाता है।

खेल में, अनुपात पैमाने दूरी, ताकत, गति और दर्जनों अन्य चर को मापते हैं। अनुपात पैमाना उन मात्राओं को भी मापता है जो अंतराल पैमाने पर मापी गई संख्याओं के बीच अंतर के रूप में बनती हैं। इस प्रकार, कैलेंडर समय की गणना अंतराल के पैमाने पर की जाती है, और समय अंतराल की गणना अनुपात के पैमाने पर की जाती है। अनुपात पैमाने का उपयोग करते समय (और केवल इस मामले में!), किसी भी मात्रा का माप एक इकाई के रूप में ली गई किसी अन्य समान मात्रा के अनुपात के प्रयोगात्मक निर्धारण तक कम हो जाता है। छलांग की लंबाई मापकर हम यह पता लगाते हैं कि यह लंबाई कितनी गुना है अबलंबाई की एक इकाई के रूप में लिया गया कोई अन्य निकाय (किसी विशेष मामले में एक मीटर शासक); एक बारबेल का वजन करके, हम उसके द्रव्यमान का दूसरे शरीर के द्रव्यमान से अनुपात निर्धारित करते हैं - एक "किलोग्राम" वजन, आदि। यदि हम स्वयं को केवल अनुपात पैमानों के उपयोग तक ही सीमित रखते हैं, तो हम माप की एक और (संकीर्ण, अधिक विशिष्ट) परिभाषा दे सकते हैं: किसी मात्रा को मापने का अर्थ प्रयोगात्मक रूप से माप की संबंधित इकाई के साथ उसका संबंध खोजना है।

माप की इकाइयां।

परिणामों के लिए विभिन्न आयामएक दूसरे के साथ तुलना की जा सकती है, उन्हें समान इकाइयों में व्यक्त किया जाना चाहिए। 1960 में, वज़न और माप पर अंतर्राष्ट्रीय आम सम्मेलन को अपनाया गया अंतर्राष्ट्रीय व्यवस्थाइकाइयां, जिसे एसआई के रूप में संक्षिप्त किया गया है (सिस्टम इंटरनेशनल शब्द के शुरुआती अक्षरों से)। वर्तमान में, विज्ञान और प्रौद्योगिकी के सभी क्षेत्रों में इस प्रणाली का पसंदीदा अनुप्रयोग स्थापित किया गया है राष्ट्रीय अर्थव्यवस्था, साथ ही पढ़ाते समय भी।

एसआई में वर्तमान में एक दूसरे से स्वतंत्र सात बुनियादी इकाइयाँ शामिल हैं (तालिका 2.1 देखें।)

तालिका 1.1.

संकेतित मूल इकाइयों से, अन्य भौतिक मात्राओं की इकाइयाँ व्युत्पन्न के रूप में प्राप्त की जाती हैं। व्युत्पन्न इकाइयाँ एक दूसरे से संबंधित सूत्रों के आधार पर निर्धारित की जाती हैं भौतिक मात्राएँ. उदाहरण के लिए, लंबाई की इकाई (मीटर) और समय की इकाई (सेकंड) बुनियादी इकाइयाँ हैं, और गति की इकाई (मीटर प्रति सेकंड) एक व्युत्पन्न है।

बुनियादी इकाइयों के अलावा, एसआई दो अतिरिक्त इकाइयों को अलग करता है: रेडियन, समतल कोण की एक इकाई, और स्टेरेडियन, ठोस कोण (अंतरिक्ष में कोण) की एक इकाई।

माप सटीकता.

कोई भी माप पूर्णतः सटीकता से नहीं किया जा सकता। माप परिणाम में अनिवार्य रूप से एक त्रुटि होती है, जिसका परिमाण जितना छोटा होगा, माप पद्धति उतनी ही अधिक सटीक होगी मीटर. उदाहरण के लिए, मिलीमीटर डिवीजनों के साथ एक नियमित शासक का उपयोग करके, 0.01 मिमी की सटीकता के साथ लंबाई मापना असंभव है।

बुनियादी और अतिरिक्त त्रुटि.

मूल त्रुटि माप पद्धति या मापने वाले उपकरण की त्रुटि है, जो घटित होती है सामान्य स्थितियाँउनके अनुप्रयोग.

अतिरिक्त त्रुटि एक मापने वाले उपकरण की त्रुटि है जो सामान्य से इसकी परिचालन स्थितियों के विचलन के कारण होती है। यह स्पष्ट है कि जिन उपकरणों को संचालित करने के लिए डिज़ाइन किया गया है कमरे का तापमाननहीं देंगे सटीक रीडिंग, यदि आप इसका उपयोग गर्मियों में चिलचिलाती धूप में स्टेडियम में या सर्दियों में ठंड में करते हैं। वोल्टेज बढ़ने पर माप त्रुटियाँ हो सकती हैं विद्युत नेटवर्कया बैटरी बिजली की आपूर्ति सामान्य से कम है या मूल्य में असंगत है।

निरपेक्ष एवं सापेक्ष त्रुटियाँ।

मान E = A-Ao, मापने वाले उपकरण (A) की रीडिंग और मापी गई मात्रा (Ao) के वास्तविक मान के बीच के अंतर के बराबर, पूर्ण माप त्रुटि कहलाती है। इसे मापी गई मात्रा के समान इकाइयों में ही मापा जाता है।

व्यवहार में, निरपेक्ष नहीं, बल्कि का उपयोग करना अक्सर सुविधाजनक होता है सापेक्ष त्रुटि. सापेक्ष माप त्रुटि दो प्रकार की होती है - वास्तविक और घटी हुई। वास्तविक सापेक्ष त्रुटि अनुपात है पूर्ण त्रुटिमापी गई मात्रा का सही मान:

ए डी =------* 100%

दी गई सापेक्ष त्रुटि पूर्ण त्रुटि और अधिकतम का अनुपात है संभव अर्थमापी गई मात्रा:

ऊपर =-------* 100%

व्यवस्थित और यादृच्छिक त्रुटियाँ.

व्यवस्थित एक त्रुटि है जिसका मूल्य माप से माप तक नहीं बदलता है। इस विशेषता के कारण, व्यवस्थित त्रुटि का अक्सर पहले से अनुमान लगाया जा सकता है या चरम मामलों में, माप प्रक्रिया के अंत में पता लगाया और समाप्त किया जा सकता है।

व्यवस्थित त्रुटि को दूर करने की विधि मुख्यतः उसकी प्रकृति पर निर्भर करती है। व्यवस्थित माप त्रुटियों को तीन समूहों में विभाजित किया जा सकता है:

ज्ञात उत्पत्ति और ज्ञात परिमाण की त्रुटियाँ;

ज्ञात मूल लेकिन अज्ञात परिमाण की त्रुटियाँ;

अज्ञात मूल और अज्ञात परिमाण की त्रुटियाँ। सबसे हानिरहित पहले समूह की त्रुटियाँ हैं। इन्हें आसानी से हटा दिया जाता है

माप परिणाम में उचित सुधार करके।

दूसरे समूह में, सबसे पहले, माप पद्धति और माप उपकरण की अपूर्णता से जुड़ी त्रुटियाँ शामिल हैं। उदाहरण के लिए, साँस छोड़ने वाली हवा को इकट्ठा करने के लिए मास्क का उपयोग करके शारीरिक प्रदर्शन को मापने में त्रुटि: मास्क सांस लेने में कठिनाई करता है, और एथलीट स्वाभाविक रूप से शारीरिक प्रदर्शन प्रदर्शित करता है जिसे मास्क के बिना मापा गया वास्तविक प्रदर्शन की तुलना में कम आंका जाता है। इस त्रुटि की भयावहता का पहले से अनुमान नहीं लगाया जा सकता है: यह अध्ययन के समय एथलीट की व्यक्तिगत क्षमताओं और उसके स्वास्थ्य की स्थिति पर निर्भर करता है।

इस समूह में व्यवस्थित त्रुटि का एक और उदाहरण अपूर्ण उपकरण से जुड़ी त्रुटि है, जब मापने वाला उपकरण जानबूझकर मापा मूल्य के वास्तविक मूल्य को अधिक या कम आंकता है, लेकिन त्रुटि की भयावहता अज्ञात है।

तीसरे समूह की त्रुटियां सबसे खतरनाक हैं; उनकी घटना माप पद्धति की अपूर्णता और माप की वस्तु - एथलीट की विशेषताओं दोनों से जुड़ी है।

विभिन्न कारकों के प्रभाव में यादृच्छिक त्रुटियाँ उत्पन्न होती हैं जिनका पहले से अनुमान नहीं लगाया जा सकता है या सटीक रूप से ध्यान में नहीं रखा जा सकता है। यादृच्छिक त्रुटियों को सैद्धांतिक रूप से समाप्त नहीं किया जा सकता है। हालाँकि, विधियों का उपयोग करना गणितीय सांख्यिकी, यादृच्छिक त्रुटि की भयावहता का अनुमान लगाना और माप परिणामों की व्याख्या करते समय इसे ध्यान में रखना संभव है। सांख्यिकीय प्रसंस्करण के बिना, माप परिणामों को विश्वसनीय नहीं माना जा सकता है।

किसी एथलीट की स्थिति या क्षमता को निर्धारित करने के लिए किया जाने वाला माप या परीक्षण कहलाता है परीक्षा. सभी मापों को परीक्षण के रूप में उपयोग नहीं किया जा सकता है, लेकिन केवल वे जो विशेष आवश्यकताओं को पूरा करते हैं: मानकीकरण, रेटिंग प्रणाली की उपस्थिति, विश्वसनीयता, सूचना सामग्री, निष्पक्षता। विश्वसनीयता, सूचना सामग्री और निष्पक्षता की आवश्यकताओं को पूरा करने वाले परीक्षण कहलाते हैं ठोस.

परीक्षण प्रक्रिया को कहा जाता है परीक्षण, और परिणामी संख्यात्मक मान हैं परीक्षा परिणाम।

मोटर कार्यों पर आधारित परीक्षण कहलाते हैं मोटरया मोटर. विषय के सामने आने वाले कार्य के आधार पर, मोटर परीक्षणों के तीन समूहों को प्रतिष्ठित किया जाता है।

मोटर परीक्षण के प्रकार

परीक्षण का नाम

एथलीट के लिए कार्य

परीक्षा परिणाम

व्यायाम पर नियंत्रण रखें

मोटर उपलब्धियाँ

1500 मीटर दौड़ का समय

मानक कार्यात्मक परीक्षण

सभी के लिए समान, खुराक: 1) प्रदर्शन किए गए कार्य की मात्रा के अनुसार; 2) शारीरिक परिवर्तनों के परिमाण से

मानक कार्य के दौरान शारीरिक या जैव रासायनिक संकेतक, शारीरिक परिवर्तनों की एक मानक मात्रा के दौरान मोटर संकेतक

मानक कार्य के दौरान हृदय गति पंजीकरण 1000 किग्रा/मिनट हृदय गति पर चलने की गति 160 बीट/मिनट

अधिकतम कार्यात्मक परीक्षण

अधिकतम परिणाम दिखाएँ

शारीरिक या जैव रासायनिक संकेतक

अधिकतम ऑक्सीजन ऋण या अधिकतम ऑक्सीजन खपत का निर्धारण

कभी-कभी एक नहीं, बल्कि कई परीक्षणों का उपयोग किया जाता है जिनका एक समान अंतिम लक्ष्य होता है। परीक्षणों के इस समूह को कहा जाता है परीक्षणों की बैटरी.

यह ज्ञात है कि सबसे कड़े मानकीकरण और सटीक उपकरणों के साथ भी, परीक्षण के परिणाम हमेशा कुछ हद तक भिन्न होते हैं। इसलिए, अच्छे परीक्षणों के चयन के लिए महत्वपूर्ण शर्तों में से एक उनकी विश्वसनीयता है।

परीक्षण की विश्वसनीयताजब एक ही व्यक्ति का समान परिस्थितियों में बार-बार परीक्षण किया जाता है तो परिणामों के बीच सहमति की डिग्री होती है। परीक्षण परिणामों में अंतर-व्यक्तिगत या अंतर-समूह भिन्नता के चार मुख्य कारण हैं:

    विषयों की स्थिति में परिवर्तन (थकान, प्रेरणा में परिवर्तन, आदि); अनियंत्रित परिवर्तन बाहरी स्थितियाँऔर उपकरण;

    परीक्षण आयोजित करने या मूल्यांकन करने वाले व्यक्ति की स्थिति में परिवर्तन (भलाई, प्रयोगकर्ता का परिवर्तन, आदि);

    परीक्षण की अपूर्णता (उदाहरण के लिए, स्पष्ट रूप से अपूर्ण और अविश्वसनीय परीक्षण - पहली चूक से पहले बास्केटबॉल टोकरी में मुफ्त थ्रो, आदि)।

परीक्षण के लिए विश्वसनीयता मानदंड हो सकता है विश्वसनीयता कारक,प्रयोग में दर्ज किए गए फैलाव के वास्तविक फैलाव के अनुपात के रूप में गणना की गई: आर = सत्य एस 2 / दर्ज एस 2, जहां वास्तविक मूल्य अनंत पर प्राप्त फैलाव के रूप में समझा जाता है बड़ी संख्यासमान परिस्थितियों में अवलोकन; दर्ज किया गया विचरण प्रायोगिक अध्ययन से प्राप्त हुआ है। दूसरे शब्दों में, विश्वसनीयता गुणांक केवल प्रयोग में दर्ज की गई भिन्नता में वास्तविक भिन्नता का अनुपात है।

इस गुणांक के अतिरिक्त, वे भी उपयोग करते हैं विश्वसनीयता सूचकांक, जिसे एक ही परीक्षण के रिकॉर्ड किए गए और सही मूल्यों के बीच सहसंबंध या संबंध का सैद्धांतिक गुणांक माना जाता है। किसी परीक्षण की गुणवत्ता (विश्वसनीयता) का आकलन करने के लिए एक मानदंड के रूप में यह विधि सबसे आम है।

परीक्षण की विश्वसनीयता की एक विशेषता यह है समानक, जो विभिन्न परीक्षणों द्वारा समान गुणवत्ता (उदाहरण के लिए, भौतिक) के परीक्षण के परिणामों के बीच समझौते की डिग्री को दर्शाता है। परीक्षण तुल्यता के प्रति दृष्टिकोण विशिष्ट कार्य पर निर्भर करता है। एक ओर, यदि दो या दो से अधिक परीक्षण समतुल्य हैं, तो उनके संयुक्त उपयोग से अनुमानों की विश्वसनीयता बढ़ जाती है; दूसरी ओर, केवल एक समकक्ष परीक्षण का उपयोग करना संभव लगता है, जिससे परीक्षण सरल हो जाएगा।

यदि परीक्षणों की बैटरी में शामिल सभी परीक्षण अत्यधिक समतुल्य हैं, तो उन्हें बुलाया जाता है सजातीय(उदाहरण के लिए, कूदने की क्षमता की गुणवत्ता का आकलन करने के लिए, यह माना जाना चाहिए कि लंबी कूद, ऊंची कूद और ट्रिपल जंप सजातीय होंगे)। इसके विपरीत, यदि कॉम्प्लेक्स में कोई समकक्ष परीक्षण नहीं हैं (उदाहरण के लिए, सामान्य शारीरिक फिटनेस का आकलन करने के लिए), तो इसमें शामिल सभी परीक्षण अलग-अलग गुणों को मापते हैं, यानी। मूलतः जटिल है विषमांगी

परीक्षणों की विश्वसनीयता को कुछ हद तक बढ़ाया जा सकता है:

    परीक्षण का अधिक कठोर मानकीकरण;

    प्रयासों की संख्या में वृद्धि;

    मूल्यांकनकर्ताओं की संख्या बढ़ाना और उनकी राय की स्थिरता बढ़ाना;

    समतुल्य परीक्षणों की संख्या में वृद्धि;

    विषयों की बेहतर प्रेरणा.

निष्पक्षता का परीक्षण करेंवहाँ है विशेष मामलाविश्वसनीयता, यानी परीक्षण करने वाले व्यक्ति से परीक्षण परिणामों की स्वतंत्रता।

परीक्षण की सूचना सामग्री- यह सटीकता की वह डिग्री है जिसके साथ यह उस संपत्ति (एथलीट की गुणवत्ता) को मापता है जिसके मूल्यांकन के लिए इसका उपयोग किया जाता है। अलग-अलग मामलों में, एक ही परीक्षण में अलग-अलग सूचना सामग्री हो सकती है। परीक्षण की सूचनात्मकता का प्रश्न दो विशिष्ट प्रश्नों में विभाजित है:

कौन सा शुल्क यह परीक्षण? यह वास्तव में कैसे मापता है?

उदाहरण के लिए, क्या लंबी दूरी के धावकों की तैयारियों का आकलन करने के लिए एमपीसी जैसे संकेतक का उपयोग करना संभव है, और यदि हां, तो किस हद तक सटीकता के साथ? क्या इस परीक्षण का उपयोग नियंत्रण प्रक्रिया में किया जा सकता है?

यदि परीक्षण का उपयोग परीक्षा के समय एथलीट की स्थिति निर्धारित करने के लिए किया जाता है, तो वे बोलते हैं डायग्नोस्टिकपरीक्षण की सूचना सामग्री. यदि, परीक्षण परिणामों के आधार पर, वे एथलीट के संभावित भविष्य के प्रदर्शन के बारे में निष्कर्ष निकालना चाहते हैं, तो वे बात करते हैं शकुनजानकारी सामग्री। एक परीक्षण निदानात्मक रूप से जानकारीपूर्ण हो सकता है, लेकिन पूर्वानुमानात्मक रूप से नहीं, और इसके विपरीत।

सूचना सामग्री की डिग्री को मात्रात्मक रूप से चित्रित किया जा सकता है - प्रयोगात्मक डेटा (तथाकथित) के आधार पर प्रयोगसिद्धसूचना सामग्री) और गुणात्मक रूप से - स्थिति के सार्थक विश्लेषण के आधार पर ( तार्किकजानकारी सामग्री)। हालाँकि व्यावहारिक कार्य में तार्किक या सार्थक विश्लेषण हमेशा गणितीय विश्लेषण से पहले होना चाहिए। किसी परीक्षण की सूचनात्मकता का सूचक परीक्षण में परिणाम पर मानदंड की निर्भरता के लिए गणना किया गया सहसंबंध गुणांक है, और इसके विपरीत (मानदंड को एक संकेतक माना जाता है जो स्पष्ट रूप से उस संपत्ति को दर्शाता है जिसे उपयोग करके मापा जा रहा है) कसौटी)।

ऐसे मामलों में जहां किसी परीक्षण की सूचना सामग्री अपर्याप्त है, परीक्षणों की एक बैटरी का उपयोग किया जाता है। हालाँकि, बाद वाला, उच्च अलग सूचना सामग्री मानदंड (सहसंबंध गुणांक को देखते हुए) के साथ भी, हमें एक भी संख्या प्राप्त करने की अनुमति नहीं देता है। यहां गणितीय आँकड़ों की एक अधिक जटिल विधि बचाव में आ सकती है - कारक विश्लेषण.जो आपको यह निर्धारित करने की अनुमति देता है कि कितने और कौन से परीक्षण एक अलग कारक पर एक साथ काम करते हैं और प्रत्येक कारक में उनके योगदान की डिग्री क्या है। फिर ऐसे परीक्षणों (या उनके संयोजन) का चयन करना आसान होता है जो व्यक्तिगत कारकों का सबसे सटीक आकलन करते हैं।

1 परीक्षण किसे कहते हैं?

2 परीक्षण क्या है?

किसी एथलीट की गुणवत्ता या स्थिति को मापना किसी एथलीट की स्थिति या क्षमता को निर्धारित करने के लिए आयोजित एक माप या परीक्षण परीक्षण प्रक्रिया जो मात्रात्मक रूप से किसी एथलीट की गुणवत्ता या स्थिति का मूल्यांकन करती है किसी परिभाषा की आवश्यकता नहीं है

3 परीक्षा परिणाम को क्या कहते हैं?

किसी एथलीट की गुणवत्ता या स्थिति को मापना किसी एथलीट की स्थिति या क्षमता को निर्धारित करने के लिए आयोजित एक माप या परीक्षण परीक्षण प्रक्रिया जो मात्रात्मक रूप से किसी एथलीट की गुणवत्ता या स्थिति का मूल्यांकन करती है किसी परिभाषा की आवश्यकता नहीं है

4 यह किस प्रकार का परीक्षण है? 100 मीटर दौड़?

5 यह किस प्रकार का परीक्षण है? हाथ डायनेमोमेट्री?

नियंत्रण व्यायाम कार्यात्मक परीक्षण, अधिकतम कार्यात्मक परीक्षण

6 नमूना किस प्रकार के परीक्षण से संबंधित है? भारतीय दंड संहिता?

नियंत्रण व्यायाम कार्यात्मक परीक्षण, अधिकतम कार्यात्मक परीक्षण

7 यह किस प्रकार का परीक्षण है? मेट्रोनोम के साथ तीन मिनट की दौड़?

नियंत्रण व्यायाम कार्यात्मक परीक्षण, अधिकतम कार्यात्मक परीक्षण

8 यह किस प्रकार का परीक्षण है? बार पर पुल-अप की अधिकतम संख्या?

नियंत्रण व्यायाम कार्यात्मक परीक्षण, अधिकतम कार्यात्मक परीक्षण

9 किन मामलों में किसी परीक्षण को सूचनाप्रद माना जाता है?

10 किसी परीक्षण को कब विश्वसनीय माना जाता है?

दोबारा परीक्षण करने पर परीक्षण को पुनरुत्पादित करने की क्षमता, एथलीट की रुचि की गुणवत्ता को मापने के लिए परीक्षण की क्षमता, परीक्षण का संचालन करने वाले व्यक्ति से परीक्षण के परिणामों की स्वतंत्रता

11 किस मामले में परीक्षण को वस्तुनिष्ठ माना जाता है?

दोबारा परीक्षण करने पर परीक्षण को पुनरुत्पादित करने की क्षमता, एथलीट की रुचि की गुणवत्ता को मापने के लिए परीक्षण की क्षमता, परीक्षण का संचालन करने वाले व्यक्ति से परीक्षण के परिणामों की स्वतंत्रता

12 सूचना सामग्री के परीक्षण का मूल्यांकन करते समय कौन सा मानदंड आवश्यक है?

13 विश्वसनीयता परीक्षण का मूल्यांकन करते समय किस मानदंड की आवश्यकता होती है?

छात्र का टी परीक्षण फिशर का एफ परीक्षण सहसंबंध गुणांक निर्धारण का गुणांक फैलाव

14 वस्तुनिष्ठता परीक्षण का मूल्यांकन करते समय किस मानदंड की आवश्यकता होती है?

छात्र का टी परीक्षण फिशर का एफ परीक्षण सहसंबंध गुणांक निर्धारण का गुणांक फैलाव

15 यदि किसी परीक्षण की सूचना सामग्री का उपयोग किसी एथलीट की फिटनेस की डिग्री का आकलन करने के लिए किया जाता है तो उसे क्या कहा जाता है?

16 अपने खेल अनुभाग के लिए बच्चों का चयन करते समय प्रशिक्षक नियंत्रण अभ्यास की किस सूचना सामग्री का मार्गदर्शन करता है?

तार्किक पूर्वानुमानित अनुभवजन्य निदान

17 क्या परीक्षणों की सूचना सामग्री का आकलन करने के लिए सहसंबंध विश्लेषण आवश्यक है?

18 क्या परीक्षणों की सूचना सामग्री का आकलन करने के लिए कारक विश्लेषण आवश्यक है?

19 क्या सहसंबंध विश्लेषण का उपयोग करके किसी परीक्षण की विश्वसनीयता का आकलन करना संभव है?

20 क्या सहसंबंध विश्लेषण का उपयोग करके किसी परीक्षण की निष्पक्षता का आकलन करना संभव है?

21 क्या सामान्य शारीरिक फिटनेस का आकलन करने के लिए डिज़ाइन किए गए परीक्षण समकक्ष होंगे?

22 विभिन्न परीक्षणों के साथ एक ही गुणवत्ता को मापते समय, परीक्षणों का उपयोग किया जाता है...

समान गुणवत्ता को मापने के लिए डिज़ाइन किया गया है, एक दूसरे के साथ उच्च सहसंबंध होना, एक दूसरे के साथ कम सहसंबंध होना

मूल्यांकन सिद्धांत के मूल सिद्धांत

खेल परिणामों का मूल्यांकन करने के लिए अक्सर विशेष अंक तालिकाओं का उपयोग किया जाता है। ऐसी तालिकाओं का उद्देश्य दिखाए गए खेल परिणाम (वस्तुनिष्ठ उपायों में व्यक्त) को सशर्त बिंदुओं में परिवर्तित करना है। खेल परिणामों को अंकों में बदलने का नियम कहलाता है दर्ज़ा पैमाने. पैमाने को गणितीय अभिव्यक्ति, तालिका या ग्राफ़ के रूप में निर्दिष्ट किया जा सकता है। खेल और शारीरिक शिक्षा में 4 मुख्य प्रकार के पैमाने उपयोग किये जाते हैं।

आनुपातिक तराजू

प्रतिगामी तराजू

प्रगतिशील तराजू.

आनुपातिक तराजूपरिणामों में समान वृद्धि के लिए समान अंक देने का सुझाव दें (उदाहरण के लिए, 100 मीटर दौड़ में परिणाम में प्रत्येक 0.1 सेकंड के सुधार के लिए, 20 अंक दिए जाते हैं)। ऐसे पैमानों का उपयोग आधुनिक पेंटाथलॉन, स्पीड स्केटिंग, स्की रेसिंग, नॉर्डिक संयुक्त, बायथलॉन और अन्य खेलों में किया जाता है।

प्रतिगामी तराजूसुझाव है कि जैसे-जैसे खेल उपलब्धियों में वृद्धि होती है, परिणामों में समान वृद्धि के लिए, अंकों की कम संख्या प्रदान की जाती है (उदाहरण के लिए, 15.0 से 14.9 सेकंड तक 100 मीटर की दौड़ में परिणाम में सुधार के लिए, 20 अंक जोड़े जाते हैं, और 0.1 के लिए) s 10.0-9.9 s की सीमा में - केवल 15 अंक)।

प्रगतिशील तराजू.यहां, खेल का परिणाम जितना अधिक होगा, उसके सुधार के लिए अंकों में उतनी ही अधिक वृद्धि होगी (उदाहरण के लिए, 15.0 से 14.9 सेकेंड तक चलने के समय में सुधार के लिए, 10 अंक जोड़े जाते हैं, और 10.0 से 9.9 सेकेंड तक - 100 अंक जोड़े जाते हैं)। प्रगतिशील पैमानों का उपयोग तैराकी, कुछ प्रकार के एथलेटिक्स और भारोत्तोलन में किया जाता है।

सिग्मॉइड तराजूखेलों में शायद ही कभी उपयोग किया जाता है, लेकिन शारीरिक फिटनेस का आकलन करने में व्यापक रूप से उपयोग किया जाता है (उदाहरण के लिए, अमेरिकी आबादी के लिए शारीरिक फिटनेस मानकों का पैमाना ऐसा दिखता है)। इन पैमानों में, बहुत कम और बहुत अधिक उपलब्धियों वाले क्षेत्र में परिणामों में सुधार को बहुत कम पुरस्कृत किया जाता है; मध्य उपलब्धि क्षेत्र में परिणामों में वृद्धि सबसे अधिक अंक लाती है।

मूल्यांकन के मुख्य उद्देश्य हैं:

    एक ही कार्य में विभिन्न उपलब्धियों की तुलना करें;

    विभिन्न कार्यों में उपलब्धियों की तुलना करें;

    मानकों को परिभाषित करें.

नियमस्पोर्ट्स मेट्रोलॉजी में, परिणाम का सीमा मूल्य कहा जाता है, जो किसी एथलीट को वर्गीकरण समूहों में से एक को निर्दिष्ट करने के आधार के रूप में कार्य करता है। मानदंड तीन प्रकार के होते हैं: तुलनात्मक, व्यक्तिगत, देय।

तुलनात्मक मानकएक ही जनसंख्या के लोगों की तुलना पर आधारित हैं। उदाहरण के लिए, हाइपोक्सिया के प्रति प्रतिरोध (उच्च, मध्यम, निम्न) या प्रतिक्रियाशीलता (हाइपररिएक्टिव, नॉरमोरएक्टिव, हाइपोरिएक्टिव) की डिग्री के अनुसार लोगों को उपसमूहों में विभाजित करना।

आकलन और मानदंडों के विभिन्न ग्रेडेशन

विषयों का प्रतिशत

तराजू में मानदंड

मौखिक

अंकों में

प्रतिशतता

बहुत कम

एम के नीचे - 2

M - 2 से M - 1 तक

औसत से नीचे

M-1 से M–0.5 तक

M–0.5 से M+0.5 तक

औसत से ऊपर

M+0.5 से M+1 तक

M+1 से M+2 तक

बहुत ऊँचा

M+2 से ऊपर

ये मानदंड किसी दी गई आबादी में केवल विषयों की तुलनात्मक सफलताओं को दर्शाते हैं, लेकिन समग्र रूप से (या औसतन) आबादी के बारे में कुछ नहीं कहते हैं। इसलिए, तुलनात्मक मानदंडों की तुलना अन्य आबादी से प्राप्त आंकड़ों से की जानी चाहिए और व्यक्तिगत और उचित मानदंडों के संयोजन में उपयोग किया जाना चाहिए।

व्यक्तिगत मानदंडविभिन्न परिस्थितियों में एक ही एथलीट के प्रदर्शन की तुलना पर आधारित हैं। उदाहरण के लिए, कई खेलों में किसी के अपने शरीर के वजन और एथलेटिक प्रदर्शन के बीच कोई संबंध नहीं होता है। प्रत्येक एथलीट का व्यक्तिगत रूप से उनकी एथलेटिक फिटनेस की स्थिति के अनुरूप इष्टतम वजन होता है। इस मानदंड को खेल प्रशिक्षण के विभिन्न चरणों में नियंत्रित किया जा सकता है।

उचित मानकये इस विश्लेषण पर आधारित हैं कि एक व्यक्ति को जीवन के सामने आने वाले कार्यों को सफलतापूर्वक पूरा करने के लिए क्या करने में सक्षम होना चाहिए। इसका एक उदाहरण व्यक्तिगत शारीरिक प्रशिक्षण परिसरों के मानक, महत्वपूर्ण क्षमता के उचित मूल्य, बेसल चयापचय दर, शरीर का वजन और ऊंचाई आदि हो सकता है।

1 क्या सहनशक्ति की गुणवत्ता को सीधे मापना संभव है?

2 क्या गति की गुणवत्ता को सीधे मापना संभव है?

3 क्या निपुणता की गुणवत्ता को सीधे मापना संभव है?

4 क्या लचीलेपन की गुणवत्ता को सीधे मापना संभव है?

5 क्या व्यक्तिगत मांसपेशियों की ताकत को सीधे मापना संभव है?

6 क्या मूल्यांकन को गुणात्मक विशेषता (अच्छा, संतोषजनक, बुरा, उत्तीर्ण, आदि) में व्यक्त किया जा सकता है?

7 क्या माप पैमाने और रेटिंग पैमाने के बीच कोई अंतर है?

8 रेटिंग पैमाना क्या है?

खेल परिणामों को मापने की प्रणाली खेल परिणामों को अंकों में बदलने का नियम मानदंडों के मूल्यांकन के लिए प्रणाली

9 यह पैमाना परिणामों में समान वृद्धि के लिए समान अंक देने को मानता है। यह …

10 परिणामों में समान वृद्धि के लिए, जैसे-जैसे खेल उपलब्धियाँ बढ़ती हैं, कम और कम अंक दिए जाते हैं।

यह …

प्रगतिशील पैमाना प्रतिगामी पैमाना आनुपातिक पैमाना सिग्मॉइड पैमाना

यह …

11 खेल का परिणाम जितना अधिक होगा, अंकों में उतनी ही अधिक वृद्धि, सुधार का आकलन किया जाएगा। यह …

यह …

12 बहुत कम और बहुत अधिक उपलब्धि वाले क्षेत्रों में प्रदर्शन में सुधार को मामूली पुरस्कार दिया जाता है; मध्य उपलब्धि क्षेत्र में परिणामों में वृद्धि सबसे अधिक अंक लाती है। यह …

एक ही जनसंख्या के लोगों की तुलना पर आधारित 13 मानदंड कहलाते हैं... एक ही एथलीट के प्रदर्शन की तुलना पर आधारित 14 मानकविभिन्न राज्य

, कहा जाता है...

व्यक्तिगत मानक उचित मानक तुलनात्मक मानक

, कहा जाता है...

किसी व्यक्ति को उसे सौंपे गए कार्यों से निपटने के लिए क्या करने में सक्षम होना चाहिए, इसके विश्लेषण पर आधारित 15 मानदंड कहलाते हैं...

गुणात्मकता की बुनियादी अवधारणाएँगुणमिति

(लैटिन क्वालिटास - गुणवत्ता, मेट्रोन - माप) गुणात्मक विशेषताओं का आकलन करने के लिए मात्रात्मक तरीकों का अध्ययन और विकास करता है।

क्वालिमेट्री कई शुरुआती बिंदुओं पर आधारित है:

किसी भी गुणवत्ता को मापा जा सकता है;

गुणवत्ता कई गुणों पर निर्भर करती है जो "गुणवत्ता वृक्ष" बनाते हैं (उदाहरण के लिए, फिगर स्केटिंग में व्यायाम प्रदर्शन के गुणवत्ता वृक्ष में तीन स्तर होते हैं - उच्चतम, मध्य, निम्नतम);

प्रत्येक संपत्ति दो संख्याओं द्वारा निर्धारित होती है: सापेक्ष संकेतक और वजन; प्रत्येक स्तर पर संपत्ति भार का योग एक (या 100%) के बराबर है।

क्वालिमेट्री की पद्धतिगत तकनीकों को दो समूहों में विभाजित किया गया है:

विशेषज्ञ आकलन और प्रश्नावली के आधार पर अनुमानी (सहज ज्ञान युक्त);

वाद्य।विशेषज्ञ विशेषज्ञों की राय मांगकर प्राप्त किया गया मूल्यांकन है। विशेषज्ञता के विशिष्ट उदाहरण: जिम्नास्टिक और फिगर स्केटिंग में निर्णय लेना, सर्वश्रेष्ठ के लिए प्रतिस्पर्धावैज्ञानिकों का काम

एक परीक्षा आयोजित करने में निम्नलिखित मुख्य चरण शामिल हैं: इसका उद्देश्य बनाना, विशेषज्ञों का चयन करना, एक कार्यप्रणाली चुनना, सर्वेक्षण करना और प्राप्त जानकारी को संसाधित करना, जिसमें व्यक्तिगत विशेषज्ञ मूल्यांकन की स्थिरता का आकलन करना शामिल है। जांच के दौरान बड़ा मूल्यवानमूल्य के आधार पर विशेषज्ञों की राय के बीच कुछ हद तक सहमति होती है रैंक सहसंबंध गुणांक(कई विशेषज्ञों के मामले में)। यह ध्यान दिया जाना चाहिए कि रैंक सहसंबंध कई क्वालिमेट्री समस्याओं के समाधान का आधार है, क्योंकि यह गुणात्मक विशेषताओं के साथ गणितीय गणना की अनुमति देता है।

व्यवहार में, किसी विशेषज्ञ की योग्यता का संकेतक अक्सर विशेषज्ञों के समूह की औसत रेटिंग से उसकी रेटिंग का विचलन होता है।

प्रश्नावलीप्रश्नावली भरकर राय एकत्र करने की एक विधि है। प्रश्नावली, साक्षात्कार और बातचीत के साथ, सर्वेक्षण विधियाँ हैं। साक्षात्कारों और वार्तालापों के विपरीत, प्रश्नावली में प्रश्नावली भरने वाले व्यक्ति - प्रतिवादी - से मानकीकृत प्रश्नों की एक प्रणाली के लिखित उत्तर शामिल होते हैं। यह आपको व्यवहार, इरादों, राय आदि के उद्देश्यों का अध्ययन करने की अनुमति देता है।

प्रश्नावली का उपयोग करके, आप खेल में कई व्यावहारिक समस्याओं को हल कर सकते हैं: एक एथलीट की मनोवैज्ञानिक स्थिति का आकलन करना; प्रशिक्षण सत्रों की प्रकृति और दिशा के प्रति उनका दृष्टिकोण; टीम में पारस्परिक संबंध; तकनीकी और सामरिक तत्परता का स्वयं का मूल्यांकन; आहार मूल्यांकन और कई अन्य।

1 क्वालिमेट्री किसका अध्ययन करती है?

परीक्षणों की गुणवत्ता का अध्ययन करना किसी विशेषता के गुणात्मक गुणों का अध्ययन करना गुणवत्ता का आकलन करने के लिए मात्रात्मक तरीकों का अध्ययन और विकास करना

2 गणितीय तरीके, क्वालिमेट्री में उपयोग किया जाता है?

जोड़ी सहसंबंध रैंक सहसंबंध विचरण का विश्लेषण

3 प्रदर्शन के स्तर का आकलन करने के लिए किन तरीकों का उपयोग किया जाता है?

4 विविधता का आकलन करने के लिए किन तरीकों का उपयोग किया जाता है? तकनीकी तत्व?

प्रश्नावली विधि विशेषज्ञ मूल्यांकन विधि विधि निर्दिष्ट नहीं है

5 तकनीकी तत्वों की जटिलता का आकलन करने के लिए किन तरीकों का उपयोग किया जाता है?

प्रश्नावली विधि विशेषज्ञ मूल्यांकन विधि विधि निर्दिष्ट नहीं है

6 मूल्यांकन के लिए किन विधियों का उपयोग किया जाता है मनोवैज्ञानिक अवस्थाधावक?

प्रश्नावली विधि विशेषज्ञ मूल्यांकन विधि विधि निर्दिष्ट नहीं है

अध्याय 3. परीक्षण परिणामों का सांख्यिकीय प्रसंस्करण

परीक्षण परिणामों का सांख्यिकीय प्रसंस्करण, एक ओर, विषयों के परिणामों को निष्पक्ष रूप से निर्धारित करने की अनुमति देता है, दूसरी ओर, परीक्षण की गुणवत्ता का आकलन करने के लिए, परीक्षण कार्य, विशेष रूप से इसकी विश्वसनीयता का मूल्यांकन करने के लिए। शास्त्रीय परीक्षण सिद्धांत में विश्वसनीयता की समस्या पर बहुत अधिक ध्यान दिया गया है। इस सिद्धांत ने आज भी अपनी प्रासंगिकता नहीं खोई है। दिखने के बावजूद और भी आधुनिक सिद्धांत, शास्त्रीय सिद्धांत अपनी स्थिति बनाए रखना जारी रखता है।

3.1. शास्त्रीय परीक्षण सिद्धांत के बुनियादी प्रावधान

3.2. परीक्षण परिणाम मैट्रिक्स

3.3. परीक्षण स्कोर का चित्रमय प्रतिनिधित्व

3.4. केन्द्रीय प्रवृत्ति के उपाय

3.5. सामान्य वितरण

3.6. विषयों के परीक्षण अंकों में भिन्नता

3.7. सहसंबंध मैट्रिक्स

3.8. परीक्षण विश्वसनीयता

3.9. परीक्षण की वैधता

साहित्य

शास्त्रीय परीक्षण सिद्धांत के बुनियादी प्रावधान

मानसिक परीक्षणों के शास्त्रीय सिद्धांत के निर्माता प्रसिद्ध ब्रिटिश मनोवैज्ञानिक, कारक विश्लेषण के लेखक, चार्ल्स एडवर्ड स्पीयरमैन (1863-1945) 1 हैं। उनका जन्म 10 सितंबर, 1863 को हुआ था और उन्होंने अपने जीवन के एक चौथाई समय तक ब्रिटिश सेना में सेवा की। इस कारण उन्होंने मात्र 41 वर्ष की उम्र में ही अपनी पीएच.डी. की डिग्री प्राप्त कर ली। चार्ल्स स्पीयरमैन ने विल्हेम वुंड्ट के निर्देशन में प्रायोगिक मनोविज्ञान की लीपज़िग प्रयोगशाला में अपना शोध प्रबंध अनुसंधान किया। उस समय, चार्ल्स स्पीयरमैन मानव बुद्धि के परीक्षण पर फ्रांसिस गैल्टन के काम से काफी प्रभावित थे। चार्ल्स स्पीयरमैन के छात्र आर. कैटेल और डी. वेक्स्लर थे। उनके अनुयायियों में ए. अनास्तासी, जे.पी. गिलफोर्ड, पी. वर्नोन, सी. बर्ट, ए. जेन्सेन हैं।

लुईस गुटमैन (1916-1987) ने शास्त्रीय परीक्षण सिद्धांत के विकास में एक बड़ा योगदान दिया।

शास्त्रीय परीक्षण सिद्धांत को पहली बार हेरोल्ड गुलिक्सेन (गुलिक्सेन एच., 1950) 4 के मौलिक कार्य में व्यापक रूप से और पूरी तरह से प्रस्तुत किया गया था। तब से, सिद्धांत को कुछ हद तक संशोधित किया गया है, विशेष रूप से, गणितीय उपकरण में सुधार किया गया है। आधुनिक प्रस्तुति में शास्त्रीय परीक्षण सिद्धांत क्रोकर एल., एलिग्ना जे. (1986) 5 पुस्तक में दिया गया है। घरेलू शोधकर्ताओं में, वी. अवनेसोव (1989) 6 इस सिद्धांत का वर्णन करने वाले पहले व्यक्ति थे। चेलिशकोवा एम.बी. के काम में (2002) 7 परीक्षण की गुणवत्ता के सांख्यिकीय औचित्य पर जानकारी प्रदान करता है।

शास्त्रीय परीक्षण सिद्धांत निम्नलिखित पाँच बुनियादी सिद्धांतों पर आधारित है।

1. अनुभवजन्य रूप से प्राप्त माप परिणाम (X) वास्तविक माप परिणाम (T) और माप त्रुटि (E) 8 का योग है:

एक्स = टी + ई (3.1.1)

T और E के मान आमतौर पर अज्ञात होते हैं।

2. सही माप परिणाम को गणितीय अपेक्षा E(X) के रूप में व्यक्त किया जा सकता है:

3. विषयों के समूह में सही और गलत घटकों का सहसंबंध शून्य के बराबर है, अर्थात, ρ TE = 0.

4. किन्हीं दो परीक्षणों के ग़लत घटक आपस में मेल नहीं खाते:

5. एक परीक्षण के गलत घटक किसी अन्य परीक्षण के वास्तविक घटकों से संबंधित नहीं होते हैं:

इसके अलावा, शास्त्रीय परीक्षण सिद्धांत का आधार दो परिभाषाओं से बनता है - समानांतर और समकक्ष परीक्षण।

समानांतर परीक्षणों को आवश्यकताओं (1-5) को पूरा करना चाहिए, दोनों परीक्षणों का उत्तर देने वाले विषयों के प्रत्येक नमूने में एक परीक्षण (टी 1) के वास्तविक घटकों को दूसरे परीक्षण (टी 2) के वास्तविक घटकों के बराबर होना चाहिए। यह माना जाता है कि T 1 =T 2 और, इसके अलावा, प्रसरण s 1 2 = s 2 2 के बराबर हैं।

समतुल्य परीक्षणों को एक अपवाद के साथ समानांतर परीक्षणों की सभी आवश्यकताओं को पूरा करना होगा: एक परीक्षण के वास्तविक घटकों को दूसरे समानांतर परीक्षण के वास्तविक घटकों के बराबर होना जरूरी नहीं है, लेकिन उन्हें एक ही स्थिरांक से भिन्न होना चाहिए साथ.

दो परीक्षणों की समतुल्यता की शर्त लिखी गई है निम्नलिखित प्रपत्र:

जहां सी 12 पहले और दूसरे परीक्षण के परिणामों के बीच स्थिरांक है।

उपरोक्त प्रावधानों के आधार पर, परीक्षण विश्वसनीयता का एक सिद्धांत 9,10 बनाया गया है।

अर्थात्, परिणामी परीक्षण अंकों का प्रसरण सत्य और त्रुटि घटकों के प्रसरणों के योग के बराबर है।

आइए इस अभिव्यक्ति को इस प्रकार फिर से लिखें:

(3.1.3)

इस समानता का दाहिना पक्ष परीक्षण की विश्वसनीयता को दर्शाता है ( आर). इस प्रकार, परीक्षण की विश्वसनीयता इस प्रकार लिखी जा सकती है:

इस सूत्र के आधार पर, परीक्षण विश्वसनीयता गुणांक खोजने के लिए बाद में विभिन्न अभिव्यक्तियाँ प्रस्तावित की गईं। किसी परीक्षण की विश्वसनीयता उसकी होती है सबसे महत्वपूर्ण विशेषता. यदि विश्वसनीयता अज्ञात है, तो परीक्षण परिणामों की व्याख्या नहीं की जा सकती। एक परीक्षण की विश्वसनीयता एक माप उपकरण के रूप में इसकी सटीकता को दर्शाती है। उच्च विश्वसनीयता का अर्थ है समान परिस्थितियों में परीक्षण परिणामों की उच्च पुनरावृत्ति।

शास्त्रीय परीक्षण सिद्धांत में सबसे महत्वपूर्ण समस्याविषय का वास्तविक परीक्षण स्कोर (टी) निर्धारित करना है। प्रयोगसिद्ध परीक्षण स्कोर(एक्स) कई स्थितियों पर निर्भर करता है - कार्यों की कठिनाई का स्तर, परीक्षार्थियों की तैयारी का स्तर, कार्यों की संख्या, परीक्षण की स्थिति आदि। मजबूत, अच्छी तरह से तैयार विषयों के समूह में, परीक्षा परिणाम आमतौर पर बेहतर होंगे। खराब प्रशिक्षित विषयों के समूह की तुलना में। इस संबंध में, कार्यों की कठिनाई के माप के परिमाण के बारे में प्रश्न खुला रहता है जनसंख्याविषय. समस्या यह है कि वास्तविक अनुभवजन्य डेटा विषयों के पूरी तरह से यादृच्छिक नमूनों से प्राप्त किया जाता है। आमतौर पर यही है अध्ययन समूह, उन छात्रों की भीड़ का प्रतिनिधित्व करते हैं जो सीखने की प्रक्रिया में एक-दूसरे के साथ काफी मजबूती से बातचीत करते हैं और ऐसी स्थितियों में अध्ययन करते हैं जो अक्सर अन्य समूहों के लिए दोहराई नहीं जाती हैं।

हम ढूंढ लेंगे एस ईसमीकरण (3.1.4) से

यहां मानक विचलन पर माप सटीकता की निर्भरता स्पष्ट रूप से दिखाई गई है एस एक्सऔर परीक्षण की विश्वसनीयता पर आर.

परीक्षण सिद्धांत की मूल बातें

परीक्षण सिद्धांत की बुनियादी अवधारणाएँ

किसी एथलीट की स्थिति या क्षमता को निर्धारित करने के लिए किया जाने वाला माप या परीक्षण कहलाता है परीक्षा .

सभी मापों को परीक्षण के रूप में उपयोग नहीं किया जा सकता है, बल्कि केवल वे माप जो विशेष आवश्यकताओं को पूरा करते हैं। इसमे शामिल है:

1. मानकीकरण (परीक्षण के आवेदन के सभी मामलों में परीक्षण प्रक्रिया और शर्तें समान होनी चाहिए);
2. विश्वसनीयता;
3. सूचना सामग्री;
4. रेटिंग प्रणाली की उपलब्धता.

विश्वसनीयता और सूचना सामग्री की आवश्यकताओं को पूरा करने वाले परीक्षण कहलाते हैं ठोस या प्रामाणिक (ग्रीक ऑथेंटिको - विश्वसनीय तरीके से)।

परीक्षण प्रक्रिया को कहा जाता है परीक्षण ; परिणामी माप संख्यात्मक मान - परीक्षा परिणाम (या परीक्षण परिणाम). उदाहरण के लिए, 100 मीटर दौड़ एक परीक्षण है, दौड़ आयोजित करने की प्रक्रिया और समय परीक्षण है, और दौड़ का समय परीक्षण परिणाम है।

मोटर कार्यों पर आधारित परीक्षण कहलाते हैं मोटर या मोटर . उनके परिणाम या तो मोटर उपलब्धियां (दूरी पूरी करने का समय, दोहराव की संख्या, तय की गई दूरी, आदि), या शारीरिक और जैव रासायनिक संकेतक हो सकते हैं।

कभी-कभी एक नहीं, बल्कि कई परीक्षणों का उपयोग किया जाता है जिनका एक ही अंतिम लक्ष्य होता है (उदाहरण के लिए, प्रतिस्पर्धी प्रशिक्षण अवधि के दौरान एथलीट की स्थिति का आकलन करना)। परीक्षणों के इस समूह को कहा जाता है जटिल या परीक्षणों की बैटरी .

समान विषयों पर लागू समान परीक्षण को समान परिस्थितियों में समान परिणाम देना चाहिए (जब तक कि विषय स्वयं नहीं बदल गए हों)। हालाँकि, सबसे कड़े मानकीकरण और सटीक उपकरणों के साथ भी, परीक्षण के परिणाम हमेशा कुछ हद तक भिन्न होते हैं। उदाहरण के लिए, एक विषय जिसने डेडलिफ्ट डायनेमोमेट्री परीक्षण में अभी-अभी 215 किलोग्राम का परिणाम दिखाया है, दोहराए जाने पर केवल 190 किलोग्राम दिखाता है।

2. विश्वसनीयता का परीक्षण करें और इसे निर्धारित करने के तरीके

विश्वसनीयतापरीक्षण, समान परिस्थितियों में समान लोगों (या अन्य वस्तुओं) का बार-बार परीक्षण करने पर परिणामों के बीच सहमति की डिग्री है।

परीक्षण-पुनः परीक्षण परिणामों में भिन्नता को व्यक्तिगत, या समूह के भीतर, या कक्षा के भीतर कहा जाता है।

इस भिन्नता के चार मुख्य कारण हैं:

1. विषयों की स्थिति में परिवर्तन (थकान, प्रशिक्षण, सीखना, प्रेरणा में परिवर्तन, एकाग्रता, आदि)।
2. बाहरी स्थितियों और उपकरणों में अनियंत्रित परिवर्तन (तापमान, हवा, आर्द्रता, बिजली आपूर्ति वोल्टेज, अनधिकृत व्यक्तियों की उपस्थिति, आदि), यानी। वह सब कुछ जो "यादृच्छिक माप त्रुटि" शब्द से एकजुट है।
3. परीक्षण का संचालन या मूल्यांकन करने वाले व्यक्ति की स्थिति को बदलना (और, निश्चित रूप से, एक प्रयोगकर्ता या न्यायाधीश को दूसरे के साथ बदलना)।
4. परीक्षण की अपूर्णता (ऐसे परीक्षण हैं जो स्पष्ट रूप से अविश्वसनीय हैं। उदाहरण के लिए, यदि विषय बास्केटबॉल टोकरी में फ्री थ्रो कर रहे हैं, तो उच्च प्रतिशत हिट वाला बास्केटबॉल खिलाड़ी भी गलती से पहले थ्रो पर गलती कर सकता है ).

परीक्षण विश्वसनीयता सिद्धांत और माप त्रुटि सिद्धांत के बीच मुख्य अंतर यह है कि त्रुटि सिद्धांत में मापा मूल्य स्थिर माना जाता है, जबकि परीक्षण विश्वसनीयता सिद्धांत में यह माना जाता है कि यह माप से माप में बदलता है। उदाहरण के लिए, यदि दौड़ते हुए लंबी छलांग में पूर्ण किए गए प्रयास के परिणाम को मापना आवश्यक है, तो यह काफी निश्चित है और समय के साथ महत्वपूर्ण रूप से नहीं बदल सकता है। बेशक, यादृच्छिक कारणों (उदाहरण के लिए, टेप माप का असमान तनाव) के कारण, इस परिणाम को आदर्श सटीकता (जैसे, 0.0001 मिमी तक) के साथ मापना असंभव है। हालाँकि, अधिक सटीक माप उपकरण (जैसे लेजर मीटर) का उपयोग करके, उनकी सटीकता को आवश्यक स्तर तक बढ़ाया जा सकता है। उसी समय, यदि कार्य वार्षिक प्रशिक्षण चक्र के व्यक्तिगत चरणों में एक जम्पर की तैयारी निर्धारित करना है, तो उसके द्वारा दिखाए गए परिणामों का सबसे सटीक माप थोड़ी मदद करेगा: आखिरकार, वे प्रयास से बदल जाएंगे प्रयास करने के लिए।

परीक्षणों की विश्वसनीयता को आंकने के लिए उपयोग की जाने वाली विधियों के विचार को समझने के लिए, आइए एक सरल उदाहरण देखें। आइए मान लें कि दो प्रयासों के आधार पर दो एथलीटों की लंबी कूद के परिणामों की तुलना करना आवश्यक है। आइए मान लें कि प्रत्येक एथलीट के परिणाम ± 10 सेमी के भीतर भिन्न होते हैं सामान्य आकारऔर क्रमशः 230 ± 10 सेमी (अर्थात 220 और 240 सेमी) और 280 ± 10 सेमी (अर्थात् 270 और 290 सेमी) के बराबर हैं। इस मामले में, निष्कर्ष, निश्चित रूप से, पूरी तरह से स्पष्ट होगा: दूसरा एथलीट पहले से बेहतर है (50 सेमी के औसत के बीच का अंतर स्पष्ट रूप से ± 10 सेमी के यादृच्छिक उतार-चढ़ाव से अधिक है)। यदि, समान इंट्राग्रुप भिन्नता (± 10 सेमी) के साथ, विषयों के औसत मूल्यों (इंटरग्रुप भिन्नता) के बीच अंतर छोटा है, तो निष्कर्ष निकालना अधिक कठिन होगा। आइए मान लें कि औसत मान लगभग 220 सेमी (एक प्रयास में - 210, दूसरे में - 230 सेमी) और 222 सेमी (212 और 232 सेमी) होंगे। इस मामले में, पहले प्रयास में पहला विषय 230 सेमी कूदता है, और दूसरा - केवल 212 सेमी; और ऐसा लगता है कि पहला दूसरे की तुलना में काफी मजबूत है। इस उदाहरण से यह स्पष्ट है कि मुख्य महत्व इंट्राक्लास परिवर्तनशीलता नहीं है, बल्कि अंतरक्लास मतभेदों के साथ इसका संबंध है। समान इंट्राक्लास परिवर्तनशीलता वर्गों के बीच समान अंतर के साथ अलग-अलग विश्वसनीयता देती है (अध्ययन किए गए वर्गों के बीच विशेष मामले में, चित्र 14)।

चावल। 14. उच्च (शीर्ष) और निम्न (नीचे) विश्वसनीयता के साथ अंतर- और इंट्राक्लास भिन्नता का अनुपात:

लघु ऊर्ध्वाधर स्ट्रोक - व्यक्तिगत प्रयासों से डेटा;

तीन विषयों का औसत परिणाम।

परीक्षण विश्वसनीयता का सिद्धांत इस तथ्य पर आधारित है कि किसी व्यक्ति पर किए गए किसी भी माप का परिणाम दो मूल्यों का योग है:

कहा पे: - तथाकथित सच्चा परिणाम जिसे वे रिकॉर्ड करना चाहते हैं;

विषय की स्थिति में अनियंत्रित परिवर्तन और यादृच्छिक माप त्रुटियों के कारण त्रुटि।

वास्तविक परिणाम को समान परिस्थितियों में असीमित बड़ी संख्या में प्रेक्षणों के लिए x के औसत मान के रूप में समझा जाता है (इस कारण से, चिह्न x पर लगाया जाता है)।

यदि त्रुटियाँ यादृच्छिक हैं (उनका योग शून्य है, और समान प्रयासों में वे एक दूसरे पर निर्भर नहीं हैं), तो गणितीय आँकड़ों से यह निम्नानुसार है:

वे। प्रयोग में दर्ज किए गए परिणामों का प्रसरण वास्तविक परिणामों और त्रुटियों के प्रसरण के योग के बराबर है।

विश्वसनीयता कारकप्रयोग में दर्ज वास्तविक फैलाव और फैलाव का अनुपात कहा जाता है:

विश्वसनीयता गुणांक के अतिरिक्त, वे इसका भी उपयोग करते हैं विश्वसनीयता सूचकांक:

जिसे रिकॉर्ड किए गए परीक्षण मानों और सत्य मानों के बीच एक सैद्धांतिक सहसंबंध गुणांक माना जाता है।

एक सच्चे परीक्षा परिणाम की अवधारणा एक अमूर्तता है (इसे प्रयोगात्मक रूप से मापा नहीं जा सकता है)। इसलिए, हमें अप्रत्यक्ष तरीकों का उपयोग करना होगा। विश्वसनीयता का आकलन करने के लिए सबसे पसंदीदा तरीका विचरण का विश्लेषण है जिसके बाद इंट्राक्लास सहसंबंध गुणांक की गणना की जाती है। भिन्नता का विश्लेषण हमें व्यक्तिगत कारकों के प्रभाव के कारण परीक्षण परिणामों में प्रयोगात्मक रूप से दर्ज भिन्नता को घटकों में विघटित करने की अनुमति देता है। उदाहरण के लिए, यदि आप किसी परीक्षण में विषयों के परिणामों को पंजीकृत करते हैं, तो इस परीक्षण को दोहराते हुए अलग-अलग दिन, और हर दिन कई प्रयास करें, समय-समय पर प्रयोगकर्ताओं को बदलते रहें, फिर विविधताएँ घटित होंगी:

क) विषय से विषय तक;

बी) दिन-ब-दिन;

ग) प्रयोगकर्ता से प्रयोगकर्ता तक;

घ) प्रयास से प्रयास तक।

भिन्नता का विश्लेषण इन विविधताओं को अलग करना और उनका मूल्यांकन करना संभव बनाता है।

इस प्रकार, परीक्षण की व्यावहारिक विश्वसनीयता का आकलन करने के लिए, सबसे पहले, विचरण का विश्लेषण करना और दूसरा, इंट्राक्लास सहसंबंध गुणांक (विश्वसनीयता गुणांक) की गणना करना आवश्यक है।

दो प्रयासों के साथ, इंट्राक्लास सहसंबंध गुणांक का मान व्यावहारिक रूप से पहले और दूसरे प्रयासों के परिणामों के बीच सामान्य सहसंबंध गुणांक के मूल्यों के साथ मेल खाता है। इसलिए, ऐसी स्थितियों में, विश्वसनीयता का आकलन करने के लिए सामान्य सहसंबंध गुणांक का उपयोग किया जा सकता है (यह दो प्रयासों के बजाय एक की विश्वसनीयता का अनुमान लगाता है)।

परीक्षणों की विश्वसनीयता के बारे में बोलते हुए, उनकी स्थिरता (पुनरुत्पादन), स्थिरता और तुल्यता के बीच अंतर करना आवश्यक है।

अंतर्गत स्थिरता परीक्षण समान परिस्थितियों में एक निश्चित समय के बाद दोहराए जाने पर परिणामों की प्रतिलिपि प्रस्तुत करने योग्यता को समझता है। सामान्यतः पुनः परीक्षण कहा जाता है दोबारा परीक्षण करें.

स्थिरतापरीक्षण की विशेषता परीक्षण आयोजित करने या मूल्यांकन करने वाले व्यक्ति के व्यक्तिगत गुणों से परीक्षण परिणामों की स्वतंत्रता है।

समान परीक्षणों की एक निश्चित संख्या (उदाहरण के लिए, 30, 60 और 100 मीटर पर दौड़ना) में से एक परीक्षण का चयन करते समय, समानांतर रूपों की विधि का उपयोग करके परिणामों की सहमति की डिग्री का आकलन किया जाता है। परिणामों के बीच परिकलित सहसंबंध गुणांक कहलाता है तुल्यता गुणांक.

यदि परीक्षण सूट में शामिल सभी परीक्षण अत्यधिक समतुल्य हैं, तो इसे कहा जाता है सजातीय. यह संपूर्ण परिसर मानव मोटर कौशल की एक विशेष संपत्ति को मापता है (उदाहरण के लिए, एक जटिल जिसमें लंबे समय तक खड़े रहना, ऊपर और ट्रिपल जंप शामिल है; गति-शक्ति गुणों के विकास के स्तर का आकलन किया जाता है)। यदि कॉम्प्लेक्स में कोई समकक्ष परीक्षण नहीं हैं, तो इसमें शामिल परीक्षण मापते हैं विभिन्न गुण, तो इसे कहा जाता है विजातीय (उदाहरण के लिए, डेडलिफ्ट डायनेमोमेट्री, अबलाकोव जंप, 100 मीटर दौड़ से युक्त एक कॉम्प्लेक्स)।

परीक्षणों की विश्वसनीयता को कुछ हद तक बढ़ाया जा सकता है:

क) परीक्षण का अधिक कठोर मानकीकरण;

बी) प्रयासों की संख्या में वृद्धि;

ग) मूल्यांकनकर्ताओं (न्यायाधीशों, प्रयोगों) की संख्या बढ़ाना और उनकी राय की स्थिरता बढ़ाना;

घ) समतुल्य परीक्षणों की संख्या बढ़ाना;

डी) बेहतर प्रेरणाशोध किया.

उदाहरण 10.1.

स्प्रिंटर्स की गति-शक्ति क्षमताओं का आकलन करने में खड़े ट्रिपल जंप परिणामों की विश्वसनीयता निर्धारित करने के लिए, यदि नमूना डेटा इस प्रकार है:

समाधान:

1. कार्यपत्रक में परीक्षा परिणाम दर्ज करें:

2. रैंक सहसंबंध गुणांक की गणना के लिए प्राप्त परिणामों को सूत्र में रखें:

3. सूत्र का उपयोग करके स्वतंत्रता की डिग्री की संख्या निर्धारित करें:

निष्कर्ष: गणना मूल्य प्राप्त इसलिए, में विश्वास के साथ 99% हम कह सकते हैं कि स्टैंडिंग ट्रिपल जंप टेस्ट विश्वसनीय है।

परीक्षण सिद्धांत के मूल सिद्धांत 1. परीक्षण सिद्धांत की मूल अवधारणाएँ 2. परीक्षण की विश्वसनीयता और इसे निर्धारित करने के तरीके

सुरक्षा प्रश्न 1. परीक्षण किसे कहते हैं? 2. परीक्षण के लिए क्या आवश्यकताएँ हैं? 3. किन परीक्षणों को प्रामाणिक कहा जाता है? 4. किसी परीक्षण की विश्वसनीयता क्या है? 5. उन कारणों की सूची बनाएं जिनके कारण बार-बार परीक्षण के दौरान परिणामों में भिन्नता आती है। 6. अंतःवर्ग भिन्नता अंतरवर्ग भिन्नता से किस प्रकार भिन्न है? 7. किसी परीक्षण की विश्वसनीयता का व्यावहारिक निर्धारण कैसे करें? 8. परीक्षण की स्थिरता और स्थिरता के बीच क्या अंतर है? 9. परीक्षणों की समतुल्यता क्या है? 10. परीक्षणों का सजातीय सेट क्या है? 11. परीक्षणों का विषमांगी सेट क्या है? 12. परीक्षणों की विश्वसनीयता में सुधार के तरीके।

परीक्षण एक माप या परीक्षण है जो किसी व्यक्ति की स्थिति या क्षमता को निर्धारित करने के लिए किया जाता है। सभी मापों को परीक्षण के रूप में उपयोग नहीं किया जा सकता है, बल्कि केवल वे माप जो विशेष आवश्यकताओं को पूरा करते हैं। इनमें शामिल हैं: 1. मानकीकरण (परीक्षण का उपयोग करने के सभी मामलों में परीक्षण प्रक्रिया और शर्तें समान होनी चाहिए); 2. विश्वसनीयता; 3. सूचना सामग्री; 4. रेटिंग प्रणाली की उपलब्धता.

परीक्षण आवश्यकताएँ: n सूचना सामग्री - सटीकता की डिग्री जिसके साथ यह उस संपत्ति (गुणवत्ता, क्षमता, विशेषता) को मापता है जिसके लिए इसका उपयोग मूल्यांकन के लिए किया जाता है। n विश्वसनीयता वह डिग्री है जिसके परिणाम तब सुसंगत होते हैं जब एक ही व्यक्ति का समान परिस्थितियों में बार-बार परीक्षण किया जाता है। स्थिरता - ( भिन्न लोग, लेकिन वही उपकरण और वही स्थितियां)। n n स्थितियों की मानकता - (बार-बार माप के लिए समान शर्तें)। n ग्रेडिंग सिस्टम की उपलब्धता - (ग्रेडिंग सिस्टम में अनुवाद। जैसे स्कूल में 5 -4 -3...)।

विश्वसनीयता और सूचना सामग्री की आवश्यकताओं को पूरा करने वाले परीक्षणों को ठोस या प्रामाणिक कहा जाता है (ग्रीक ऑथेंटिको - विश्वसनीय तरीके से)

परीक्षण प्रक्रिया को परीक्षण कहा जाता है; माप के परिणामस्वरूप प्राप्त संख्यात्मक मान परीक्षण परिणाम (या परीक्षण परिणाम) है। उदाहरण के लिए, 100 मीटर दौड़ एक परीक्षण है, दौड़ आयोजित करने की प्रक्रिया और समय परीक्षण है, और दौड़ का समय परीक्षण परिणाम है।

मोटर कार्यों पर आधारित परीक्षणों को मोटर या मोटर परीक्षण कहा जाता है। उनके परिणाम या तो मोटर उपलब्धियां (दूरी पूरी करने का समय, दोहराव की संख्या, तय की गई दूरी, आदि), या शारीरिक और जैव रासायनिक संकेतक हो सकते हैं।

कभी-कभी एक नहीं, बल्कि कई परीक्षणों का उपयोग किया जाता है जिनका एक ही अंतिम लक्ष्य होता है (उदाहरण के लिए, प्रतिस्पर्धी प्रशिक्षण अवधि के दौरान एथलीट की स्थिति का आकलन करना)। परीक्षणों के ऐसे समूह को परीक्षणों का सेट या बैटरी कहा जाता है।

समान विषयों पर लागू समान परीक्षण को समान परिस्थितियों में समान परिणाम देना चाहिए (जब तक कि विषय स्वयं नहीं बदल गए हों)। हालाँकि, सबसे कड़े मानकीकरण और सटीक उपकरणों के साथ भी, परीक्षण के परिणाम हमेशा कुछ हद तक भिन्न होते हैं। उदाहरण के लिए, एक विषय जिसने डेडलिफ्ट डायनेमोमेट्री परीक्षण में अभी-अभी 215 kG का परिणाम दिखाया है, जब दोहराया जाता है, तो केवल 190 kG दिखाता है।

परीक्षणों की विश्वसनीयता और इसे निर्धारित करने के तरीके एक परीक्षण की विश्वसनीयता समान परिस्थितियों में समान लोगों (या अन्य वस्तुओं) का बार-बार परीक्षण करने पर परिणामों की सहमति की डिग्री है।

परीक्षण-पुनः परीक्षण परिणामों में भिन्नता को व्यक्तिगत, या समूह के भीतर, या कक्षा के भीतर कहा जाता है। चार मुख्य कारण इस भिन्नता का कारण बनते हैं: 1. विषयों की स्थिति में परिवर्तन (थकान, प्रशिक्षण, "सीखना," प्रेरणा, एकाग्रता, आदि में परिवर्तन)। 2. बाहरी स्थितियों और उपकरणों में अनियंत्रित परिवर्तन (तापमान, हवा, आर्द्रता, विद्युत नेटवर्क में वोल्टेज, अनधिकृत व्यक्तियों की उपस्थिति, आदि), यानी, वह सब कुछ जो "यादृच्छिक माप त्रुटि" शब्द से एकजुट होता है।

चार मुख्य कारण इस भिन्नता का कारण बनते हैं: 3. परीक्षण का प्रबंधन करने वाले या स्कोर करने वाले व्यक्ति की स्थिति में बदलाव (और, निश्चित रूप से, एक प्रयोगकर्ता या न्यायाधीश का दूसरे द्वारा प्रतिस्थापन)। 4. परीक्षण की अपूर्णता (ऐसे परीक्षण हैं जो स्पष्ट रूप से अविश्वसनीय हैं। उदाहरण के लिए, यदि विषय बास्केटबॉल टोकरी में फ्री थ्रो कर रहे हैं, तो उच्च प्रतिशत हिट वाला बास्केटबॉल खिलाड़ी भी गलती से पहले थ्रो पर गलती कर सकता है ).

एक सच्चे परीक्षा परिणाम की अवधारणा एक अमूर्तता है (इसे प्रयोगात्मक रूप से मापा नहीं जा सकता है)। इसलिए, हमें अप्रत्यक्ष तरीकों का उपयोग करना होगा। विश्वसनीयता का आकलन करने के लिए सबसे पसंदीदा तरीका विचरण का विश्लेषण है जिसके बाद इंट्राक्लास सहसंबंध गुणांक की गणना की जाती है। भिन्नता का विश्लेषण हमें व्यक्तिगत कारकों के प्रभाव के कारण परीक्षण परिणामों में प्रयोगात्मक रूप से दर्ज भिन्नता को घटकों में विघटित करने की अनुमति देता है।

यदि हम किसी परीक्षण में विषयों के परिणामों को पंजीकृत करते हैं, इस परीक्षण को अलग-अलग दिनों में दोहराते हैं, और हर दिन कई प्रयास करते हैं, समय-समय पर प्रयोगकर्ताओं को बदलते हैं, तो भिन्नताएं होंगी: ए) विषय से विषय तक; एन बी) दिन-प्रतिदिन से; एन सी) प्रयोगकर्ता से प्रयोगकर्ता तक; और घ) प्रयास से प्रयास तक। भिन्नता का विश्लेषण इन विविधताओं को अलग करना और उनका मूल्यांकन करना संभव बनाता है। एन

इस प्रकार, परीक्षण की व्यावहारिक विश्वसनीयता का आकलन करने के लिए, सबसे पहले, विचरण का विश्लेषण करना आवश्यक है, और दूसरे, इंट्राक्लास सहसंबंध गुणांक (विश्वसनीयता गुणांक) की गणना करना आवश्यक है।

परीक्षणों की विश्वसनीयता के बारे में बोलते हुए, उनकी स्थिरता (पुनरुत्पादन), स्थिरता और तुल्यता के बीच अंतर करना आवश्यक है। n n परीक्षण स्थिरता का तात्पर्य समान परिस्थितियों में एक निश्चित समय के बाद दोहराए जाने पर परिणामों की पुनरुत्पादन क्षमता से है। बार-बार किए गए परीक्षण को आमतौर पर पुनः परीक्षण कहा जाता है। परीक्षण की निरंतरता को परीक्षण का संचालन या मूल्यांकन करने वाले व्यक्ति के व्यक्तिगत गुणों से परीक्षण के परिणामों की स्वतंत्रता की विशेषता है।

यदि किसी परीक्षण सेट में शामिल सभी परीक्षण अत्यधिक समतुल्य हैं, तो इसे सजातीय कहा जाता है। यह संपूर्ण परिसर मानव मोटर कौशल की एक संपत्ति को मापता है (उदाहरण के लिए, एक जटिल जिसमें लंबे समय तक खड़े रहना, ऊपर और ट्रिपल जंप शामिल है; गति-शक्ति गुणों के विकास के स्तर का आकलन किया जाता है)। यदि कॉम्प्लेक्स में कोई समतुल्य परीक्षण नहीं हैं, अर्थात, इसमें शामिल परीक्षण विभिन्न गुणों को मापते हैं, तो इसे विषम कहा जाता है (उदाहरण के लिए, एक कॉम्प्लेक्स जिसमें डेडलिफ्ट डायनेमोमेट्री, अबलाकोव जंप, 100 मीटर दौड़ शामिल है)।

परीक्षण की विश्वसनीयता में कुछ हद तक सुधार किया जा सकता है: n n n a) परीक्षण का अधिक कठोर मानकीकरण; बी) प्रयासों की संख्या में वृद्धि; ग) मूल्यांकनकर्ताओं (न्यायाधीशों, प्रयोगों) की संख्या बढ़ाना और उनकी राय की स्थिरता बढ़ाना; घ) समतुल्य परीक्षणों की संख्या बढ़ाना; ई) विषयों की बेहतर प्रेरणा।