इकाई-1: सांख्यिकीः अर्थ एवं उपयोग, सांख्यिकी के प्रकार, मनोवैज्ञानिक मापन में सांख्यिकी की सार्थकता (महत्व)
(Statistics: Meaning and Its Uses, Types of Statistics, Significance of Statistics in Psychological Measurement)
प्रश्न 1: सांख्यिकी को परिभाषित कीजिए। मनोविज्ञान एवं शिक्षा के क्षेत्र में सांख्यिकी के विभिन्न उपयोगों एवं महत्व पर विस्तार से प्रकाश डालिए। 💡
उत्तर:
सांख्यिकी गणित की एक महत्वपूर्ण शाखा है जिसका प्रयोग आजकल ज्ञान के लगभग सभी क्षेत्रों में किया जाता है, विशेषकर मनोविज्ञान और शिक्षा में इसका महत्व दिनों-दिन बढ़ता जा रहा है
सांख्यिकी का अर्थ (Meaning of Statistics) 📖
'सांख्यिकी' शब्द की उत्पत्ति लैटिन भाषा के शब्द 'Status', इटैलियन शब्द 'Statista' या जर्मन भाषा के शब्द 'Statistik' से हुई है
आधुनिक समय में, सांख्यिकी का अर्थ प्राचीन काल से बिल्कुल भिन्न है, हालाँकि आँकड़ों को एकत्र करने के अर्थ में इसका प्रयोग आज भी होता है
फरग्यूसन (1971) के अनुसार, "सांख्यिकी वैज्ञानिक विधियन्त्र की वह शाखा है जिसका सम्बन्ध सर्वेक्षणों और परीक्षणों द्वारा प्राप्त होने वाली सामग्री के संकलन, वर्गीकरण और व्याख्या से है"
मनोवैज्ञानिक एवं शिक्षा के क्षेत्र में सांख्यिकी के उपयोग एवं महत्व (Uses and Importance of Statistics in Psychology and Education) 🌟
आज सामाजिक विज्ञानों, विशेष रूप से मनोविज्ञान, शिक्षाशास्त्र और समाजशास्त्र में, सांख्यिकी का महत्व दिन-प्रतिदिन बढ़ता जा रहा है क्योंकि इन विषयों का स्वरूप अधिक वैज्ञानिक होता जा रहा है
प्रदत्तों के वर्णन में (In Describing Data) 📊: किसी समस्या के अध्ययन से प्राप्त आँकड़ों या प्रदत्तों का वर्णन करने में अनेक सांख्यिकी विधियाँ उपयोगी हैं
. उदाहरण के लिए, प्रदत्तों का आवृत्ति वितरण बनाना, उन्हें विभिन्न प्रकार के रेखाचित्रों (जैसे आवृत्ति बहुभुज, स्ताम्भाकृति, स्तम्भ चित्र, वृत्तचित्र, संचयी बारंबारता वक्र) द्वारा प्रदर्शित करना सांख्यिकी के माध्यम से संभव है . केंद्रीय प्रवृत्ति के मापों (मध्यमान, मध्यांक, बहुलांक) का उपयोग करके भी आँकड़ों का वर्णन किया जाता है . वर्णनात्मक सांख्यिकी विधियों से यह भी ज्ञात किया जा सकता है कि आँकड़ों की प्रकृति समवितरित है या नहीं, और उनमें विषमता या कुकुदता है या नहीं . प्रदत्तों के सहसंबंध के वर्णन में (In Describing Correlation of Data) 🤝: अनुसंधानकर्ता अक्सर दो या अधिक प्रकार के आँकड़ों या समूहों के बीच पारस्परिक संबंध का अध्ययन करना चाहता है, या यह जानना चाहता है कि वे किस सीमा तक एक-दूसरे से सहसंबंधित हैं
. इन प्रश्नों के उत्तर के लिए सांख्यिकी की सहसंबंध विधियों का उपयोग किया जाता है . प्रतिगमन और भविष्यकथन में (In Regression and Prediction) 🔮: सांख्यिकी की प्रतिगमन और भविष्यकथन से संबंधित विधियों का उपयोग तब किया जाता है जब अनुसंधानकर्ता एक घटना या चर से संबंधित ज्ञान के आधार पर किसी अन्य घटना या चर के संबंध में पूर्वानुमान लगाना चाहता है या भविष्यकथन करना चाहता है
. प्रतिगमन दो चरों के अपने मध्यमान से घटने-बढ़ने के बीच का अनुपात भी दर्शाता है . वैज्ञानिक परिकल्पनाओं के परीक्षण में (In Testing Scientific Hypotheses) ✅: वैज्ञानिक परिकल्पनाओं की जाँच में सांख्यिकी का महत्वपूर्ण उपयोग होता है
. जैसे, यह परीक्षण करना कि दस वर्ष के बच्चों में बुद्धि सामान्य रूप से वितरित होती है या नहीं, उपयुक्त सांख्यिकीय परीक्षणों (जैसे टी-परीक्षण, काई-वर्ग परीक्षण, प्रसरण विश्लेषण) की सहायता से किया जा सकता है . इससे यह पता चलता है कि परिकल्पना और प्रतिदर्श के बच्चों में प्राप्तांकों का वितरण एक-दूसरे के कितना अनुरूप है . प्रतिदर्श चयन में (In Sample Selection) 🎯: अनुसंधानकर्ता अक्सर पूरी जनसंख्या का अध्ययन करने के बजाय उसमें से कुछ अध्ययन इकाइयाँ चुन लेता है, जिन्हें प्रतिदर्श कहते हैं
. अध्ययन समस्या की प्रकृति के अनुसार, सांख्यिकी विधियों की सहायता से प्रतिनिधिपूर्ण प्रतिदर्श का चयन किया जाता है और प्रतिदर्श के आकार की गणना भी की जाती है . मनोविज्ञान और शिक्षा के क्षेत्र में अधिकांश अध्ययन प्रतिदर्श पर ही आधारित होते हैं, और सांख्यिकी इसमें सहायक होती है . साहचर्य के आधार पर कारण-कार्य संबंध में (In Cause-Effect Relationship Based on Association) 🔗: जब अनुसंधानकर्ता स्वतंत्र चर का परतंत्र चर पर पड़ने वाले प्रभाव या कारण-कार्य संबंध का अध्ययन करना चाहता है, तो वह सांख्यिकीय विधियों का सहारा लेता है
. उदाहरण के लिए, शिक्षा और आय में संबंध ज्ञात करने के लिए समूहों में अंतर की सार्थकता की जाँच और सहसंबंध की गणना करनी होती है . मापन और मनोवैज्ञानिक परीक्षणों में (In Measurement and Psychological Tests) 📏: मनोवैज्ञानिक मापन और परीक्षणों के निर्माण में सांख्यिकी विधियाँ अत्यंत उपयोगी हैं
. परीक्षणों के निर्माण में पदों का चयन करने, और परीक्षण बन जाने के बाद उसकी विश्वसनीयता और वैधता की गणना करने में सांख्यिकीय विधियों का महत्वपूर्ण योगदान है . सांख्यिकीय विधियों के बिना मनोवैज्ञानिक परीक्षणों का निर्माण असंभव है . शैक्षिक व अनुसंधान कार्यों में (In Educational and Research Works) 🎓: शिक्षा के उद्देश्यों, पाठ्यक्रमों, शिक्षण और मूल्यांकन विधियों में परिवर्तन की माँग को पूरा करने के लिए विभिन्न प्रकार के शैक्षिक परीक्षण और अनुसंधान कार्य किए जाते हैं
. सांख्यिकी की सहायता से इन कार्यों और परीक्षणों की विश्वसनीयता और प्रामाणिकता की जाँच की जाती है, जिससे त्रुटियों का ज्ञान होता है और उनकी उपयोगिता के बारे में भविष्यवाणी भी की जा सकती है .
रीशमैन (Reichmann) के अनुसार, "हम सांख्यिकी के युग में प्रवेश कर चुके हैं। प्राकृतिक घटना एवं मानव और अन्य क्रियाओं के लगभग प्रत्येक पहलू का अब सांख्यिकी के द्वारा मापन किया जाता है और तत्पश्चात् व्याख्या की जाती है"
प्रश्न 2: सांख्यिकी के विभिन्न प्रकारों का विस्तृत वर्णन कीजिए। प्राचलिक एवं अप्राचलिक सांख्यिकी के बीच अंतर स्पष्ट कीजिए। ⚖️
उत्तर:
सांख्यिकी को विभिन्न आधारों पर वर्गीकृत किया गया है, जिससे इसके अध्ययन और अनुप्रयोग में सुविधा होती है। मुख्य रूप से इसे प्रक्रिया की आधारभूत मान्यताओं और व्यावहारिक उपयोगिता के आधार पर वर्गीकृत किया जाता है
सांख्यिकी के प्रकार (Types of Statistics) 🗂️
I. प्रक्रिया की आधारभूत मान्यताओं के आधार पर (Based on Basic Assumptions of Process) 💡
इस आधार पर सांख्यिकी के दो मुख्य प्रकार हैं:
प्राचलिक सांख्यिकी (Parametric Statistics) 📊:
संबंध (Relation): इस सांख्यिकी का संबंध समष्टि (population) के किसी एक विशेष प्राचल (parameter) से होता है, और आँकड़ों के आधार पर प्राचल के संबंध में अनुमान लगाया जाता है
. आँकड़ों का स्वरूप (Nature of Data): इस प्रकार की सांख्यिकी में जिस प्रकार के आँकड़ों का विश्लेषण किया जाता है, वे प्रतिदर्श (sample) और सामान्य वितरण (normal distribution) से संबंधित होते हैं
. ये आँकड़े आमतौर पर मापन (measurement) से प्राप्त होते हैं, जैसे बुद्धि, ऊँचाई, बोध विस्तार, योग्यता आदि . मान्यताएँ (Assumptions): इसमें प्रतिदर्श की यादृच्छिकता (randomness) तथा विचरण की समजातीयता (homogeneity of variance) को वैध माना जाता है
. प्रेक्षण स्वतंत्र और निष्पक्ष होने चाहिए, अर्थात प्रतिदर्श का चयन यादृच्छिक विधि से होना चाहिए . अध्ययन किए जाने वाले चर का मापन अंतराल मापनी (interval scale) पर संभव होना चाहिए, जिससे गणितीय परिकलन जैसे जोड़ना, घटाना, गुणा करना आदि संभव हो सकें . उपयोग की विधियाँ (Methods of Use): इस प्रकार की सांख्यिकी में आँकड़ों की सार्थकता (significance) का अध्ययन मानक त्रुटि (Standard Error), टी-परीक्षण (t-Test), एनोवा (ANOVA), और संबंधित सांख्यिकी विधियों द्वारा किया जाता है
. प्रतिगमन की रैखिकता (linearity of regression) आदि के होने पर पियर्सन सहसंबंध गुणांक (Pearson's Product-Moment Correlation) की गणना भी वैध मानी जाती है .
अप्राचलिक सांख्यिकी (Non-Parametric Statistics) 📈:
संबंध (Relation): उपर्युक्त के अतिरिक्त, कुछ आँकड़े ऐसे भी होते हैं जहाँ न तो संयोगिक चयन होता है और न ही सामान्य वितरण
. इन आँकड़ों की संख्या कम होने के कारण उनका स्वरूप विकृत (distorted) होता है . इनकी एक विशेषता यह भी होती है कि इनका एक समष्टि के प्राचल से संबंध नहीं होता है . नाम (Alternative Name): इन्हें वितरण मुक्त सांख्यिकी (distribution-free statistics) भी कहते हैं, क्योंकि यह उस समष्टि के बारे में कोई विशेष शर्त नहीं रखती जिससे प्रतिदर्श लिया जाता है
. आँकड़ों का स्वरूप (Nature of Data): ये आँकड़े अक्सर गुणात्मक होते हैं, जैसे 'हाँ', 'नहीं', या 'उदासीन'; 'सफल', 'असफल' जैसे संवर्गों में विभाजित होते हैं
. ऐसे आँकड़े आमतौर पर वर्गीकृत संख्याओं या आवृत्तियों के रूप में होते हैं . इनकी संख्या आमतौर पर 30 से कम होती है, और इनका आधार यादृच्छिक प्रतिचयन या सामान्य वितरण नहीं होता है . मान्यताएँ (Assumptions): हालाँकि इन्हें 'वितरण-मुक्त' कहा जाता है, अप्राचलिक सांख्यिकी की भी अपनी मान्यताएँ होती हैं, जैसे प्रेक्षण निष्पक्ष और स्वतंत्र हों, चर में निरंतरता हो, और आँकड़े क्रमिक मापनी (ordinal scale) या नामित मापनी (nominal scale) पर प्राप्त हुए हों
. उपयोग की विधियाँ (Methods of Use): इस प्रकार की सांख्यिकी विधियों में कुछ प्रमुख हैं: मेडियन टेस्ट (Median Test), स्पीयरमैन का कोटि अंतर सहसंबंध (Spearman Rank-difference Correlation), काई-वर्ग टेस्ट (Chi-Square Test)
.
II. व्यावहारिक उपयोग प्रक्रिया के आधार पर (Based on Practical Application Process) 🛠️
इस आधार पर सांख्यिकी के दो मुख्य प्रकार बताए गए हैं:
वर्णनात्मक सांख्यिकी (Descriptive Statistics) 📝:
उद्देश्य (Purpose): इसका प्रयोग किसी समूह अथवा वर्ग के अंकात्मक वर्णन के लिए किया जाता है
. प्रक्रिया (Process): इस प्रकार की सांख्यिकी का प्रयोग प्रदत्तों के संकलन (collection), संगठन (organization), प्रस्तुतीकरण (presentation) एवं परिकलन (calculation) से होता है
. उपयोग (Application): वर्णनात्मक सांख्यिकी में प्रदत्तों का संकलन करके उन्हें सारणीबद्ध किया जाता है, और प्रदत्तों की विशेषता स्पष्ट करने के लिए कुछ सरल सांख्यिकीय मानों की गणना की जाती है
. जैसे: केंद्रीय प्रवृत्ति के मापक (Measures of Central Tendency): मध्यमान (Mean), मध्यांक (Median), बहुलांक (Mode) का प्रयोग समूह या वर्ग की केंद्रीय स्थिति जानने के लिए किया जाता है
. विचलन मापक (Measures of Variability): प्रसार (Range), चतुर्थक विचलन (Quartile Deviation), मध्यमान विचलन (Mean Deviation), मानक विचलन (Standard Deviation) आदि का उपयोग समूह की विचलनशीलता या समजातीयता/विषमजातीयता जानने के लिए किया जाता है
. सहसंबंध (Correlation): दो या दो से अधिक चरों के बीच संबंध का वर्णन किया जाता है
. आलेखीय चित्रण (Graphical Representation): आँकड़ों को सुस्पष्ट और आकर्षक ढंग से प्रदर्शित करने हेतु पाईचित्र (Pie Chart), दंड चित्र (Bar Diagram), आयत चित्र (Histogram), आवृत्ति बहुभुज (Frequency Polygon), ओगाइव (Ogive) आदि विधियों का उपयोग किया जाता है
. व्यक्ति की स्थिति (Individual Position): समूह में व्यक्ति की स्थिति को शततमक (percentile) तथा शततमक कोटि (percentile rank) आदि की सहायता से समझा जाता है
.
उदाहरण (Example): समूह के सदस्यों की लंबाई, भार, बौद्धिक स्तर, सामाजिक स्तर, शैक्षिक स्तर, साक्षरता तथा लड़के-लड़कियों का प्रतिशत ज्ञात करने, औसत ज्ञात करने, या विचलन और सहसंबंध ज्ञात करने के लिए इसका प्रयोग होता है
.
निष्कर्षात्मक सांख्यिकी (Inferential Statistics) 🧠:
उद्देश्य (Purpose): इसका प्रयोग अधिक बड़े समूहों से संबंधित समस्याओं के अध्ययन के लिए किया जाता है
. इस प्रकार की सांख्यिकी में प्रदत्तों के आधार पर समूह के संबंध में अनुमान लगाते हैं या निष्कर्ष निकालते हैं . नाम (Alternative Name): इसे प्रतिदर्शन निगमनात्मक सांख्यिकी (Sampling Inductive Statistics) भी कहते हैं
. प्रक्रिया (Process): बहुधा इस सांख्यिकी की सहायता से परिणामों की वैधता की जाँच की जाती है
. इसमें अनुमान के लिए अपेक्षाकृत उच्च सांख्यिकीय विधियों का प्रयोग किया जाता है, जैसे संभावना नियम (Probability Law), मानक त्रुटि (Standard Error), सार्थकता परीक्षण (Significance Test) आदि . अनुमान (Inference): चूंकि समूह विस्तृत होते हैं और उनके सदस्यों की संख्या अधिक होती है, अतः अध्ययनकर्ता अध्ययन के लिए इन बड़े समूहों से प्रतिदर्श चुनकर समस्या का अध्ययन करता है
. इस प्रकार प्रतिदर्श के अध्ययन से प्राप्त निष्कर्ष संपूर्ण समूह का प्रतिनिधित्व करते हैं . संक्षेप में, किसी समूह के संबंध में अनुमान लगाने और पूर्व कथन (prediction) से संबंधित सांख्यिकी को निष्कर्षात्मक सांख्यिकी कहते हैं .
प्राचलिक एवं अप्राचलिक सांख्यिकी के बीच अंतर (Difference Between Parametric and Non-Parametric Statistics) ↔️
ब्राडली (Bradley, 1968) ने अप्राचलिक सांख्यिकी की तुलना प्राचलिक सांख्यिकी से कई आधारों पर की है
विशेषताएँ (Features) | प्राचलिक सांख्यिकी (Parametric Statistics) | अप्राचलिक सांख्यिकी (Non-Parametric Statistics) |
1. व्युत्पत्ति की सरलता (Simplicity of Derivation) | इसकी व्युत्पत्ति के लिए गणित के क्षेत्र में विशेष स्तर की सक्षमता की आवश्यकता होती है | इसकी व्युत्पत्ति आसान है, अधिकांश अप्राचलिक सांख्यिकी मात्र समायोजी सूत्रों से आसानी से ज्ञात की जा सकती है |
2. अनुप्रयोग की सहजता (Ease of Application) | इसमें उच्च स्तर के गणितीय परिकलन की आवश्यकता होती है (जैसे Mean, SD, t-test, ANOVA) | इसमें कम जटिल गणितीय परिकलन (जैसे रैंकिंग, गिनती, जोड़, घटाव) की आवश्यकता होती है, जिससे इसे व्यवहार में लाना अधिक आसान है |
3. अनुप्रयोग की तीव्रता (Speed of Application) | जब प्रतिदर्श का आकार छोटा होता है, तब प्राचलिक सांख्यिकी का व्यवहारिक उपयोग धीमा हो सकता है | जब प्रतिदर्श का आकार छोटा होता है, तब इसका व्यवहारिक उपयोग प्राचलिक सांख्यिकी की अपेक्षा अधिक उपयुक्तता के साथ तेजी से किया जा सकता है |
4. अनुप्रयोग का क्षेत्र (Scope of Application) | इसकी पूर्वानुमानित मान्यताएँ या शर्तें काफी सख्त होती हैं, जिससे इसका उपयोग कुछ विशेष प्रतिदर्शों पर ही किया जा सकता है जो सामान्य वितरण पर आधारित हों | इसकी पूर्वानुमानित मान्यताएँ या शर्तें काफी कम सख्त होती हैं, जिससे इसका उपयोग भिन्न-भिन्न प्रकार के प्रतिदर्शों पर किया जा सकता है |
5. आंकड़ों के प्रकार (Types of Measurement) | इसके प्रयोग में अंतराल आंकड़े (Interval Data) या आनुपातिक आंकड़े (Ratio Data) की आवश्यकता होती है | इसके प्रयोग में अधिकतर क्रमसूचक आंकड़े (Ordinal Data) की आवश्यकता होती है, लेकिन कभी-कभी नामित आंकड़े (Nominal Data) पर भी इसका प्रयोग किया जा सकता है |
6. पूर्वानुमानों के अतिक्रमण की संभावना (Susceptibility to Assumptions) | इसकी बहुत अधिक पूर्वकल्पनाएँ होती हैं, जिससे शोधकर्ता द्वारा उनके अतिक्रमण की संभावना अधिक होती है | इसकी पूर्वकल्पनाएँ या अवधारणाएँ कम विस्तृत होती हैं, जिससे शोधकर्ता द्वारा अतिक्रमण करने की संभावना कम से कम होती है |
7. प्रतिदर्श के आकार का प्रभाव (Influence of Sample Size) | जब प्रतिदर्श का आकार 10 या उससे कम होता है, तब इसकी पूर्वकल्पनाओं की अवहेलना स्वाभाविक हो जाती है, जिससे यह कम उपयुक्त होता है | जब प्रतिदर्श का आकार 10 या उससे कम होता है, तब इसका प्रयोग प्राचलिक सांख्यिकी से अधिक आसान तथा तीव्र होता है |
8. सांख्यिकीय क्षमता (Statistical Efficiency) | जब प्रतिदर्श का आकार बड़ा होता है, तब इसकी सांख्यिकीय क्षमता अप्राचलिक सांख्यिकी से हमेशा अधिक होती है | व्यवहारिकता के हिसाब से, यह प्राचलिक सांख्यिकी की अपेक्षा अधिक सुविधाजनक है |
खण्ड 1: परिचय एवं वर्णनात्मक सांख्यिकी (Introduction and Descriptive Statistics)
इकाई-2: आवृत्ति वितरणः द्विचर आवृत्ति वितरण (Frequency Distribution: Bivariate Frequency Distribution)
प्रश्न 1: आँकड़ों के व्यवस्थापन का अर्थ एवं महत्व स्पष्ट कीजिए। मूल आँकड़ों के व्यवस्थापन के विभिन्न प्रकारों का विस्तृत वर्णन कीजिए। 📚
उत्तर:
अनुसंधान या अध्ययन से प्राप्त आँकड़े अक्सर अव्यवस्थित और अनियमित होते हैं। इन आँकड़ों से कोई सार्थक सूचना प्राप्त करने के लिए उन्हें व्यवस्थित और नियमित करना अत्यंत आवश्यक होता है। आँकड़ों का व्यवस्थापन सांख्यिकी का एक मूलभूत चरण है जो उन्हें सुगम और स्पष्ट बनाता है, जिससे उनका विश्लेषण और निर्वचन आसान हो सके।
आँकड़ों के व्यवस्थापन का अर्थ (Meaning of Data Organization) 🗃️
आँकड़ों के व्यवस्थापन से तात्पर्य संकलित समंकों (numerical data) को एक नियमित या व्यवस्थित ढंग से प्रस्तुत करने से है
वर्गीकरण (Classification): सर्वप्रथम आँकड़ों को समानता या सजातीयता (homogeneity) जैसे लिंग के आधार पर, धर्म के आधार पर या सामाजिक स्तर आदि के आधार पर वर्गीकृत किया जाता है
. सारणीयन (Tabulation): वर्गीकरण के बाद, आँकड़ों के पारस्परिक संबंध और प्रकृति को समझने के लिए सारणीयन किया जाता है
. रेखाचित्र प्रस्तुतीकरण (Graphical Presentation): अंततः, आँकड़ों को अधिक स्पष्ट रूप से समझने के लिए उनका प्रस्तुतीकरण रेखाचित्रों (graphs) द्वारा किया जाता है
.
आँकड़ों के व्यवस्थापन का महत्व (Importance of Data Organization) 🌟
व्यवस्थापन से निम्नलिखित उद्देश्यों की पूर्ति होती है, जो अनुसंधान को अधिक प्रभावी और समझने योग्य बनाते हैं:
व्यवस्थित एवं नियमित करना (Systematizing and Regularizing) 🎯: सर्वेक्षण द्वारा प्राप्त सांख्यिकीय आँकड़ों को आवृत्ति वितरण (frequency distribution) द्वारा व्यवस्थित तथा नियमित किया जा सकता है
. अव्यवस्थित और अनियमित आँकड़े वांछित सूचनाएँ प्रदान नहीं करते हैं, अतः उन्हें सुगम और स्पष्ट बनाने के लिए व्यवस्थित तथा नियमित करने से आँकड़े सार्थक बन जाते हैं और उन्हें सरलता से समझा जा सकता है . अर्थ ज्ञात करना (Understanding Meaning) 💡: आवृत्ति वितरण तालिका (frequency distribution table) बनाने के पश्चात्, केवल तालिका देखने मात्र से ही आँकड़ों का अर्थ ज्ञात किया जा सकता है
. स्वरूप समझना (Understanding Nature) 🧐: अव्यवस्थित आँकड़ों को व्यवस्थित करने से हम उनके स्वरूप को सरलता से समझ सकते हैं
. तुलनात्मक अध्ययन को सरल बनाना (Simplifying Comparative Study) ⚖️: आवृत्ति वितरण तालिका आँकड़ों के तुलनात्मक अध्ययन को सरल तथा स्पष्ट करता है
. सजातीय गुणों की स्पष्टता (Clarity of Homogeneous Qualities) 🔍: आँकड़ों के वर्गीकरण के बाद सारणीयन द्वारा उनके सजातीय गुण अधिक स्पष्ट हो जाते हैं
.
मूल आँकड़ों के व्यवस्थापन के प्रकार (Types of Raw Data Organization) 📝
शिक्षा के क्षेत्र में अध्ययनों तथा अनुसंधान से प्राप्त आँकड़े अक्सर विस्तृत तथा संख्या में अधिक होते हैं
साधारण व्यवस्था (Simple Arrangement) 🔢:
विधि (Method): यह व्यवस्थापन की सरलतम विधि है
. इसमें प्राप्तांकों को आरोही (ascending) या अवरोही (descending) क्रम में व्यवस्थित करते हैं . उपयोग (Use): इस विधि का प्रयोग तब किया जाता है जब प्राप्तांकों की संख्या कम हो
. फायदे (Advantages): प्राप्तांकों को एक क्रम में सजाने पर उनकी प्रकृति स्पष्ट हो जाती है
. उदाहरण के लिए, 15 बच्चों की ऊँचाई के अव्यवस्थित आँकड़े (जैसे 143, 156, 140, 148, 150, 149, 142, 148, 144, 150, 152, 148, 149, 141, और 145 सेमी) को आरोही क्रम में (जैसे 140, 141, 142, 143, 144, 145, 148, 148, 148, 149, 149, 150, 150, 152, 156) व्यवस्थित करने पर उनकी लम्बाई के फैलाव और किसी विशेष ऊँचाई तक के बच्चों की संख्या आसानी से बताई जा सकती है . सीमा (Limitation): इस विधि का सबसे बड़ा दोष यह है कि इससे अन्य सांख्यिकीय गणनाओं को करने में सुविधा नहीं होती है
.
आवृत्ति व्यवस्था (Frequency Array) 📊:
विधि (Method): इस विधि में प्राप्तांकों का व्यवस्थापन आवृत्तियों (frequencies) के आधार पर किया जाता है
. फायदे (Advantages): इस क्रिया से प्राप्तांकों की प्रकृति अधिक स्पष्ट हो जाती है
. यह विधि साधारण व्यवस्था विधि से श्रेष्ठ है . सामान्यतया यह व्यवस्था तब अधिक श्रेष्ठ है जब कुछ प्राप्तांकों की आवृत्ति बार-बार हुई हो . उपयोग (Use): इसका प्रयोग भी तभी किया जाना चाहिए जब प्राप्तांकों की संख्या कम हो
.
आवृत्ति वितरण (Frequency Distribution) 📈:
परिभाषा (Definition): किसी प्राप्तांक के बार-बार आने की प्रवृत्ति को आवृत्ति कहते हैं
. इन आवृत्तियों को सुविधानुसार भिन्न-भिन्न वर्गों में वितरित या प्रदर्शित करने की विधि को आवृत्ति वितरण कहते हैं . मिनियम किंग एवं बेचर के शब्दों में, "प्राप्त प्रदत्त के व्यवस्थापन की प्रक्रिया को आवृत्ति वितरण कहा जाता है" . तालिका बनाने की विधि (Method of Table Creation): आवृत्ति वितरण तालिका बनाने के लिए विभिन्न श्रेणियाँ होती हैं, जैसे खंडित श्रेणी (Discrete Series) और अखंडित श्रेणी (Continuous Series).
खंडित श्रेणी (Discrete Series): इसमें व्यक्तिगत मूल्य एक-दूसरे से निश्चित मात्रा में भिन्न होते हैं
. इस श्रेणी में केवल पदों की पुनरावृत्ति की संख्या गिनी जाती है . प्राप्तांकों की आवृत्ति को गिनने के लिए मिलान चिन्ह (tally marks) का प्रयोग किया जाता है, जहाँ प्रत्येक वर्ग में आने वाले एक पद के लिए एक तिरछी रेखा, और पाँचवें पद के लिए पिछली चार रेखाओं को काटती हुई एक रेखा खींची जाती है . अखंडित श्रेणी (Continuous Series): इसमें वर्गान्तर (Class Interval) का प्रयोग होता है
. वर्गान्तर बनाने से पहले प्रसार (Range - उच्चतम अंक और न्यूनतम अंक का अंतर) ज्ञात किया जाता है . वर्गान्तर बनाने की दो प्रमुख विधियाँ हैं: अपवर्जी या अतिव्यापी विधि (Exclusive or Overlapping Method): यहाँ किसी वर्ग अंतराल की उच्च सीमा बाद वाले अंतराल की निम्न सीमा के बराबर होती है (जैसे 0-10, 10-20)
. इसमें एक अंक को एक ही वर्ग में गिना जाता है (जैसे 0-20 में 0 से बड़े या बराबर, लेकिन 20 से छोटे अंक) . समावेशी या अनतिव्यापी विधि (Inclusive or Non-overlapping Method): यहाँ किसी भी वर्ग अंतराल की उच्च सीमा उसके बाद वाले वर्ग अंतराल की निम्न सीमा से अलग होती है (जैसे 0-9, 10-19)
. यहाँ वर्गों के बीच रिक्ति (gap) होती है . वर्ग अंतराल की लंबाई (वर्ग-आयाम) (उच्च सीमा - निम्न सीमा) + 1 के बराबर होती है .
संचयी बारंबारता (Cumulative Frequency): किसी वर्ग अंतराल के सामने उसकी संगत बारंबारता और पहले के वर्गों की बारंबारताओं का योगफल संचयी बारंबारता कहलाता है
.
व्यवस्थापन की ये विधियाँ आँकड़ों को सुव्यवस्थित करके उनका गहन विश्लेषण करने का मार्ग प्रशस्त करती हैं।
प्रश्न 2: द्विचर आवृत्ति वितरण क्या है? उदाहरण सहित इसके निर्माण की प्रक्रिया का विस्तार से वर्णन कीजिए। 📊
उत्तर:
सांख्यिकी में, जब दो चरों (variables) से संबंधित प्राप्तांकों को एक साथ व्यवस्थित और प्रस्तुत किया जाता है, तो इस प्रक्रिया को द्विचर आवृत्ति वितरण (Bivariate Frequency Distribution) कहा जाता है। यह हमें यह समझने में मदद करता है कि दो चर एक दूसरे से किस प्रकार संबंधित हैं या उनमें किस प्रकार का साहचर्य (association) है।
द्विचर आवृत्ति वितरण का अर्थ (Meaning of Bivariate Frequency Distribution) 📈
द्विचर आवृत्ति वितरण के अंतर्गत दो चरों से संबंधित प्राप्तांकों को संयुक्त रूप में व्यवस्थित किया जाता है
द्विचर आवृत्ति वितरण के निर्माण की प्रक्रिया (Process of Constructing Bivariate Frequency Distribution) 🛠️
द्विचर आवृत्ति वितरण के निर्माण में निम्नलिखित चरण शामिल होते हैं
अधिकतम और न्यूनतम प्राप्तांक ज्ञात करना (Finding Maximum and Minimum Scores) 🎯:
सर्वप्रथम, X चर (उदाहरण के लिए, बुद्धि लब्धि प्राप्तांक) और Y चर (उदाहरण के लिए, उपलब्धि प्रेरणा प्राप्तांक) दोनों के अधिकतम (maximum) और न्यूनतम (minimum) प्राप्तांक ज्ञात किए जाते हैं
. यह सीमा जानने से वर्गान्तरों का उचित निर्धारण करने में मदद मिलती है.
X चर के लिए वर्गान्तर निर्मित करना (Constructing Class Intervals for X-Variable) 📏:
X चर के न्यूनतम और अधिकतम प्राप्तांकों के आधार पर उपयुक्त वर्गान्तर (class intervals) निर्धारित किए जाते हैं.
इन वर्गान्तरों को तालिका में स्तंभ (column) के रूप में प्रदर्शित किया जाता है
. वर्गान्तर का आकार (class size) आमतौर पर 5, 10, या 15 जैसी सुविधाजनक संख्या ली जाती है
. यह सुनिश्चित किया जाता है कि न्यूनतम प्राप्तांक पहले वर्गान्तर में और अधिकतम प्राप्तांक अंतिम वर्गान्तर में समाहित हो जाए .
Y चर के लिए वर्गान्तर निर्मित करना (Constructing Class Intervals for Y-Variable) 📐:
इसी प्रकार, Y चर के न्यूनतम और अधिकतम प्राप्तांकों के आधार पर भी वर्गान्तर निर्मित किए जाते हैं
. इन वर्गान्तरों को तालिका में पंक्ति (row) के रूप में बायीं ओर प्रदर्शित किया जाता है
.
तालिका लेआउट स्थापित करना (Setting Up Table Layout) 📝:
X चर के वर्गान्तरों को शीर्ष पर क्षैतिज रूप से (स्तंभों के रूप में) और Y चर के वर्गान्तरों को बायीं ओर ऊर्ध्वाधर रूप से (पंक्तियों के रूप में) व्यवस्थित किया जाता है
. इससे एक ग्रिड जैसी संरचना बनती है, जिसमें प्रत्येक 'प्रकोष्ठ' (cell) X और Y चर के एक विशिष्ट वर्गान्तर के संयोजन का प्रतिनिधित्व करता है.
टैली चिन्ह अंकित करना (Marking Tally Marks) 🖊️:
प्रत्येक व्यक्ति के X चर और Y चर के प्राप्तांकों को एक साथ ध्यान में रखा जाता है.
उस व्यक्ति के X प्राप्तांक जिस वर्गान्तर में आता है, और उसके Y प्राप्तांक जिस वर्गान्तर में आता है, उन दोनों के प्रतिच्छेदन वाले प्रकोष्ठ में एक टैली चिन्ह (tally mark) अंकित किया जाता है
. यह प्रक्रिया सभी व्यक्तियों के लिए दोहराई जाती है
.
आवृत्तियाँ रिकॉर्ड करना (Recording Frequencies) 🔢:
सभी टैली चिन्हों को अंकित करने के बाद, प्रत्येक प्रकोष्ठ में कुल टैली चिन्हों की संख्या को गिना जाता है.
यह संख्या उस प्रकोष्ठ की आवृत्ति (frequency) होती है, जिसे टैली चिन्हों के स्थान पर लिखा जाता है
.
योगफल ज्ञात करना (Calculating Totals) ➕:
पंक्तियों और स्तंभों के अंतिम सिरे पर, प्रत्येक पंक्ति और स्तंभ की कुल आवृत्तियाँ (marginals) जोड़ी जाती हैं.
इन योगफलों को X चर और Y चर के कुल N (कुल व्यक्तियों की संख्या) से मिलान किया जाता है, जिससे यह सुनिश्चित हो सके कि कोई भी प्राप्तांक छूटा नहीं है
.
उदाहरण (Example):
मान लीजिए, 50 छात्रों के बुद्धि लब्धि प्राप्तांक (X चर) और उपलब्धि प्रेरणा प्राप्तांक (Y चर) दिए गए हैं
X चर (बुद्धि लब्धि): न्यूनतम 86, अधिकतम 128
. वर्गान्तर 5 का लेते हैं, जैसे (85-89), (90-94), ..., (125-129) . Y चर (उपलब्धि प्रेरणा): न्यूनतम 41, अधिकतम 68
. वर्गान्तर 5 का लेते हैं, जैसे (40-44), (45-49), ..., (65-69) .
अब, यदि छात्र 1 का बुद्धि लब्धि प्राप्तांक 101 और उपलब्धि प्रेरणा प्राप्तांक 56 है
बुद्धि लब्धि (X) 101, वर्गान्तर (100-104) में आता है
. उपलब्धि प्रेरणा (Y) 56, वर्गान्तर (55-59) में आता है
. अतः, (100-104) X वर्गान्तर और (55-59) Y वर्गान्तर के प्रतिच्छेदन वाले प्रकोष्ठ में एक टैली चिन्ह अंकित किया जाएगा
.
इसी प्रकार, सभी 50 छात्रों के प्राप्तांकों के लिए टैली चिन्ह अंकित किए जाते हैं, और फिर उन्हें आवृत्तियों में परिवर्तित करके नीचे दी गई तालिका के समान एक द्विचर आवृत्ति वितरण तालिका (या प्रकीर्णन चित्र) बनाई जाती है
उपलब्धि प्रेरणा (Y चर) | बुद्धिलब्धि (X चर) (C.I.) | f(y) |
वर्गान्तर (C.I.) | 80-89 | 90-94 |
65-69 | ||
60-64 | II (2) | II (2) |
55-59 | I (1) | III (3) |
50-54 | I (1) | |
45-49 | ||
40-44 | I (1) | |
f(x) | 4 | 6 |
इकाई-3: समूह प्रदत्त का आलेखीय निरूपण- आवृत्ति बहुभुज, स्ताम्भाकृति, स्तम्भ चित्र
(Graphical Representation of Group Data: Frequency Polygon, Histogram, Bar diagram)
प्रश्न 1: आँकड़ों के आलेखीय निरूपण से आप क्या समझते हैं? इसके महत्व एवं आलेख बनाने की रीति का विस्तार से वर्णन कीजिए। 📈
उत्तर:
आँकड़े, चाहे वे लिखित हों या मौखिक, अंकों में हों या ग्रेड में, उनकी व्याख्या करने के लिए उन्हें सार्थक ढंग से सारणीबद्ध करना आवश्यक होता है
आँकड़ों का आलेखीय निरूपण का अर्थ (Meaning of Graphical Representation of Data) 📊
आँकड़ों का आलेखीय निरूपण आंकड़ों को चित्रों या रेखाचित्रों के रूप में प्रस्तुत करने की एक विधि है
आलेखीय निरूपण का महत्व (Importance of Graphical Representation) 🌟
आँकड़ों का आलेखीय निरूपण कई मायनों में महत्वपूर्ण है:
समझने में सरलता (Ease of Understanding) 💡: जटिल और शुष्क आँकड़ों को आलेखीय रूप में प्रस्तुत करने से वे अधिक बोधगम्य और आकर्षक बन जाते हैं
. एक नज़र में ही दर्शक महत्वपूर्ण रुझानों और पैटर्न को समझ सकता है . तुलनात्मक विश्लेषण (Comparative Analysis) ⚖️: विभिन्न समूहों या समय-अवधियों के आँकड़ों की तुलना चित्रों के माध्यम से अधिक प्रभावी ढंग से की जा सकती है
. उदाहरण के लिए, विभिन्न जातियों की कामकाजी महिलाओं की व्यावसायिक समस्याओं का तुलनात्मक अध्ययन दंड-चित्र द्वारा आसानी से किया जा सकता है . याद रखने में आसानी (Easier to Remember) 🧠: दृश्य प्रस्तुतियाँ लिखित या मौखिक जानकारी की तुलना में अधिक समय तक याद रहती हैं.
निर्णय लेने में सहायक (Aid in Decision Making) ✅: स्पष्ट और संक्षेप में प्रस्तुत आँकड़े, निर्णय निर्माताओं को तेजी से और सटीक निर्णय लेने में मदद करते हैं
. समय की बचत (Time Saving) ⏳: लंबी सारणियों और विस्तृत विवरणों को पढ़ने में लगने वाले समय की बचत होती है, क्योंकि चित्र जानकारी को तुरंत संप्रेषित करते हैं.
प्रभावी संचार (Effective Communication) 🗣️: यह जानकारी को बड़े दर्शकों तक प्रभावी ढंग से पहुँचाने का एक शक्तिशाली माध्यम है, भले ही वे सांख्यिकी के विशेषज्ञ न हों
. अध्ययन और विश्लेषण का आधार (Basis for Study and Analysis) 🔍: प्रदत्तों को सजीव बनाने, उनके विश्लेषण तथा अध्ययन के लिए रेखाचित्र की आवश्यकता पड़ती है
.
आलेख (रेखाचित्र) बनाने की रीति (Method of Drawing Graphs) 📏
आलेख बनाते समय कुछ प्रमुख नियमों पर विशेष ध्यान देना चाहिए
अक्षों का निर्धारण (Determining Axes) ↔️: स्वतंत्र चल राशि (Independent Variable) को X-अक्ष (भुजाक्ष) पर तथा परतंत्र चल राशि (Dependent Variable) को Y-अक्ष (कोटि अक्ष) पर प्रदर्शित करना चाहिए
. 0 को उस बिंदु पर अंकित करें या लिखें, जहाँ दोनों रेखाएं परस्पर काटती हैं . अनुपात और आकार (Ratio and Size) 📐: X-अक्ष Y-अक्ष की अपेक्षा बड़ी होनी चाहिए
. विद्वानों के अनुसार ऊँचाई तथा लम्बाई के मध्य 3:4 का अनुपात होना चाहिए . इससे बनने वाली आवृत्ति आकर्षक एवं प्रभावशाली होगी . सही रेखाचित्र का चुनाव (Choosing the Right Graph) 🎯: एक विशेष प्रदत्त सामग्री के लिए वही रेखाचित्र बनाना चाहिए जो उसके सही अर्थ को स्पष्ट कर सके
. उदाहरण के लिए, गुणात्मक आँकड़े दंड चित्र द्वारा प्रस्तुत किए जा सकते हैं, जबकि संख्यात्मक आँकड़े बारंबारता आयत, बारंबारता बहुभुज या संचयी बारंबारता वक्र द्वारा प्रस्तुत किए जाते हैं . नामांकन और पैमाना (Labeling and Scale) 🏷️: रेखाचित्र नामांकित होना चाहिए तथा उस पर उसका सही-सही पैमाना (scale) बना होना चाहिए
. पैमाना ऐसा निर्धारित करना चाहिए कि अधिकतम आवृत्तियों की रेखा की ऊँचाई आयत चित्र की ऊँचाई का 75 प्रतिशत हो . रेखाचित्र पैमाने के अनुसार बना हुआ होना चाहिए अर्थात् रेखाचित्र की माप सही होनी चाहिए . आकर्षक प्रस्तुति (Attractive Presentation) ✨: रेखाचित्र आकर्षक होना चाहिए
. मनोविज्ञान और शिक्षा में प्रयुक्त सांख्यिकी में बहुधा प्रथम पाद (positive quadrant) का ही प्रयोग किया जाता है, अर्थात धनात्मक मूल्य वाले क्षेत्र का ही प्रयोग किया जाता है .
इन नियमों का पालन करके, आँकड़ों का आलेखीय निरूपण न केवल जानकारी को प्रभावी ढंग से संप्रेषित करता है बल्कि उसे समझने और याद रखने में भी मदद करता है।
प्रश्न 2: बारंबारता आयत (हिस्टोग्राम) और दंड चित्र (बार डायग्राम) को परिभाषित कीजिए। उपयुक्त उदाहरणों की सहायता से उनके निर्माण की विधि और उपयोगों में अंतर स्पष्ट कीजिए। 📊
उत्तर:
आँकड़ों के आलेखीय निरूपण में बारंबारता आयत और दंड चित्र दो महत्वपूर्ण और व्यापक रूप से उपयोग किए जाने वाले तरीके हैं। हालांकि दोनों ही आयतों का उपयोग करते हैं, उनके अंतर्निहित डेटा के प्रकार और प्रस्तुति के तरीके में महत्वपूर्ण अंतर होते हैं।
बारंबारता आयत (Histogram) की परिभाषा (Definition of Histogram) 📈
सिस्पसन और काफ्का (1965) के अनुसार, सांख्यिकी में स्तम्भाकृति (histogram) का तात्पर्य उस ग्राफ से है जिसमें आवृत्तियों को खड़े हुए आयतों के द्वारा प्रदर्शित किया जाता है
बारंबारता आयत के निर्माण की विधि (Method of Constructing Histogram) 🛠️
बारंबारता आयत बनाते समय निम्नलिखित पदों को ध्यान में रखना चाहिए:
अक्षें खींचना (Drawing Axes) 📏: दो सीधी रेखाएं एक-दूसरे के लम्बवत् खींचनी चाहिए
. इनमें से कोटि अक्ष (Y-axis) ग्राफ कागज के बाएं सिरे की ओर तथा भुजाक्ष (X-axis) ग्राफ कागज की तली पर खींचनी चाहिए . 0 वहाँ पर अंकित करें या लिखें, जहाँ दोनों रेखाएं परस्पर काटती हैं . वर्गान्तर अंकित करना (Marking Class Intervals) 🔢: भुजाक्ष (X-axis) पर आवृत्ति वितरण अंक अर्थात वर्गान्तर एक निश्चित दूरी के अंतर पर लिखने चाहिए
. इस कार्य के लिए वर्गान्तर की यदि शुद्ध सीमाएं (true limits) ली जाएं तो अति उत्तम होगा . आवृत्तियाँ अंकित करना (Marking Frequencies) 📊: कोटि अक्ष (Y-axis) पर आवृत्तियाँ अंकित करनी चाहिए
. अक्ष का मापक ऐसा निर्धारण करना चाहिए कि अधिकतम आवृत्तियों की रेखा की ऊँचाई आयत चित्र की ऊँचाई का 75 प्रतिशत हो . आयत खींचना (Drawing Rectangles) ✏️: इसके पश्चात् आयत खींचने चाहिए
. इस प्रकार सभी वर्गान्तरों के आयत आपस में एक-दूसरे से जुड़े रहते हैं . यदि वर्गान्तर समावेगी (inclusive) हैं तो पहले उन्हें अपवर्जी (exclusive) बना लेना चाहिए . बारंबारता आयत चित्र का क्षेत्रफल समस्त आवृत्तियों का प्रतिनिधित्व करता है .
उदाहरण (Example):
निम्न बारंबारता बंटन का बारंबारता आयत बनाएं: | वर्ग अन्तराल | 35-40 | 30-35 | 25-30 | 20-25 | 15-20 | 10-15 | 5-10 | | :---------- | :---- | :---- | :---- | :---- | :---- | :---- | :--- | | बारंबारता | 2 | 3 | 5 | 6 | 4 | 3 | 2 |
X-अक्ष पर वर्ग अंतराल (5-10, 10-15, ..., 35-40) की शुद्ध सीमाएं (जैसे 4.5-9.5, 9.5-14.5, आदि) चिह्नित की जाएंगी।
Y-अक्ष पर बारंबारता (1 से 6 तक) अंकित की जाएंगी।
प्रत्येक वर्ग अंतराल के ऊपर उसकी संगत बारंबारता के अनुसार आयत खींचे जाएंगे, जो एक-दूसरे से सटे होंगे।
दंड चित्र या दण्डालेख (Bar Diagram) की परिभाषा (Definition of Bar Diagram) 棒
दंड चित्र सांख्यिकीय आँकड़ों की आपेक्षिक स्थिति को दर्शाने के लिए एक सरल आलेख है
दंड चित्र के निर्माण की विधि (Method of Constructing Bar Diagram) 🛠️
अक्षें खींचना (Drawing Axes) 📏: दो अक्षें (X और Y) खींची जाती हैं।
श्रेणियाँ अंकित करना (Marking Categories) 🏷️: X-अक्ष पर विभिन्न श्रेणियाँ (जैसे जातियाँ, व्यावसायिक समस्याएं) अंकित की जाती हैं
. मूल्य अंकित करना (Marking Values) 📊: Y-अक्ष पर संबंधित मान (जैसे औसत व्यावसायिक समस्या) अंकित किए जाते हैं
. दंड खींचना (Drawing Bars) ✏️: प्रत्येक श्रेणी के लिए उसकी संगत मान के अनुसार एक दंड खींचा जाता है. ये दंड एक-दूसरे से अलग-अलग (गैर-सटे हुए) होते हैं, जो श्रेणियों की असतत प्रकृति को दर्शाते हैं. दंडों के बीच समान दूरी रखी जाती है
.
उदाहरण (Example):
निम्नलिखित समंकों के आधार पर विभिन्न जाति की कामकाजी महिलाओं की व्यावसायिक समस्याओं का दंड-चित्र बनाइये: | कामकाजी महिलाओं की जाति | वैश्य | ब्राह्मण | कायस्थ | क्षत्रिय | दलित | पिछड़ी जाति | | :---------------------- | :--- | :------ | :----- | :----- | :---- | :---------- | | व्यावसायिक समस्या औसत | 40 | 43 | 33 | 35 | 48 | 49 |
X-अक्ष पर जातियाँ (वैश्य, ब्राह्मण, कायस्थ, आदि) प्रदर्शित की जाएंगी
. Y-अक्ष पर औसत व्यावसायिक समस्या (0 से 50 तक) प्रदर्शित की जाएगी
. प्रत्येक जाति के लिए उसकी औसत समस्या के अनुसार एक अलग दंड खींचा जाएगा. दंडों के बीच समान खाली जगह होगी.
बारंबारता आयत और दंड चित्र में अंतर (Difference Between Histogram and Bar Diagram) ↔️
विशेषताएँ (Features) | बारंबारता आयत (Histogram) | दंड चित्र (Bar Diagram) |
1. डेटा का प्रकार (Type of Data) | सतत डेटा (Continuous data) जैसे वर्ग अंतराल या मापें. | असतत या गुणात्मक डेटा (Discrete or Qualitative data) जैसे श्रेणियाँ या विशेषताएँ. |
2. दंडों की निरंतरता (Continuity of Bars) | दंड एक-दूसरे से सटे होते हैं, क्योंकि डेटा निरंतर होता है. | दंड एक-दूसरे से अलग-अलग होते हैं, उनके बीच खाली जगह होती है. |
3. उपयोग (Usage) | आवृत्ति वितरण को दर्शाने के लिए, जहाँ डेटा का फैलाव महत्वपूर्ण है. | विभिन्न श्रेणियों के बीच तुलना करने के लिए, जहाँ मात्रात्मक मूल्य होते हैं. |
4. अर्थ (Meaning) | प्रत्येक आयत का क्षेत्रफल संबंधित वर्ग अंतराल की आवृत्ति को दर्शाता है. | प्रत्येक दंड की लंबाई श्रेणी के मूल्य को दर्शाती है. |
5. उदाहरण (Example) | आयु वर्ग के अनुसार छात्रों की संख्या, ऊँचाई वर्ग के अनुसार व्यक्तियों की संख्या. | विभिन्न देशों की जनसंख्या, विभिन्न विभागों की बिक्री. |
प्रश्न 1: केंद्रीय प्रवृत्ति के मापों का अर्थ स्पष्ट कीजिए। मध्यमान, मध्यांक और बहुलांक की विशेषताओं, उपयोगों और सीमाओं का तुलनात्मक वर्णन कीजिए। ⚖️
उत्तर:
केंद्रीय प्रवृत्ति के माप सांख्यिकीय प्रदत्तों का वर्णन करने के लिए उपयोग किए जाने वाले महत्वपूर्ण सांख्यिकीय उपकरण हैं। ये माप हमें एक अंक समूह के केंद्र या औसत मूल्य के बारे में जानकारी प्रदान करते हैं।
केंद्रीय प्रवृत्ति के मापों का अर्थ (Meaning of Measures of Central Tendency) 💡
केंद्रीय प्रवृत्ति का अर्थ उस मान से है जिसके चारों ओर समूह के सभी अंक छाए रहते हैं
मध्यमान (Mean) 🧠
मध्यमान अंकगणितीय औसत है। यह वितरण में सभी अंकों का योग करके उनकी संख्या से भाग देने पर प्राप्त होता है
विशेषताएँ (Characteristics) ✨:
मध्यमान के परिकलन में सभी मापों अथवा प्रेक्षणों का उपयोग किया जाता है
. वितरण का प्रत्येक प्राप्तांक मध्यमान की स्थिति को प्रभावित करता है . मध्यमान सभी प्राप्तांकों के संतुलन बिंदु या गुरुत्व केंद्र को दर्शाता है
. किसी भी प्रतिदर्श में सभी माप मध्यमान के दोनों ओर पूर्ण रूप से संतुलित होते हैं . किसी दिए गए वितरण के छोरों पर स्थित प्राप्तांक मध्यमान के मान को सर्वाधिक प्रभावित करते हैं
. मध्यमान की उच्च विश्वसनीयता तथा आनुमानिक सांख्यिकी में उपयोगिता के कारण इसे प्राथमिकता दी जाती है
. मध्यमान दिए गए समूह के सभी सदस्यों के औसत निष्पादन का द्योतक है
. दिए हुए वितरण के सभी प्राप्तांकों में एक निश्चित राशि जोड़ने अथवा घटाने से मध्यमान का मान भी क्रमशः निश्चित राशि के बराबर बढ़ अथवा घट जाएगा
. दिए हुए वितरण के सभी प्राप्तांकों को एक निश्चित राशि से गुणा करने पर मध्यमान का मान भी निश्चित राशि के गुणनफल के बराबर हो जाएगा
.
उपयोग (Uses) 🎯:
जब सबसे अधिक विश्वसनीय केंद्रीय प्रवृत्ति का पता लगाना हो
. जब वितरण सामान्य हो अर्थात् जब दी हुई अंक श्रृंखला के समस्त अंक समान रूप से वितरित हों
. जब वितरण के प्रत्येक अंक को महत्व देना हो
. अन्य सांख्यिकीय मूल्यों जैसे बहुलांक, प्रामाणिक विचलन, सहसंबंध गुणांक आदि की गणना करनी हो
. समूह के निष्पादनों की सही तथा शुद्ध तुलना की जानी हो
.
सीमाएँ (Limitations) 🚧:
जब कुछ प्रेक्षण अन्य प्रेक्षणों की तुलना में बहुत बड़े अथवा छोटे हों, तो बंटन का मध्यमान भ्रामक सिद्ध हो सकता है
. जब दिया हुआ अंक वितरण अपूर्ण या मुक्त छोरों वाला हो, तब भी मध्यमान का प्रयोग नहीं किया जा सकता है
.
मध्यांक (Median) 📏
मध्यांक से आशय उस बिंदु या अंक से है जो क्रम में व्यवस्थित समस्त बंटन को दो समान भागों में बाँट दे
विशेषताएँ (Characteristics) ✨:
मध्यांक आँकड़ों के उस केंद्रीय बिंदु को बताती है जिसके ऊपर और नीचे आधे-आधे प्राप्तांक स्थित होते हैं
. किसी वितरण के छोरों के प्राप्तांक मध्यांक के मान को ज्यादा प्रभावित नहीं करते हैं
. मध्यांक की मानक त्रुटि मध्यमान की मानक त्रुटि से अधिक परन्तु बहुलांक की मानक त्रुटि से कम होती है
. मध्यांक की गणना क्रमीय स्तर के लिए अधिक उपयुक्त है
.
उपयोग (Uses) 🎯:
जब दिया गया बंटन अपूर्ण हो
. जब अंक सामग्री का वास्तविक मध्य बिंदु ज्ञात करना हो
. जब वितरण असामान्य हो
. जब अपेक्षाकृत कम शुद्ध केंद्रीय प्रवृत्ति के मान की आवश्यकता हो
. जब बहुलांक ज्ञात करना हो
. जब श्रृंखला के आरंभ के तथा अंत के अंक मध्यमान को प्रभावित करते हों, तो ऐसी स्थिति में मध्यांक निकालना चाहिए
.
सीमाएँ (Limitations) 🚧:
मध्यांक का मान समस्त प्रेक्षणों पर आधारित नहीं होता है और उनके संख्यात्मक मानों की उपेक्षा करता है
. इसका उपयोग बंटन के गुरुत्व केंद्र के रूप में नहीं किया जा सकता
. इसका उपयोग आनुमानिक सांख्यिकीय विश्लेषण के लिए भी नहीं हो सकता है
.
बहुलांक (Mode) ⛰️
अव्यवस्थित आँकड़ों में बहुलांक वह संख्या है जो सबसे अधिक बार आती है
विशेषताएँ (Characteristics) ✨:
केंद्रीय प्रवृत्ति के मापों में बहुलांक सबसे कम शुद्ध और कम विश्वसनीय मान है
. बहुलांक की गणना मध्यमान तथा मध्यांक की गणना की अपेक्षा अधिक सरल है
. अव्यवस्थित आँकड़ों में बहुलांक की स्थिति निश्चित नहीं होती है. ऐसे आँकड़ों में एक से अधिक बहुलांक होते हैं
. केंद्रीय प्रवृत्ति के माप के रूप में सर्वाधिक प्ररूपी मान की आवश्यकता होने पर बहुलांक का प्रयोग किया जाता है
. उदाहरण के लिए, कक्षा में सर्वाधिक प्रिय बालक, व्यावसायिक पाठ्यक्रमों के विषय में विद्यार्थियों की सर्वाधिक मान्य धारणा, लोकप्रिय फैशन या संबंधित समस्या का अध्ययन करने में .
उपयोग (Uses) 🎯:
जब केवल निरीक्षण मात्र से ही केंद्रीय प्रवृत्ति की गणना करनी हो
. जब सबसे कम शुद्ध तथा सबसे कम विश्वसनीय केंद्रीय प्रवृत्ति के मान की गणना करनी हो
. जब आँकड़े पूर्ण न हों या बंटन विषम हों
.
सीमाएँ (Limitations) 🚧:
बहुलांक अन्य केंद्रीय मापकों की अपेक्षा कम शुद्ध मान है
. छोटे वितरण में बहुलांक का प्रयोग उपयुक्त नहीं होता है
. शुद्ध बहुलांक की गणना कठिन होती है
.
निष्कर्ष (Conclusion) ✅
मध्यमान, मध्यांक तथा बहुलांक बहुत सी बातों के आधार पर एक-दूसरे से भिन्न होते हैं
प्रश्न 2: विचलनशीलता (Variability) के संप्रत्यय को परिभाषित कीजिए। विचलन के विभिन्न मापों - प्रसार, चतुर्थक विचलन, मध्यक विचलन और मानक विचलन - का तुलनात्मक विश्लेषण उनके गुणों, दोषों और उपयोगों के आधार पर कीजिए। 📉
उत्तर:
केंद्रीय प्रवृत्ति के माप हमें प्रदत्तों के केंद्र के बारे में बताते हैं, लेकिन वे हमें यह जानकारी नहीं देते कि प्रदत्त केंद्र के चारों ओर कितनी दूर तक फैले हुए हैं। इस फैलाव को समझने के लिए विचलनशीलता के मापों का उपयोग किया जाता है।
विचलनशीलता का संप्रत्यय (Concept of Variability) 💡
विचलनशीलता का अर्थ प्राप्तांकों का वितरण या फैलाव से है, यह फैलाव प्राप्तांकों की केंद्रीय प्रवृत्ति के चारों ओर होता है
विचलन मान को ज्ञात करने की निम्नलिखित चार विधियाँ या माप हैं जिनका प्रयोग शिक्षा और मनोविज्ञान के क्षेत्रों में होता है: प्रसार (Range), चतुर्थक विचलन (Quartile Deviation), मध्यक विचलन (Mean Deviation), और मानक विचलन (Standard Deviation)
1. प्रसार (Range) ↔️
प्रसार विचलन वितरण का विचलन ज्ञात करने की सबसे सरल विधि है
गुण (Merits) ✨:
प्रसार विचलनशीलता का सबसे सरल मापन है
. इसकी गणना बहुत सरल है
. बहुधा इसका प्रयोग आवृत्ति वितरण बनाने में किया जाता है
.
दोष (Demerits) 🚧:
यह केवल उच्चतम तथा निम्नतम मूल्यों की ही गणना करता है
, इसलिए यह कम विश्वसनीय विचलन माप है . प्रसार पर प्रतिदर्श परिवर्तन का प्रभाव पड़ता है
. यह एक प्रतिनिधित्वपूर्ण मापन नहीं है, क्योंकि यह समस्त मूल्यों पर आधारित नहीं होता है
. प्रसार से दो समूहों की तुलना का केवल अपूर्ण ज्ञान प्राप्त होता है
.
उपयोग (Uses) 🎯:
जब अंक बहुत फैले हों तथा विचलन के अन्य मापनों की गणना संभव न हो
. जब किसी वितरण के विचलन का सरलता और अति शीघ्रता से पता लगाना हो
. जब विचलनशीलता के एक अनुमानित मापन की गणना करनी हो
. जब केवल सीमांत मूल्यों का अंतर ज्ञात करना हो
.
2. चतुर्थक विचलन (Quartile Deviation - QD) 📈
चतुर्थक विचलन Q किसी भी अंक श्रृंखला के प्रथम चतुर्थांश Q1 तथा तृतीय चतुर्थांश Q3 के मध्य के अंतर का आधा होता है
गुण (Merits) ✨:
चतुर्थक विचलन की गणना करना आसान होता है
. इसके मूल्य पर सीमांत मूल्यों का कम प्रभाव पड़ता है
. असमान वर्ग वितरण में इसकी गणना करना संभव है
. यह क्रमिक स्तर के प्राप्तांकों के लिए अधिक उपयोगी है
. गुण, रचना तथा गणना में इसका संबंध मध्यांक से है
.
दोष (Demerits) 🚧:
यह केवल बीच के 50 प्रतिशत प्राप्तांकों के विचलन का ही अध्ययन करता है
. इसमें किसी भी प्रकार के औसत की गणना नहीं की जाती है और न ही विचलन ज्ञात किया जाता है
. यह एक अविश्वसनीय मापन है
. यह सभी मूल्यों पर आधारित नहीं है
.
उपयोग (Uses) 🎯:
जब केंद्रीय मापकों में मध्यांक की गणना की गई हो
. जब प्राप्तांकों का वितरण सामान्य हो
. जब प्रतिदर्श छोटा हो
. जब अंक वितरण अपूर्ण हो, अर्थात् उसमें बीच-बीच में गैप हो
. जब वितरण के अंकों का फैलाव अधिक हो अथवा सीमांत प्राप्तांक हों, जो मानक विचलन को अनावश्यक रूप से प्रभावित करते हों
.
3. मध्यक विचलन (Mean Deviation - MD) ↔️
मध्यक विचलन (Average Deviation) को औसत विचलन या मध्यमान विचलन भी कहते हैं
गुण (Merits) ✨:
यह विचलन का एक ऐसा माप है, जो श्रृंखला के समस्त मूल्यों पर निर्भर करता है
. मध्यक विचलन की गणना सीमांत के अंक से कम प्रभावित होती है
. इसकी गणना करना सरल है
. इसको सरलता से समझा जा सकता है
. सभी मूल्यों पर आधारित होने के कारण इसे प्रतिनिधित्वपूर्ण मापन कहा जा सकता है
.
दोष (Demerits) 🚧:
गणितीय दृष्टिकोण से यह शुद्ध नहीं है, क्योंकि इसमें धन तथा ऋण चिन्हों को महत्व नहीं दिया जाता है
. अतः यह एक अनिश्चित माप है .
उपयोग (Uses) 🎯:
जब मध्यमान से सभी विचलनों को उनके आकार के अनुसार भार प्रदान करना हो
. जब वितरण बहुत अधिक विषम हों
. जब सीमांत मूल्य प्रमाप विचलन (S.D.) को प्रभावित करते हों
. जब सरलता और शीघ्रता से विचलनशीलता के मापन की गणना करनी हो
. जब वितरण के मध्यमान के दोनों ओर के प्राप्तांकों का समान रूप से विचलन ज्ञात करना हो
.
4. मानक विचलन (Standard Deviation - SD) 📊
विचलनशीलता के विभिन्न मापों में सबसे अधिक प्रयोग में आने वाला माप प्रामाणिक विचलन है
गुण (Merits) ✨:
प्रामाणिक विचलन की गणना सभी मूल्यों पर निर्भर करती है
. यह श्रृंखला के प्रत्येक अंक की सही स्थिति के लिए संवेदनशील होता है
. यदि किसी मूल्य को मध्यमान से दूर हटा दिया जाए, तो प्रामाणिक विचलन बढ़ जाता है . प्रतिदर्श की भिन्नता से प्रामाणिक विचलन बहुत कम प्रभावित होता है
. प्रामाणिक विचलन एक स्थिर तथा निश्चित मापन होता है
. इसकी गणना प्रत्येक स्थिति में की जा सकती है . प्रामाणिक विचलन बीजगणितीय नियमों का पालन करता है, क्योंकि समस्त ऋणात्मक विचलन वर्ग करने से धनात्मक हो जाते हैं
. यह विचलन कई वर्णनात्मक एवं निष्कर्षात्मक सांख्यिकी की गणना का आधार होता है
. समूहों की समजातीयता और विषम जातीयता के अध्ययन में तथा शोध कार्यों में शुद्ध और श्रेष्ठ विचलन माप के रूप से इसका उपयोग किया जाता है
.
दोष (Demerits) 🚧:
प्रामाणिक विचलन को समझना कठिन होता है
. इसकी गणना करने में कठिन प्रक्रिया को अपनाना पड़ता है
. इसमें अति सीमांत मूल्यों को अधिक महत्व प्राप्त होता है
. अतः जब श्रृंखला में सीमांत पद होते हैं, तो प्रामाणिक विचलन का मान बढ़ जाता है .
उपयोग (Uses) 🎯:
जब विचलनशीलता के सर्वाधिक स्थिर मापन को ज्ञात करना हो
. जब केंद्रीय मापकों में मध्यमान की गणना की गई हो
. जब दो समूहों में समजातीयता की तुलना करनी हो
. जब वितरण के सीमांत प्राप्तांकों को महत्व देना हो
. जब सहसंबंध तथा मानक त्रुटि की गणना करनी हो
. जब किसी अंक श्रृंखला में किसी अंक विशेष की स्थिति ज्ञात करनी हो
.
निष्कर्ष (Conclusion) ✅
विचलनशीलता के माप केंद्रीय प्रवृत्ति के मापों के पूरक होते हैं। जहाँ केंद्रीय प्रवृत्ति के माप डेटा के "केंद्र" का प्रतिनिधित्व करते हैं, वहीं विचलनशीलता के माप डेटा के "फैलाव" या "विविधता" को दर्शाते हैं। सही माप का चुनाव डेटा की प्रकृति, वितरण के प्रकार और अनुसंधान के उद्देश्य पर निर्भर करता है। मानक विचलन को आमतौर पर सबसे व्यापक और विश्वसनीय माप माना जाता है क्योंकि यह सभी डेटा बिंदुओं को ध्यान में रखता है और आगे के सांख्यिकीय विश्लेषण के लिए एक मजबूत आधार प्रदान करता है।
प्रश्न 1: प्रसामान्य संभाव्यता वक्र (Normal Probability Curve - NPC) क्या है? इसकी प्रमुख विशेषताओं का विस्तृत वर्णन कीजिए तथा विषमता (Skewness) एवं कुकुदता (Kurtosis) के संप्रत्ययों को उदाहरण सहित समझाइए। 🔔
उत्तर:
प्रसामान्य संभाव्यता वक्र सांख्यिकी और मनोविज्ञान में एक मूलभूत अवधारणा है, जो कई प्राकृतिक और मनोवैज्ञानिक घटनाओं के वितरण का प्रतिनिधित्व करता है। यह हमें यह समझने में मदद करता है कि विभिन्न विशेषताएँ किसी जनसंख्या में कैसे वितरित होती हैं।
प्रसामान्य संभाव्यता वक्र का अर्थ (Meaning of Normal Probability Curve) 📈
प्रसामान्य संभाव्यता वक्र को सामान्य वक्र (Normal Curve) भी कहा जाता है
सामान्य वितरण की विशेषता यह होती है कि वितरण के मध्य में सर्वाधिक प्राप्तांक होते हैं तथा क्रमशः दोनों किनारों पर घटते जाते हैं
मनोविज्ञान में, यदि हम व्यक्तियों की बुद्धि, समायोजन, चिंता, सांवेगिकता, तनाव, कार्य संतुष्टि आदि का मापन करें, तो पता चलता है कि व्यक्तियों में ये विशेषताएँ सामान्य रूप से वितरित होती हैं
प्रसामान्य वक्र की प्रमुख विशेषताएँ (Main Characteristics of Normal Curve) ✨
प्रसामान्य वक्र की निम्नलिखित विशेषताएँ होती हैं:
सैद्धांतिक कल्पना (Theoretical Construct) 💡: सामान्य वक्र का आविर्भाव संभाव्यता के सांख्यिकीय सिद्धांत से हुआ है. यह एक सैद्धांतिक कल्पना है
. सममित वक्र (Symmetrical Curve) 🔄: यह एक सममित वक्र होता है. यदि इसे दो भागों में मोड़ दिया जाए तो दोनों भाग एक-दूसरे को पूरी तरह ढक लेते हैं. वक्र की ऊँचाई मध्य-बिंदु के दोनों तरफ केंद्र से समान दूरी पर समान होती है
. केंद्रीय प्रवृत्ति का एकीकरण (Coincidence of Central Tendency) 🎯: सामान्य वितरण का मध्यमान (Mean), मध्यांक (Median) एवं बहुलांक (Mode) समान होता है तथा तीनों ही सामान्य वक्र के मध्य में पड़ते हैं, जहाँ वक्र की ऊँचाई अधिकतम होती है
. अनंत फैलाव (Infinite Range) 🌌: सामान्य वक्र का फैलाव अनंत, सीमाहीन होता है, परन्तु माध्य से जैसे-जैसे दूरी बढ़ती जाती है, वक्र क्षैतिज रेखा (X-अक्ष) के करीब आता जाता है. लेकिन सैद्धांतिक रूप से वह X-अक्ष को कभी नहीं छू पाता
. सिग्मा इकाई पर आधारित (Based on Sigma Units) 📏: वक्र की आधार रेखा (X-अक्ष) को सिग्मा (σ) प्राप्तांक द्वारा मापा जाता है जिसे सिग्मा-इकाई भी कहते हैं
. सिग्मा प्राप्तांक का माध्य शून्य तथा मानक विचलन 1 होता है . केसों का निश्चित प्रतिशत (Fixed Percentage of Cases) 📊:
माध्य से
±1σ के अंतर्गत 68.26% केस होते हैं
. माध्य से
±2σ के अंतर्गत 95.44% केस होते हैं
. माध्य से
±3σ के अंतर्गत 99.73% केस होते हैं
.
ऊँचाई का अधिकतम मान (Maximum Height) ⬆️: इसकी ऊँचाई का न्यूनतम मान कभी भी शून्य नहीं होता, परन्तु अधिकतम मान 0.3989 होता है
. विषमता गुणांक शून्य (Zero Skewness Coefficient) ⚖️: सामान्य वक्र का विषमता गुणांक शून्य होता है. यानी, वक्र में किसी प्रकार की विषमता नहीं पाई जाती, वह पूर्णतः संतुलित व सममित होता है
. कुकुदता गुणांक (Kurtosis Coefficient) ⛰️: सामान्य वक्र न ही अधिक चपटा होता है, न ही अधिक नुकीला. इसकी ऊँचाई औसत होती है तथा इसका कुकुदता गुणांक 0.263 होता है
. परिवर्तन बिंदु (Point of Inflection) 〰️: सामान्य वक्र के मध्यमान से 1σ ऊपर तथा 1σ नीचे (+ 1σ तक) वक्र की आकृति अवतल (concave) होती है तथा इसके पश्चात् उत्तल (convex) में परिवर्तित होती है
.
विषमता (Skewness) एवं कुकुदता (Kurtosis) के संप्रत्यय (Concepts of Skewness and Kurtosis) 📉
सामान्य वितरण वक्र एक सैद्धांतिक कल्पना है. सामान्यतः प्राप्त आंकड़ों के आधार पर निर्मित वक्र सामान्य संभाव्यता वक्र के अनुरूप प्राप्त नहीं होता है. उसमें सामान्य वक्र की अपेक्षा कुछ-न-कुछ विचलन प्राप्त होता है. यह विचलन मुख्यतः दो प्रकार का होता है- विषमता और कुकुदता
1. विषमता (Skewness) ➡️⬅️
विषमता से तात्पर्य सामान्य वक्र में होने वाले अपसरण (departure) से है जो किसी जनसंख्या के माध्य और मध्यिका (Median) में होने वाले अंतर से उत्पन्न होता है
परन्तु जब वितरण सामान्य न होकर विषम होता है, तो माध्य तथा मध्यिका एक ही बिंदु पर न पड़कर अलग-अलग पड़ते हैं और प्राप्तांकों का केंद्रीकरण वितरण के बायीं या दायीं ओर पर हो जाता है
ऋणात्मक विषमता (Negative Skewness) ⬅️:
जब वितरण में अधिक प्राप्तांक 'स्केल' की दायीं ओर अर्थात् ऊपरी छोर की ओर जमा रहते हैं और धीरे-धीरे बायीं ओर यानी निचली छोर की ओर फैलते हैं
. इस तरह के वितरण में मध्यमान, मध्यांक की बायीं ओर होता है, अर्थात् यहाँ मध्यांक मध्यमान से बड़ा होता है
. (Q3 - मध्यांक) < (मध्यांक - Q1) होता है
. वक्र का लंबा सिरा बायीं ओर होता है
.
धनात्मक विषमता (Positive Skewness) ➡️:
जब अधिक प्राप्तांक 'स्केल' की बायीं ओर, अर्थात् नीचे की ओर जमा रहते हैं और धीरे-धीरे दायीं अर्थात् ऊपरी छोर की ओर फैलते हैं
. इस प्रकार के वितरण में मध्यमान, मध्यांक की दायीं ओर होता है, अर्थात् यहाँ मध्यांक, मध्यमान से छोटा होगा
. (Q3 - मध्यांक) > (मध्यांक - Q1) होता है
. वक्र का लंबा सिरा दायीं ओर होता है
.
2. कुकुदता (Kurtosis) 📈📉
एक 'आवृत्ति वितरण वक्र' प्रसामान्य वक्र की तुलना में कितना 'चपटा' अथवा 'शिखरीय' है, इसकी जानकारी कुकुदता या 'कुर्टोसिस' से मिलती है
लेप्टोकुर्टिक वक्र (Leptokurtic Curve) ⛰️: यदि आवृत्ति वितरण वक्र प्रसामान्य वक्र की तुलना में अधिक शिखरीय (peaked) है तो उसे लेप्टोकुर्टिक वक्र कहते हैं
. प्लेटीकुर्टिक वक्र (Platykurtic Curve) 〰️: जब यह प्रसामान्य वक्र की अपेक्षा अधिक चपटा (flat) है तो उसे 'प्लेटी कुर्टिक वक्र' कहेंगे
. मेसोकुर्टिक वक्र (Mesokurtic Curve) 🔔: 'प्रसामान्य वक्र' को 'मेसोकुर्टिक' वक्र भी कहा जाता है
. इसका कुकुदता गुणांक 0.263 होता है .
कुकुदता से हमें वितरण के शिखर (peak) और पुच्छ (tails) की आकृति के बारे में जानकारी मिलती है, जो यह दर्शाता है कि डेटा केंद्र के आसपास कितना केंद्रित है और चरम मान कितने अधिक हैं।
प्रश्न 2: सहसंबंध (Correlation) क्या है? इसके विभिन्न प्रकारों और सहसंबंध गुणांक की मात्रात्मक व्याख्या का विस्तृत वर्णन कीजिए। पियर्सन के गुणन-आघूर्ण सहसंबंध (Pearson's Product-Moment Correlation) की गणना विधि का उदाहरण सहित विश्लेषण कीजिए। 🤝
उत्तर:
मनोविज्ञान, शिक्षा और अन्य सामाजिक विज्ञानों में, हम अक्सर विभिन्न गुणों या चरों के बीच संबंधों का अध्ययन करते हैं। सहसंबंध इन संबंधों को समझने और उनकी शक्ति तथा दिशा को मापने का एक महत्वपूर्ण सांख्यिकीय उपकरण है।
सहसंबंध का संप्रत्यय (Concept of Correlation) 💡
साधारणतः सहसंबंध से मतलब दो व्यक्तियों, घटनाओं या तथ्यों के बीच पाए जाने वाले साहचर्य (association) से होता है
ब्लाइसेर एवं लिंडक्विस्ट (1958) के अनुसार, "सहसंबंध के द्वारा यह अध्ययन किया जाता है कि व्यक्ति या वस्तुएं एक आयाम या दिशा में औसत, औसत से अधिक या औसत से कम हैं तो दूसरी दिशा में क्या प्रवृत्ति है अर्थात् औसत है, औसत से अधिक है या औसत से कम है"
सहसंबंध के प्रकार (Types of Correlation) 🗂️
सहसंबंध मुख्यत: दो प्रकार के होते हैं: गुणात्मक (Qualitative) और मात्रात्मक (Quantitative)
I. गुणात्मक सहसंबंध (Qualitative Correlation) 🌟
जब दो चरों या दो परीक्षणों पर के प्राप्तांकों में सहसंबंध किसी खास गुण के द्वारा अभिव्यक्त किया जाता है तो उसे गुणात्मक सहसंबंध कहते हैं
रैखिक सहसंबंध (Linear Correlation) 📏: जब दो चरों या परीक्षणों पर के प्राप्तांकों के सहसंबंध को एक सीधी रेखा द्वारा व्यक्त किया जाता है तो उसे रैखिक सहसंबंध कहते हैं
. जैसे, यदि ऊँचाई और भार के बीच के सहसंबंध को ग्राफ द्वारा अभिव्यक्त करना चाहें तो एक रेखीय संबंध दृष्टिगत होगा, क्योंकि व्यक्ति की ऊँचाई जैसे-जैसे बढ़ती जाती है, उसके शरीर का भार भी बढ़ता जाता है . वक्ररेखीय सहसंबंध (Curvilinear Correlation) 〰️: जब दो चरों या दो परीक्षणों के प्राप्तांकों के बीच के सहसंबंध को एक सीधी रेखा द्वारा न व्यक्त कर टेढ़ी-मेढ़ी रेखा या वक्र द्वारा व्यक्त किया जाता है, तो यह सहसंबंध वक्ररेखीय या अरैखिक कहलाता है
. अधिकतर वक्ररेखीय सहसंबंध मनोभौतिकी, थकान, विस्मरण तथा अधिगम के प्रयोगों से प्राप्त प्राप्तांकों में देखने को मिलता है .
II. मात्रात्मक सहसंबंध (Quantitative Correlation) 🔢
जब दो चरों या परीक्षणों के प्राप्तांकों के बीच पाए जाने वाले सहसंबंध को रेखा द्वारा अभिव्यक्त न कर संख्या द्वारा अभिव्यक्त किया जाता है तो इसे मात्रात्मक सहसंबंध कहते हैं
धनात्मक सहसंबंध (Positive Correlation) ⬆️⬆️: जब दो चरों के बीच का संबंध ऐसा होता है कि किसी एक में किसी तरह का परिवर्तन होने से दूसरे में भी ठीक उसी तरह का परिवर्तन होता है तो इस संबंध को धनात्मक सहसंबंध कहते हैं
. जैसे, उम्र में वृद्धि होने के साथ-साथ व्यक्ति की सांवेगिक परिपक्वता में भी वृद्धि होती है . धनात्मक सहसंबंध पूर्ण धनात्मक (+1.00), अत्यंत उच्च (+.81 से +.99), उच्च (+.61 से +.80), औसत (+.41 से +.60), निम्न (+.21 से +.40) तथा नगण्य (+.01 से +.20) स्तर का हो सकता है . ऋणात्मक सहसंबंध (Negative Correlation) ⬆️⬇️: जब दो चरों में ऐसा संबंध देखने में आता है कि एक चर की मात्रा घटने पर दूसरे चर की मात्रा बढ़ती है या फिर एक चर की मात्रा बढ़ने पर दूसरे चर की मात्रा घटने लगती है, तब ऐसी स्थिति में भी दोनों चरों में सहसंबंध अवश्य रहता है, परंतु वह विपरीत दिशा में रहता है
. अतः, ऐसे सहसंबंध को ऋणात्मक सहसंबंध कहते हैं . वस्तु के मूल्य और आपूर्ति के बीच ऋणात्मक सहसंबंध पाया जाता है . ऋणात्मक सहसंबंध पूर्ण ऋणात्मक (-1.00), अत्यंत उच्च (-.81 से -.99), उच्च (-.61 से -.80), औसत (-.41 से -.60), निम्न (-.21 से -.40) तथा नगण्य (-.01 से -.20) स्तर का हो सकता है . शून्य सहसंबंध (Zero Correlation) 〰️: जब दो चरों के बीच कोई संगत (consistent) या एक तरह का संबंध नहीं होता है, यानी जब दो चरों में से कोई भी चर एक-दूसरे को प्रभावित नहीं करता है तब ऐसी स्थिति में दोनों चरों में साहचर्यात्मक संबंध शून्य होता है, अतः उनमें सहसंबंध की मात्रा भी शून्य होती है
. जैसे, यदि व्यक्ति की बुद्धिलब्धि और इसके भार के बीच सहसंबंध जानना चाहें तो यह निश्चित रूप से शून्य होगा, क्योंकि यहाँ कोई भी चर एक-दूसरे पर प्रभाव नहीं डालता है .
सहसंबंध गुणांक की मात्रात्मक व्याख्या (Quantitative Interpretation of Correlation Coefficient) 🔢
सहसंबंध गुणांक (Correlation Coefficient) एक एकल संख्या है जो हमें बताती है कि किस सीमा तक दो वस्तुएँ संबंधित हैं तथा किसी सीमा तक एक में आया परिवर्तन दूसरे में भी परिवर्तन उत्पन्न करता है
सहसंबंध गुणांक | सहसंबंध विवरण |
+1.00 | पूर्ण धनात्मक सहसंबंध |
+.81 से +.99 | अत्यंत उच्च धनात्मक सहसंबंध |
+.61 से +.80 | उच्च धनात्मक सहसंबंध |
+.41 से +.60 | औसत धनात्मक सहसंबंध |
+.21 से +.40 | निम्न धनात्मक सहसंबंध |
+.01 से +.20 | नगण्य धनात्मक सहसंबंध |
0 | शून्य सहसंबंध |
-.01 से -.20 | नगण्य ऋणात्मक सहसंबंध |
-.21 से -.40 | निम्न ऋणात्मक सहसंबंध |
-.41 से -.60 | औसत ऋणात्मक सहसंबंध |
-.61 से -.80 | उच्च ऋणात्मक सहसंबंध |
-.81 से -.99 | अत्यधिक उच्च ऋणात्मक सहसंबंध |
-1.00 | पूर्ण ऋणात्मक सहसंबंध |
पियर्सन के गुणन-आघूर्ण सहसंबंध (Pearson's Product-Moment Correlation) की गणना विधि का विश्लेषण (Analysis of Calculation Method) 📊
पियर्सन के गुणन-आघूर्ण सहसंबंध गुणांक (Pearson's r) की गणना दो चरों के बीच रैखिक संबंध की शक्ति और दिशा को मापने के लिए की जाती है. इसका प्रतिपादन प्रोफेसर कार्ल पियर्सन ने लगभग 1900 ई. में किया था
मान्यताएँ (Assumptions) ✅:
दोनों चरों (X और Y) के प्राप्तांकों का संबंध रैखिक होना चाहिए
. X तथा Y चरों के प्राप्तांकों का वितरण सामान्य होना चाहिए
. X तथा Y चरों के प्राप्तांकों में समवितरणता (homoscedasticity) होनी चाहिए, अर्थात स्कैटर डायग्राम के प्रत्येक 'रो' तथा 'कॉलम' में प्राप्तांकों का विसरण बराबर या करीब-करीब बराबर हो
.
गणना विधि (Calculation Method) 🛠️:
पियर्सन 'r' ज्ञात करने के कई प्रमुख तरीके हैं, जिनमें 'मूल विधि' या 'वास्तविक माध्य विधि' और 'मानकित' या 'कल्पित माध्य विधि' शामिल हैं। यहाँ हम वास्तविक माध्य विधि का विश्लेषण करेंगे।
वास्तविक माध्य विधि (Actual Mean Method) 🧠
इस विधि का प्रयोग तब करते हैं जब दोनों चरों (X तथा Y) में प्राप्तांकों का विचलन वास्तविक माध्य से लिया जाता है और आँकड़े प्राय: असंगठित होते हैं.
सूत्र (Formula) 🧮: r=NσxσyΣxy या
r=(Σx2)(Σy2)
Σxy
जहाँ:
r = चर X और Y के बीच का सहसंबंध गुणांक
x = चर X के प्राप्तांकों का वास्तविक माध्य (Mx) से विचलन (X−Mx)
y = चर Y के प्राप्तांकों का वास्तविक माध्य (My) से विचलन (Y−My)
Σxy = विचलन (x और y) के गुणनफलों का योग
Σx2 = चर X के विचलनों के वर्गों का योग
Σy2 = चर Y के विचलनों के वर्गों का योग
N = प्राप्तांकों की संख्या (जोड़ों में)
σx = चर X के प्राप्तांकों का मानक विचलन
σy = चर Y के प्राप्तांकों का मानक विचलन
चरण (Steps) 🪜:
माध्य ज्ञात करना (Calculating Means): सर्वप्रथम दोनों चरों X और Y के वास्तविक माध्य (Mx और My) ज्ञात करते हैं।
Mx=NΣX और My=NΣY
विचलन ज्ञात करना (Calculating Deviations): प्रत्येक प्राप्तांक (X और Y) का उनके संबंधित माध्यों से विचलन ज्ञात करते हैं:
x=X−Mx
y=Y−My
विचलनों के वर्ग ज्ञात करना (Squaring Deviations): विचलन x और y का वर्ग करते हैं (x2 और y2).
विचलनों के गुणनफल ज्ञात करना (Calculating Product of Deviations): प्रत्येक x विचलन को उसके संगत y विचलन से गुणा करते हैं (xy).
योग ज्ञात करना (Summations): सभी x2, y2, और xy का योग ज्ञात करते हैं (Σx2, Σy2, Σxy). यह सुनिश्चित करने के लिए कि माध्य से विचलन की गणना सही है, Σx और Σy का योग शून्य होना चाहिए.
सूत्र में मान रखना (Substituting Values in Formula): ज्ञात किए गए योगफलों को उपयुक्त सूत्र में रखकर r की गणना करते हैं।
उदाहरण (Example):
10 विद्यार्थियों के अर्थशास्त्र (X) और गणित (Y) के प्राप्तांक दिए गए हैं: X: 27, 26, 26, 30, 31, 30, 26, 28, 29, 27 Y: 34, 32, 32, 30, 33, 31, 32, 32, 31, 33
हल:
ΣX=280, ΣY=320
N=10
Mx=10280=28
My=10320=32
X
Y
x=X−Mx
y=Y−My
x2
y2
xy
27
34
-1
2
1
4
-2
26
32
-2
0
4
0
0
26
32
-2
0
4
0
0
30
30
2
-2
4
4
-4
31
33
3
1
9
1
3
30
31
2
-1
4
1
-2
26
32
-2
0
4
0
0
28
32
0
0
0
0
0
29
31
1
-1
1
1
-1
27
33
-1
1
1
1
-1
Σx=0
Σy=0
Σx2=32
Σy2=12
Σxy=−7
अब सूत्र में मान रखने पर:
r=(Σx2)(Σy2)
Σxy=(32)(12)
−7
r=384
−7=19.596−7
r≈−0.357
अतः अर्थशास्त्र और गणित के बीच ऋणात्मक एवं औसत से नीचे स्तर का सहसंबंध है
. यह दर्शाता है कि जैसे-जैसे एक विषय में प्राप्तांक बढ़ता है, दूसरे में थोड़ा घटने की प्रवृत्ति होती है, लेकिन यह संबंध बहुत मजबूत नहीं है।
प्रश्न 1: यादृच्छिक प्रतिचयन (Random Sampling) क्या है? इसके विभिन्न लाभों और कठिनाइयों का विस्तार से वर्णन कीजिए। सांख्यिकीय विश्लेषण में सार्थकता के स्तर (Level of Significance) और स्वतंत्रता के अंश (Degree of Freedom) के महत्व को स्पष्ट कीजिए। 🎲
उत्तर:
अनुसंधान में, विशेषकर मनोविज्ञान और शिक्षा के क्षेत्र में, पूरी जनसंख्या का अध्ययन करना अक्सर अव्यावहारिक या असंभव होता है। ऐसे में, जनसंख्या के एक छोटे, प्रतिनिधि समूह का चयन किया जाता है जिसे प्रतिदर्श (Sample) कहते हैं। इस चयन प्रक्रिया को प्रतिचयन (Sampling) कहते हैं। यादृच्छिक प्रतिचयन प्रतिचयन का एक महत्वपूर्ण प्रकार है।
यादृच्छिक या संयोगिक प्रतिचयन (Random or Accidental Sampling) 🎲
व्यवहारपरक शोधों में प्रयुक्त होने वाले प्रतिदर्शन को मूलतः तीन विस्तृत भागों में बाँटा जा सकता है: प्रसम्भाव्यता प्रतिचयन (Probability Sampling), अर्द्ध-प्रसम्भाव्यता प्रतिचयन (Semi-Probability Sampling), और अप्रसम्भाव्यता प्रतिचयन (Non-Probability Sampling)
प्रसम्भाव्यता प्रतिचयन के दो आधार हैं: (अ) सांख्यिकीय का नियम (Law of Statistics) तथा (ब) प्रसामान्य वितरण का सिद्धांत (Theory of Normal Distribution)
प्रसम्भाव्यता प्रतिचयन में शोधकर्ता को निम्न शर्तों से संतुष्ट होना आवश्यक होता है:
जीवसंख्या या समष्टि जिसमें प्रतिदर्श का चयन किया जाना है, इसका आकार अवश्य ज्ञात हो
. प्रतिदर्श की वांछित संख्या निर्दिष्ट हो
. जीवसंख्या के प्रत्येक सदस्य को प्रतिदर्श में सम्मिलित किए जाने की संभावना बराबर बराबर हो
.
यादृच्छिक प्रतिचयन के लाभ (Advantages of Random Sampling) ✨
संयोगिक प्रतिचयन के निम्नलिखित लाभ हैं:
पक्षपात से मुक्ति (Freedom from Bias) 🛡️: संयोगिक प्रतिचयन में व्यक्तिगत पक्षपात के लिए कोई स्थान नहीं होता है, क्योंकि प्रतिदर्श की इकाइयों का चयन पूर्णतः संयोग के आधार पर होता है
. समष्टि का पूर्ण प्रतिनिधित्व (Full Representation of Population) 🌍: इस प्रक्रिया के द्वारा चयन किया गया प्रतिदर्श अपनी समष्टि का पूर्ण रूप से प्रतिनिधित्व करता है
. प्रसम्भाव्यता सिद्धांत पर आधारित (Based on Probability Theory) 🎲: प्रसम्भाव्यता सिद्धांत पर आधारित रहने के कारण प्रतिदर्श द्वारा प्राप्त निष्कर्षों की त्रुटि का माप सरलतापूर्वक किया जा सकता है
. प्रतिदर्श की मानक त्रुटि का आकलन (Estimation of Standard Error of Sample) 📏: प्रतिदर्श का चयन प्रसम्भाव्यता सिद्धांत पर आधारित होने के कारण प्राप्त सांख्यिकीय मापों – मध्यमान, मध्यक आदि – की मानक त्रुटि के आकलन की गणना करने में विशेष सुविधा रहती है
. समय व धन का कम खर्च (Less Time and Cost) 💰: संयोगिक प्रतिचयन द्वारा चयन किए गए प्रतिदर्श की इकाइयों का स्वरूप प्राय: पूर्णतः अपनी समष्टि का पूर्ण रूप से प्रतिनिधित्व करता है, जिसके कारण से अपेक्षाकृत कम इकाइयों के चयन से भी अच्छे एवं गुणकारी निष्कर्ष प्राप्त किए जा सकते हैं
.
यादृच्छिक प्रतिचयन की कठिनाइयाँ (Difficulties of Random Sampling) 🚧
संयोगिक प्रतिचयन में कुछ कठिनाइयाँ भी होती हैं:
चयन के पश्चात् संशोधन नहीं (No Revision After Selection) ❌: संयोगिक प्रतिदर्श के माध्यम से यदि एक बार इकाइयों के चयन को अंतिम रूप देने के पश्चात् किसी एक इकाई से मृत्यु, बीमारी, असहयोग, अनुपस्थिति आदि के कारण संपर्क संभव नहीं होता है, उस स्थिति में शोधकर्ता को एक कठिन समस्या का सामना करना पड़ सकता है
. समष्टि के पूर्ण ज्ञान की आवश्यकता (Need for Complete Knowledge of Population) 🔎: इस पद्धति का उपयोग केवल सजातीय समष्टि पर ही हो सकता है
. यदि समष्टि का स्वरूप विषमजातीय है, तब ऐसी स्थिति में इस विधि का उपयोग उपयुक्त नहीं होता है . अत्यधिक व्यापक क्षेत्र में असुविधाजनक (Inconvenient in Very Large Areas) 🗺️: अत्यधिक व्यापक अध्ययन क्षेत्र होने पर अध्ययनकर्ता को संपर्क की विशेष कठिनाई का सामना करना पड़ता है
. विषम भौगोलिक स्थितियों में संपर्क की कठिनाई (Difficulty in Contact in Diverse Geographical Conditions) 🏞️: यह विधि विषम भौगोलिक स्थितियों के लिए अनुकूल नहीं है
. अपूर्ण समष्टि में अनुपयुक्त (Unsuitable for Incomplete Population) 📝: यदि किसी कारणवश समष्टि से संबंधित ज्ञान अपूर्ण हो, या संपूर्ण समष्टि का अध्ययन एक समय पर संभव न हो, तब ऐसी स्थिति में संयोगिक प्रतिचयन पद्धति का उपयोग नहीं हो सकता है
.
सांख्यिकीय विश्लेषण में सार्थकता के स्तर (Level of Significance) का महत्व (Importance of Level of Significance in Statistical Analysis) ✅
मनोवैज्ञानिक अध्ययनों में शून्य उपकल्पना (Null Hypothesis) को स्वीकृत या अस्वीकृत करने के लिए अनुसंधानकर्ता प्रायः सार्थकता के दो स्तरों – प्रथम 0.05 तथा द्वितीय 0.01 – का उपयोग करते हैं
0.05 सार्थकता का स्तर (5% Level of Significance) 🎗️: यदि किसी शून्य उपकल्पना को 0.05 स्तर पर अस्वीकृत कर दिया जाता है, तो इसका अर्थ है कि यदि संबंधित प्रयोग या परीक्षण जिससे आँकड़े प्राप्त हुए हैं, उसको 100 बार दोहराया जाए, तो उसमें से 5 बार शून्य उपकल्पना सत्य होगी और 95 बार असत्य होगी
. यह स्तर सामाजिक विज्ञानों के सामान्य अध्ययनों के लिए संतोषजनक माना जाता है . 0.01 सार्थकता का स्तर (1% Level of Significance) 🏆: यदि किसी शून्य उपकल्पना को 0.01 स्तर पर अस्वीकृत कर दिया जाता है, तो इसका अर्थ है कि यदि प्रयोग या परीक्षण को 100 बार दोहराया जाए, तो उसमें से एक बार शून्य उपकल्पना सत्य होगी और 99 बार असत्य होगी
. शोधकर्ता 100 में से मात्र 1 बार सही होने की स्थिति में इसे और अधिक विश्वास के साथ अस्वीकृत करने में सक्षम हो जाता है . यह स्तर उच्चकोटि का माना जाता है और इसका उपयोग विशेषतः प्रायोगिक अध्ययनों में किया जाता है, जहाँ वैज्ञानिक परिशुद्धता की अत्यंत कठोरतम स्तर की आवश्यकता होती है . 0.001 सार्थकता का स्तर (0.1% Level of Significance) 🌟: कभी-कभी 0.001 का स्तर भी उपयोग किया जाता है, विशेषकर ऐसे अनुसंधानों में जहाँ वैज्ञानिक परिशुद्धता की अत्यंत कठोरतम स्तर की आवश्यकता होती है, जैसे नई औषधि के निर्माण में
.
सांख्यिकीय विश्लेषण में स्वतंत्रता के अंश (Degree of Freedom) का महत्व (Importance of Degree of Freedom in Statistical Analysis) 🗽
स्वतंत्रता के अंश (d.f.) से तात्पर्य प्राप्तांकों को स्वतंत्र रूप से परिवर्तित होने से होता है
छोटे प्रतिदर्शों में महत्व (Importance in Small Samples) 🤏: छोटे प्रतिदर्शों (N < 30) के मध्यमान की विश्वसनीयता की जाँच करने के लिए स्वतंत्रता के अंशों को अवश्य देखना पड़ता है
. जब प्रतिदर्श की संख्या छोटी रहती है, तब प्रतिदर्श की इकाइयों का विक्षेपण (Dispersion) अपने मध्यमान से अपेक्षाकृत दूर-दूर रहता है . टी-वितरण (t-Distribution) 📈: प्रसामान्य वितरण में M ± 1.96σ के अंतर्गत एक वितरण की 95.44% संख्या आ जाती है
. लेकिन यदि हमारा प्रतिदर्श छोटा है, और मान लीजिए कि उसकी संख्या 25 है, तब t (t-सारणी) के अनुसार उस स्थिति में मध्यमान से सिग्मा (σ) दूरी ±1.96σ न होकर ±2.06σ हो जाती है . इसी तरह से प्रसामान्य वितरण में एक वितरण की ±2.58σ के अंतर्गत 99% संख्या आ जाती है, परंतु छोटे प्रतिदर्श के लिए यह दूरी ±2.58σ न रहकर ±2.80σ हो जाती है . परिशुद्धता (Precision) 🎯: परिशुद्धता के लिए मानक त्रुटि की सार्थकता की जाँच संबंधित स्वतंत्रता के अंशों पर ही की जानी चाहिए, खासकर छोटे प्रतिदर्शों में ऐसा करना बहुत ही आवश्यक है
.
स्वतंत्रता के अंश यह सुनिश्चित करते हैं कि सांख्यिकीय परीक्षणों के परिणाम, विशेष रूप से छोटे प्रतिदर्शों के लिए, विश्वसनीय और वैध हों।
प्रश्न 2: प्राचल सांख्यिकी (Parametric Statistics) और अप्राचल सांख्यिकी (Non-Parametric Statistics) को परिभाषित कीजिए। इनके बीच प्रमुख अंतरों की विस्तार से तुलना कीजिए तथा काई-वर्ग परीक्षण (Chi-Square Test) की उपयोगिता, लाभ और सीमाओं का वर्णन कीजिए। ⚖️
उत्तर:
सांख्यिकीय विश्लेषण में, शोधकर्ता को अक्सर यह निर्णय लेना पड़ता है कि डेटा की प्रकृति और अनुसंधान के उद्देश्यों के आधार पर किस प्रकार के सांख्यिकीय परीक्षण का उपयोग किया जाए। यह निर्णय लेने में प्राचल और अप्राचल सांख्यिकी के बीच का अंतर महत्वपूर्ण होता है।
प्राचल सांख्यिकी (Parametric Statistics) 📊
प्राचल सांख्यिकी का संबंध प्रायः एक समष्टि (Population) के किसी एक विशेष प्राचल (Parameter) से होता है
प्राचल सांख्यिकी उस सांख्यिकी को कहते हैं जो जीवसंख्या, जिसमें कि प्रतिदर्श लिया जाता है, के बारे में कुछ शर्तों पर आधारित होती है, जो निम्न हैं
प्रेक्षण स्वतंत्र तथा निष्पक्ष हों, अर्थात जीवसंख्या से प्रतिदर्श का चयन करते समय किसी व्यक्ति या वस्तु का चयन शोधकर्ता के किसी प्रकार के पक्षपात या पूर्वाग्रह के कारण न हो
. यथासंभव प्रतिदर्श का चयन सामान्य रूप से वितरित जीवसंख्या से हो . जिस भी चर का अध्ययन किया जाने वाला हो, वह ऐसा होना चाहिए कि उसका माप अंतराल मापनी (Interval Scale) पर संभव हो, जिससे गणितीय परिकलन जैसे जोड़, घटाव, गुणा, माध्य आदि निकालना संभव हो
. सिगेल (Siegel) के अनुसार, ये सभी शर्तें ऐसी हैं जिनकी साधारण जाँच नहीं की जाती है, यह कल्पना कर ली जाती है कि शर्तें मौजूद हैं
. प्राचलिक सांख्यिकी के परिणाम की सार्थकता उपयुक्त शर्तों की सत्यता पर आधारित होती है .
अप्राचल सांख्यिकी (Non-Parametric Statistics) 📈
अप्राचल सांख्यिकी वह सांख्यिकी है जो जिस समष्टि से प्रतिदर्श लिया जाता है, के बारे में कोई विशेष शर्त नहीं रखती है
अप्राचल आँकड़ों की एक विशेषता यह भी होती है कि ऐसे आँकड़ों की संख्या अपेक्षाकृत बहुत कम होती है, प्रायः ऐसे आँकड़ों की संख्या 30 से कम ही होती है
प्राचल सांख्यिकी तथा अप्राचल सांख्यिकी की तुलना (Comparison of Parametric and Non-Parametric Statistics) ↔️
ब्राडली (Bradley, 1968) ने अप्राचल सांख्यिकी की तुलना प्राचल सांख्यिकी से निम्न प्रकार से की है
विशेषताएँ (Features) | प्राचल सांख्यिकी (Parametric Statistics) | अप्राचलिक सांख्यिकी (Non-Parametric Statistics) |
1. व्युत्पत्ति की सरलता (Simplicity of Derivation) | इसकी व्युत्पत्ति के लिए गणित के क्षेत्र में विशेष स्तर की सक्षमता की आवश्यकता होती है. | इसकी व्युत्पत्ति आसान है, अधिकांश अप्राचलिक सांख्यिकी मात्र समायोजी सूत्रों से आसानी से ज्ञात की जा सकती है. |
2. अनुप्रयोग की सहजता (Ease of Application) | इसमें उच्च स्तर के गणितीय परिकलन की आवश्यकता होती है (जैसे Mean, SD, t-test, ANOVA). | इसमें कम जटिल गणितीय परिकलन (जैसे रैंकिंग, गिनती, जोड़, घटाव) की आवश्यकता होती है, जिससे इसे व्यवहार में लाना अधिक आसान है. |
3. अनुप्रयोग की तीव्रता (Speed of Application) | जब प्रतिदर्श का आकार छोटा होता है, तब प्राचलिक सांख्यिकी का व्यवहारिक उपयोग धीमा हो सकता है. | जब प्रतिदर्श का आकार छोटा होता है, तब इसका व्यवहारिक उपयोग प्राचलिक सांख्यिकी की अपेक्षा अधिक उपयुक्तता के साथ तेजी से किया जा सकता है. |
4. अनुप्रयोग का क्षेत्र (Scope of Application) | इसकी पूर्वानुमानित मान्यताएँ या शर्तें काफी सख्त होती हैं, जिससे इसका उपयोग कुछ विशेष प्रतिदर्शों पर ही किया जा सकता है जो सामान्य वितरण पर आधारित हों. | इसकी पूर्वानुमानित मान्यताएँ या शर्तें काफी कम सख्त होती हैं, जिससे इसका उपयोग भिन्न-भिन्न प्रकार के प्रतिदर्शों पर किया जा सकता है. अतः इसका क्षेत्र बड़ा है. |
5. आंकड़ों के प्रकार (Types of Measurement) | इसके प्रयोग में अंतराल आंकड़े (Interval Data) या आनुपातिक आंकड़े (Ratio Data) की आवश्यकता होती है. | इसके प्रयोग में अधिकतर क्रमसूचक आंकड़े (Ordinal Data) की आवश्यकता होती है, लेकिन कभी-कभी नामित आंकड़े (Nominal Data) पर भी इसका प्रयोग किया जा सकता है. |
6. पूर्वानुमानों के अतिक्रमण की संभावना (Susceptibility to Assumptions) | इसकी बहुत अधिक पूर्वकल्पनाएँ होती हैं, जिससे शोधकर्ता द्वारा उनके अतिक्रमण की संभावना अधिक होती है. | इसकी पूर्वकल्पनाएँ या अवधारणाएँ कम विस्तृत होती हैं, जिससे शोधकर्ता द्वारा अतिक्रमण करने की संभावना कम से कम होती है. अतिक्रमण को आसानी से पकड़ा जा सकता है. |
7. प्रतिदर्श के आकार का प्रभाव (Influence of Sample Size) | जब प्रतिदर्श का आकार 10 या उससे कम होता है, तब इसकी पूर्वकल्पनाओं की अवहेलना स्वाभाविक हो जाती है, जिससे यह कम उपयुक्त होता है. | जब प्रतिदर्श का आकार 10 या उससे कम होता है, तब इसका प्रयोग प्राचलिक सांख्यिकी से अधिक आसान तथा तीव्र होता है. यह अधिक उपयुक्त और लाभदायक होता है. |
8. सांख्यिकीय क्षमता (Statistical Efficiency) | जब प्रतिदर्श का आकार बड़ा होता है, तब इसकी सांख्यिकीय क्षमता अप्राचलिक सांख्यिकी से हमेशा अधिक होती है. | व्यवहारिकता के हिसाब से, यह प्राचलिक सांख्यिकी की अपेक्षा अधिक सुविधाजनक है. यदि पूर्वकल्पनाएँ संतुष्ट हों, तो यह प्राचलिक सांख्यिकी से श्रेष्ठ होता है. |
काई-वर्ग परीक्षण (Chi-Square Test) 📏
काई-वर्ग परीक्षण एक ऐसा अप्राचलिक सांख्यिकी (Non-Parametric Statistics) है जिसका प्रयोग बहुत सी दशाओं में पूर्व निर्धारित तथ्य और उपकल्पना में पाई जाने वाली सहमति या भिन्नता के अध्ययन के लिए किया जाता है
काई-वर्ग की उपयोगिता (Utility of Chi-Square) 🎯:
वितरण की सामान्यता की जाँच (Checking Normality of Distribution): काई-वर्ग का प्रयोग वितरण की सामान्यता की जाँच करने में की जाती है. इसे समरूपता (Goodness-of-fit) की संज्ञा दी जाती है
. प्रेक्षित और प्रत्याशित आवृत्तियों की व्याख्या (Interpretation of Observed and Expected Frequencies): इसका उपयोग प्रेक्षित आवृत्तियों तथा प्रत्याशित घटनाओं की व्याख्या करने में होता है
. बहु-चरों का अध्ययन (Study of Multiple Variables): काई-वर्ग परीक्षण द्वारा एक समय पर एक से अधिक चरों का, अन्य चरों पर प्रभाव का अध्ययन एक ही उपकल्पना के अंतर्गत एक साथ किया जा सकता है
. छोटे प्रतिदर्शों के लिए उपयुक्त (Suitable for Small Samples): काई-वर्ग परीक्षण ऐसी स्थितियों में विशेषतः उपयोगी रहता है, जहाँ परीक्षण के प्रतिदर्श की संख्या छोटी रहती है
. अन्य सांख्यिकीय परीक्षणों की सार्थकता (Significance of Other Statistical Tests): काई-वर्ग परीक्षण का प्रयोग कई महत्वपूर्ण सांख्यिकी की सार्थकता की जाँच करने में किया जाता है, जैसे फाई-गुणांक (Phi-coefficient), केंडल संगति गुणांक (Kendall’s Coefficient of Concordance), क्रुस्कल-वालिस एच परीक्षण (Kruskal-Wallis H Test), असंगत गुणांक (Coefficient of contingency) आदि
. चिकित्सा और मनोविज्ञान के क्षेत्र में (In Medical and Psychological Fields): चिकित्सा क्षेत्र में इसका उपयोग उल्लेखनीय है क्योंकि वहाँ प्रायः एक ही समय पर एक से अधिक चिकित्सा पद्धतियों के प्रभाव का अध्ययन किया जाता है
. मनोविज्ञान के क्षेत्र में भी प्रायः मुख्य अनुसंधान से पूर्व इसका प्रयोग अग्रगामी अध्ययन (Pilot Study) में किया जाता है .
काई-वर्ग के लाभ (Advantages of Chi-Square) ✨:
यदि आँकड़े आवृत्ति में हों तो काई-वर्ग का प्रयोग किया जाता है
. काई-वर्ग परीक्षण द्वारा यह पता आसानी से चल जाता है कि प्राप्त आवृत्तियाँ (Obtained Frequencies) किसी प्राकल्पना (Hypothesis) या सिद्धांत पर आधारित आवृत्तियों के आकार में अच्छी तरह फिट (fit) बैठता है या नहीं
.
काई-वर्ग की सीमाएँ (Limitations of Chi-Square) 🚧:
काई-वर्ग परीक्षण द्वारा मात्र यह पता चलता है कि किसी एक चर पर वर्गीकरण दूसरे चर पर वर्गीकरण से असंयोगवश संबंधित है या नहीं
. काई-वर्ग परीक्षण ऐसे संबंध की शक्ति के बारे में कुछ नहीं कहता है
. काई-वर्ग परीक्षण का उपयोग उन आँकड़ों पर नहीं हो सकता है जिनकी अभिव्यक्ति प्राप्तांकों के रूप में हुई है, तथा जिन्हें आवृत्ति या प्रतिशत समानुपात में बदलना संभव नहीं है
. काई-वर्ग परीक्षण एक अत्यंत ही सरल प्रकार की सांख्यिकी है, इसकी सरलता एवं सुगमता का लाभ उठाकर इसका प्रयोग प्रायः शोधकर्ता वैसी परिस्थिति में भी कर देते हैं, जहाँ पर इसे नहीं करना चाहिए
. कम आवृत्तियों के लिए येत्स संशोधन (Yates Correction) की आवश्यकता होती है
.