सहसंबंध (Correlation)
📐 सांख्यिकी के 25 आवश्यक सूत्र
बेसिक से गहराई तक – हर चिह्न, हर शब्द, और परीक्षा में कैसे पूछा जाएगा (UGC NET)
📍 समूह 1: सहसंबंध (Correlation)
सूत्र 1 – कार्ल पियर्सन का r (परिभाषा / विचलन रूप)
\[ r = \frac{\sum (X - \bar{X})(Y - \bar{Y})}{\sqrt{\sum (X - \bar{X})^2 \cdot \sum (Y - \bar{Y})^2}} \]
🧠 यह क्या है: यह दो चरों के बीच रैखिक संबंध की ताकत और दिशा का माप है। -1 से +1 के बीच।
🔣 चिह्नों का मतलब: X,Y = चर; \(\bar{X},\bar{Y}\) = माध्य; \((X-\bar{X})\) = माध्य से विचलन; \(\sum\) = सभी n अवलोकनों का योग
⚡ कब उपयोग: सिद्धांत समझने के लिए, या जब deviations पहले से दिए हों
📖 परीक्षा में: "r = Cov/(σxσy) से क्या तात्पर्य है?" – ऐसा प्रश्न
➕ अतिरिक्त: यह सूत्र इकाई-रहित है – इसलिए kg, रुपये, मीटर सब एक साथ तुलना कर सकते हैं
सूत्र 2 – कार्ल पियर्सन का r (गणना / उत्पाद-क्षण रूप)
\[ r = \frac{n\sum XY - (\sum X)(\sum Y)}{\sqrt{[n\sum X^2 - (\sum X)^2] \cdot [n\sum Y^2 - (\sum Y)^2]}} \]
🧠 यह क्या है: यह सूत्र 1 का ही व्यावहारिक रूप है – बिना माध्य निकाले सीधे योगों से r निकालता है
🔣 चिह्न: \(\sum XY\) = गुणनफल का योग; \(\sum X^2\) = X के वर्गों का योग
⚡ कब उपयोग: परीक्षा में सबसे ज्यादा – क्योंकि डेटा \(\sum X, \sum Y, \sum XY\) के रूप में दिया होता है
📖 परीक्षा में: सीधा संख्यात्मक प्रश्न – "दिए गए योगों से r ज्ञात करें"
➕ अतिरिक्त: यदि हर शून्य आए → X या Y में कोई भिन्नता नहीं → r अपरिभाषित
सूत्र 3 – सहप्रसरण (Covariance) – परिभाषा
\[ \text{Cov}(X,Y) = \frac{\sum (X - \bar{X})(Y - \bar{Y})}{n} \]
🧠 यह क्या है: यह बताता है कि X और Y एक साथ कैसे बदलते हैं – यह r का "कच्चा" रूप है
⚡ कब उपयोग: r = Cov/(σxσy) समझने के लिए
📖 परीक्षा में: "Cov(X,Y) = 0 का क्या अर्थ है?" → उत्तर: X और Y असंबद्ध (uncorrelated)
➕ अतिरिक्त: Cov(X,X) = Var(X) → स्वयं का सहप्रसरण = प्रसरण
सूत्र 4 – सहप्रसरण (गणना रूप)
\[ \text{Cov}(X,Y) = \frac{\sum XY}{n} - \bar{X}\bar{Y} \]
🧠 यह क्या है: Cov निकालने का तेज़ तरीका
🔣 चिह्न: \(\frac{\sum XY}{n}\) = गुणनफलों का औसत, \(\bar{X}\bar{Y}\) = माध्यों का गुणनफल
⚡ कब उपयोग: जब आपके पास \(\sum XY, \bar{X}, \bar{Y}\) हों
➕ अतिरिक्त: यह सूत्र r के अंश को समझने में मदद करता है
सूत्र 5 – स्पीयरमैन का रैंक सहसंबंध (बिना टाई)
\[ \rho = 1 - \frac{6\sum d_i^2}{n(n^2 - 1)} \]
🧠 यह क्या है: यह रैंकों के बीच सहसंबंध मापता है – यह आउटलायर से प्रभावित नहीं होता
🔣 dᵢ: \(d_i = \text{Rank}(X_i) - \text{Rank}(Y_i)\) – रैंकों का अंतर; \(\sum d_i^2\) = अंतरों के वर्गों का योग
⚡ कब उपयोग: जब डेटा क्रम (rank) में हो, या अत्यधिक विषम (skewed) हो, या अरेखीय (non-linear) संबंध हो
📖 परीक्षा में: "रैंक सहसंबंध कब उपयोग करते हैं?" → उत्तर: जब डेटा सामान्य वितरण में न हो या आउटलायर हों
➕ अतिरिक्त: यदि सभी d_i = 0 → ρ = 1 → पूर्ण सहमति
सूत्र 6 – स्पीयरमैन का ρ (टाई सहित – सुधार सहित)
\[ \rho = 1 - \frac{6\left[\sum d_i^2 + \frac{m^3 - m}{12} + \dots \right]}{n(n^2 - 1)} \]
🧠 यह क्या है: यह टाई (बराबर रैंक) होने पर सही ρ देता है
🔣 m: एक ही रैंक वाले अवलोकनों की संख्या (जैसे – तीन लोगों को दूसरा रैंक)
➕ अतिरिक्त: \(\frac{m^3 - m}{12}\) = टाई के लिए सुधार कारक – हर टाई समूह के लिए अलग से जोड़ना होता है
⚠️: यदि टाई हैं और आप साधारण सूत्र 5 लगाएँगे → ρ का मान थोड़ा अधिक/कम आएगा
📈 समूह 2: प्रतिगमन (Regression) के मूल सूत्र
सूत्र 7 – प्रतिगमन ढलान b (परिभाषा / विचलन रूप)
\[ b = \frac{\sum (X - \bar{X})(Y - \bar{Y})}{\sum (X - \bar{X})^2} \]
🧠 अर्थ: यह प्रतिगमन रेखा की ढलान है – X में 1 इकाई बदलाव पर Y में औसत बदलाव
➕ अतिरिक्त: b का चिन्ह r के चिन्ह के समान होता है
सूत्र 8 – b (गणना रूप)
\[ b = \frac{n\sum XY - (\sum X)(\sum Y)}{n\sum X^2 - (\sum X)^2} \]
📖 परीक्षा: "दिए गए \(\sum X, \sum Y, \sum XY, \sum X^2\) से b ज्ञात करें"
सूत्र 9 – b (r और मानक विचलन से) – सबसे महत्वपूर्ण
\[ b_{YX} = r \cdot \frac{\sigma_Y}{\sigma_X} \]
📖 UGC NET: "यदि r = 0.6, σx = 2, σy = 3, तो bYX ज्ञात करें" → \(0.6 \times 3/2 = 0.9\)
➕ अतिरिक्त: यदि X और Y मानकीकृत हों (σx = σy = 1) → b = r
सूत्र 10 – अंत:खंड a (Intercept)
\[ a = \bar{Y} - b\bar{X} \]
⚡ कब उपयोग: b निकालने के तुरंत बाद a निकालने के लिए – प्रतिगमन समीकरण पूरा करने के लिए
📖 परीक्षा: "प्रतिगमन रेखा का अंत:खंड क्या होगा?"
सूत्र 11 – प्रतिगमन समीकरण
\[ \hat{Y} = a + bX \]
📖 प्रश्न: "प्रतिगमन समीकरण \(\hat{Y} = 5 + 2X\) है, X = 3 पर Y का अनुमान बताएँ" → उत्तर: 11
सूत्र 12 – दूसरा प्रतिगमन गुणांक bXY
\[ b_{XY} = r \cdot \frac{\sigma_X}{\sigma_Y} \]
➕ अतिरिक्त: bYX और bXY के चिन्ह हमेशा समान होते हैं (दोनों + या दोनों -)
सूत्र 13 – r को दोनों b से निकालना
\[ r = \pm \sqrt{b_{YX} \cdot b_{XY}} \]
📖 प्रश्न: "bYX = 1.2, bXY = 0.3, r ज्ञात करें" → \(\sqrt{1.2 \times 0.3} = \sqrt{0.36} = 0.6\)
⚠️: यदि गुणनफल > 1 → r > 1 → असंभव → डेटा में त्रुटि
📊 समूह 3: निर्धारण का गुणांक (R²) और सम्बन्धित
सूत्र 14 – R² (सरल प्रतिगमन में)
\[ R^2 = r^2 \]
📖 प्रश्न: "यदि r = 0.8, तो Y में कितना % भिन्नता X समझाता है?" → 64%
सूत्र 15 – R² (विचरण विभाजन से)
\[ R^2 = \frac{\sum (\hat{Y} - \bar{Y})^2}{\sum (Y - \bar{Y})^2} \]
सूत्र 16 – R² (त्रुटि वर्गों से)
\[ R^2 = 1 - \frac{\sum (Y - \hat{Y})^2}{\sum (Y - \bar{Y})^2} \]
➕ अतिरिक्त: यदि मॉडल एकदम सही हो → त्रुटि = 0 → R² = 1
सूत्र 17 – समायोजित R² (Adjusted R²)
\[ \bar{R}^2 = 1 - (1 - R^2)\frac{n-1}{n-k-1} \]
📖 प्रश्न: "Adjusted R², R² से कम क्यों होता है?" → क्योंकि यह अनावश्यक चरों को दंड देता है
➕ अतिरिक्त: Adjusted R² ऋणात्मक हो सकता है (यदि मॉडल बहुत खराब हो)
⚙️ समूह 4: मानक त्रुटि (Standard Errors) और t-परीक्षण
सूत्र 18 – b की मानक त्रुटि SE(b)
\[ SE(b) = \frac{\sigma_u}{\sqrt{\sum (X - \bar{X})^2}} \]
➕ अतिरिक्त: यदि X में अधिक भिन्नता हो → SE(b) छोटी → b अधिक सटीक
सूत्र 19 – a की मानक त्रुटि SE(a)
\[ SE(a) = \sigma_u \sqrt{\frac{1}{n} + \frac{\bar{X}^2}{\sum (X - \bar{X})^2}} \]
सूत्र 20 – त्रुटि का मानक विचलन σᵤ (Root Mean Squared Error)
\[ \sigma_u = \sqrt{\frac{\sum (Y - \hat{Y})^2}{n-2}} \]
अर्थ: यह त्रुटियों (residuals) का मानक विचलन है – मॉडल की "फिट की गुणवत्ता" बताता है
सूत्र 21 – t-सांख्यिकी (t-statistic)
\[ t = \frac{b - 0}{SE(b)} \]
📖 प्रश्न: "t-मान 2.5 है, 5% महत्व स्तर पर क्या निष्कर्ष होगा?" → शून्य परिकल्पना अस्वीकार
🔍 समूह 5: अर्थमितीय निदान (Diagnostic) सूत्र
सूत्र 22 – डर्बिन-वॉटसन (DW) – स्वसहसंबंध के लिए
\[ DW = \frac{\sum (u_t - u_{t-1})^2}{\sum u_t^2} \]
📖 परीक्षा: "DW = 1.2 का क्या अर्थ है?" → उत्तर: धनात्मक स्वसहसंबंध
नियम: DW = 2 → कोई स्वसहसंबंध नहीं; DW < 2 → धनात्मक; DW > 2 → ऋणात्मक
सूत्र 23 – VIF (Variance Inflation Factor) – बहुसहसंबंध के लिए
\[ VIF_j = \frac{1}{1 - R_j^2} \]
📖 प्रश्न: "VIF का मान 15 है, इसका क्या अर्थ है?" → उत्तर: गंभीर बहुसहसंबंध
नियम: VIF > 10 → गंभीर बहुसहसंबंध; VIF > 5 → मध्यम चिंता
🧩 समूह 6: दोनों प्रतिगमन गुणांकों के बीच सम्बन्ध (पुनः)
सूत्र 24 – bYX (Y on X)
\[ b_{YX} = r \cdot \frac{\sigma_Y}{\sigma_X} \]
सूत्र 25 – bXY (X on Y)
\[ b_{XY} = r \cdot \frac{\sigma_X}{\sigma_Y} \]
सारांश: (ये सूत्र 9 और 12 ही हैं, लेकिन सूत्रों की संख्या 25 पूरी करने के लिए यहाँ दोहराए गए हैं।)
UGC NET सांख्यिकी – 25 सूत्रों का संपूर्ण विवरण (LaTeX के साथ)
Comments
Post a Comment