Friday 8 December 2017

स्टाटा फॉरेक्स में आदेशित मॉडल का आदेश दिया


तो Im एक परीक्षा के लिए अध्ययन करने की कोशिश कर रहा है और मुझे यकीन नहीं है कि मैं इस स्टेटस पर चल रहा था। डेटा ऋण स्वीकृति पर है और सफेद एक डमी वैरिएबल है, 1 अगर कोई व्यक्ति सफेद था, और 0 अगर वह व्यक्ति नहीं था। यह कैसे पढ़ा जाए पर कोई भी मदद काफी सराहना की जाएगी। क्या ज्यादातर के लिए देख रहे हैं कि कैसे गोरों और nonwhites दोनों के लिए ऋण अनुमोदन की अनुमानित संभावना को प्राप्त करना है क्या कोई मुझे यहाँ पर पाठ के साथ मदद कर सकता है और इसे सामान्य कैसे बना सकता है मुझे खेद है मुझे यह नहीं पता कि यह कैसे करना है। चर के लिए सफेद: निरंतर के लिए: सामान्य तौर पर, आप एक प्रोबेट रिग्रेसन के आउटपुट (किसी भी मानक तरीके से नहीं, कम से कम) के गुणांक को व्याख्या नहीं कर सकते। आपको regressors के सीमांत प्रभावों की व्याख्या करने की आवश्यकता है, अर्थात्, परिणाम परिवर्तनीय परिवर्तन की कितनी (सशर्त) संभाव्यता जब आप एक दूसरे के गुण को बदलते हैं, तो कुछ अन्य मूल्यों पर निरंतर सभी अन्य रेग्रेसर धारण करते हैं। यह रैखिक प्रतिगमन के मामले से अलग है, जहां आप सीधे अनुमानित गुणांकों की व्याख्या कर रहे हैं। ऐसा इसलिए है क्योंकि रैखिक प्रतिगमन के मामले में, प्रतिगमन गुणांक सीमांत प्रभाव हैं। प्रोबिट प्रतिगमन में, एक बार जब आप प्रोबेट रिग्रेसिंग फिट की गणना करते हैं तो सीमांत प्रभाव प्राप्त करने के लिए आवश्यक गणना का एक अतिरिक्त चरण होता है। रैखिक और प्रोबेट रिग्रेसन मॉडल याद रखें कि प्रोटीट मॉडल में, आप सफल परिणाम के (सशर्त) संभावना को मॉडलिंग कर रहे हैं, अर्थात्, यी 1, मैथबब वाई वाई 1 एमआईडी एक्स, एलडीओटी, एक्स बीटा, एलडीओट्स, बीटाकेराइट फि (बीटा 0 बी के बी बेटकैक्स) जहां एफआई (सीडीट) है मानक सामान्य वितरण का संचयी वितरण कार्य। यह मूल रूप से कहता है कि, regressors पर सशर्त, संभावना है कि परिणाम चर, यी 1 है, regressors के एक रैखिक संयोजन का एक निश्चित कार्य है। रेखीय प्रतिगमन । रैखिक प्रतिगमन मॉडल से इसकी तुलना करें, जहां गणित बाबा (यिमिड एक्स, एलडीओट्स, एक्स बीटा 0, एलडीओट्स, बीटाकेराइट) बीटा 0 बी के बी कश्मीर betakx परिणाम का (सशर्त) मतलब रेग्रेसरों का एक रैखिक संयोजन है। सीमांत प्रभाव रेखीय प्रतिगमन मॉडल के अलावा, गुणांक में शायद ही कभी कोई सीधा व्याख्या होती है। हम आमतौर पर परिणाम चर के गुणों को प्रभावित करने वाले रेग्रेसरों में किए गए परिवर्तनों के कैटरिस पैराबिस प्रभावों में रुचि रखते हैं। यह धारणा है कि सीमांत प्रभाव उपाय रेखीय प्रतिगमन । अब मैं जानना चाहूंगा कि जब मैं एक रेग्रेसरों में से एक को स्थानांतरित करता हूं तो परिणाम के चलने का मतलब कितना होता है, लेकिन यह केवल प्रतिगमन सहपरिवार है, जिसका मतलब है कि के-वें रिग्रेसर में बदलाव का सीमांत असर सिर्फ प्रतिगमन गुणांक है । प्रतिगमन को चालू करें हालांकि, यह देखना आसान है कि यह प्रोबेट प्रतिगमन frac leftYi1mid X, ldots, X beta0, ldots, betaKright betakphi (beta0 sum K betakX) के लिए नहीं है जो कि प्रतिगमन गुणांक के समान नहीं है ये प्रोसिट मॉडल के लिए सीमांत प्रभाव हैं, और वह मात्रा जिसके बाद हम हैं। विशेष रूप से, यह अन्य सभी रिग्रेसर के मूल्यों पर निर्भर करता है, और प्रतिगमन गुणांक। यहां फो (सीडीओटी) मानक सामान्य संभावना घनत्व फ़ंक्शन है। आप इस मात्रा की गणना कैसे कर रहे हैं, और अन्य सूत्रों के विकल्प क्या हैं जो इस फॉर्मूले में प्रवेश कर सकते हैं शुक्र, स्टेटा एक प्रोबेट प्रतिगमन के बाद यह गणना प्रदान करता है, और अन्य रेग्रेसर के विकल्पों के कुछ चूक प्रदान करता है (कोई सार्वभौमिक समझौता नहीं है इन चूक पर) असतत रिग्रेसरों का ध्यान रखें कि उपर्युक्त में से बहुत से लगातार अनुगमन के मामले में लागू होता है, क्योंकि हमने पथरी का इस्तेमाल किया है। असतत रिग्रेसर के मामले में, आपको असतत परिवर्तनों का उपयोग करना होगा। उदाहरण के लिए, उदाहरण के लिए, एक रिग्रेसर एक्स में असतत परिवर्तन जो मान लेता है, वह छोटा होता है डेल्टा माथबब छोड़ दिया Yi1mid X, ldots, X beta0, ldots, betaKrightampbetakphi (beta0 sum betalX betak राशि Kbetal X) ampquad - betakphi (beta0 sum betalX sum Kbetal एक्स) स्टैट प्रोबेट रिग्रेसन में कॉम्प्यूटिंग सीमांत प्रभाव। यहां स्टेटा में एक प्रोबेट रिग्रेसन के बाद सीमांत प्रभाव की गणना का एक उदाहरण है। यहां मार्जिन कमांड से प्राप्त आउटपुट यह है, उदाहरण के लिए, यह व्याख्या की जा सकती है कि उम्र चर में एक इकाई परिवर्तन, 0.003442 द्वारा यूनियन की स्थिति की संभावना बढ़ जाती है। इसी प्रकार, दक्षिण से होने पर, 0.1054928 रैखिक प्रतिगमन द्वारा संघ की स्थिति की संभावना कम हो जाती है। अंतिम जांच के रूप में, हम पुष्टि कर सकते हैं कि रेखीय प्रतिगमन मॉडल में सीमांत प्रभाव प्रतिगमन गुणांक (एक छोटा मोड़ के साथ) के समान है। निम्नलिखित प्रतिगमन को चलाने और सीमांत प्रभाव की गणना करने के बाद बस आपको प्रतिगमन गुणांक वापस देता है। रोचक तथ्य यह ध्यान रखें कि स्टेटा एक रेग्रेजर के शुद्ध सीमांत प्रभाव की गणना करता है जिसमें मॉडल में शामिल होने पर द्विघात शर्तों के जरिए प्रभाव शामिल होता है। नोटिस: आईडीआरई सांख्यिकी परामर्श समूह वेबसाइट को फरवरी में वर्डप्रेस सीएमएस के लिए रखरखाव और निर्माण की सुविधा के लिए माइग्रेट करेगा नई सामग्री का हमारे कुछ पुराने पृष्ठों को हटा दिया जाएगा या संग्रहीत किया जाएगा ताकि उन्हें अब बनाए रखा नहीं जाएगा हम रीडायरेक्ट बनाए रखने का प्रयास करेंगे ताकि पुरानी यूआरएल हम जितनी अच्छी तरह काम कर सकें उतना काम जारी रहेगा। डिजिटल रिसर्च और एजुकेशन फॉर डिजिटल रिसर्च एंड एजुकेशन में आपका स्वागत है उपहार देने के लिए स्टेट कंसल्टिंग ग्रुप द्वारा सहायता करें। डेटा स्टैट डेटा विश्लेषण उदाहरणों की संभावना प्रतिगमन संस्करण जानकारी: इस पेज के लिए कोड स्टाटा 12 में परीक्षण किया गया था। प्रोबेट मॉडल को प्रोबेट मॉडल भी कहा जाता है, मॉडल के लिए इस्तेमाल किया जाता है द्विगोष्ट या द्विआधारी परिणाम चर प्रोबिट मॉडल में, संभाव्यता के व्युत्क्रम मानक सामान्य वितरण को भविष्यवाणियों के एक रैखिक संयोजन के रूप में दिखाया गया है। कृपया ध्यान दें: इस पृष्ठ का उद्देश्य यह दिखाना है कि विभिन्न डेटा विश्लेषण आदेशों का उपयोग कैसे करें। इसमें अनुसंधान प्रक्रिया के सभी पहलुओं को शामिल नहीं किया जाता है जो शोधकर्ताओं को करना अपेक्षित है। विशेष रूप से, इसमें डेटा सफाई और जांच, मान्यताओं का सत्यापन, मॉडल निदान और संभावित अनुवर्ती विश्लेषण शामिल नहीं हैं। उदाहरण 1: मान लीजिए कि हम उन कारकों में रुचि रखते हैं जो एक राजनीतिक उम्मीदवार को चुनाव जीतते हैं या नहीं। परिणाम (प्रतिक्रिया) चर द्विआधारी (01) जीत या हार है ब्याज की भविष्यवाचक चर इस अभियान पर खर्च किए गए धन की राशि है, जो कि समय-समय पर प्रचार अभियान खर्च करता है और क्या उम्मीदवार एक पदाधिकारी है। उदाहरण 2: स्नातक विद्यालय में प्रवेश के लिए स्नातक संस्थान की प्रतिष्ठा, जीआरए (ग्रेजुएट रिकॉर्ड एग्जाम स्कोर), जीपीए (ग्रेड पॉइंट औसत) और प्रतिष्ठा के रूप में चर, जैसे एक शोधकर्ता रुचि रखते हैं प्रतिक्रिया चर, admitdont प्रवेश, एक द्विआधारी चर है डेटा का विवरण नीचे हमारे डेटा विश्लेषण के लिए, हम स्नातक विद्यालय में आने के बारे में उदाहरण 2 पर विस्तार करने जा रहे हैं। हमने काल्पनिक डेटा तैयार किया है, जो हमारी वेबसाइट से प्राप्त किया जा सकता है। इस डेटा सेट में बाइनरी रिस्पॉन्स (परिणाम, आश्रित) चर नामांकित है तीन भविष्यवक्ता चर: ग्रीक हैं। जीपीए और रैंक हम वैरिएबल ग्रीक और जीपीए को सतत के रूप में मानेंगे। चर रैंक क्रमफल है, यह 1 से 4 के मूल्यों पर ले जाता है। 1 के रैंक वाले संस्थानों में सर्वोच्च प्रतिष्ठा है, जबकि 4 के रैंक वाले लोग सबसे कम हैं हम पद के रूप में स्पष्ट रूप से इलाज करेंगे जिन विश्लेषण विधियों पर आप विचार कर सकते हैं, वे नीचे दिए गए कुछ विश्लेषण विधियों की एक सूची है जिनका आप सामना कर सकते हैं। सूचीबद्ध कुछ विधियां काफी उचित हैं, जबकि अन्य ने या तो पक्षपात से बाहर हो या सीमाएं हैं प्रतिगमन को चालू करें, इस पृष्ठ का फ़ोकस करें। रसद प्रतिगमन। एक लॉगिट मॉडल इसी तरह की प्रोबिट रिग्रेसन परिणाम उत्पन्न करेगा I प्रॉफिट बनाम लॉगटी का विकल्प व्यक्तिगत प्राथमिकताओं पर निर्भर करता है। ओएलएस प्रतिगमन जब द्विआधारी प्रतिक्रिया चर के साथ प्रयोग किया जाता है, तो यह मॉडल एक रैखिक संभावना मॉडल के रूप में जाना जाता है और सशर्त संभावनाओं का वर्णन करने के लिए एक तरीका के रूप में उपयोग किया जा सकता है। हालांकि, रैखिक संभावना मॉडल से त्रुटियों (अर्थात शेष) ओएलएस प्रतिगमन के गलतियों की गलतियों के समरूपता और सामान्यता का उल्लंघन करती है, जिसके परिणामस्वरूप अमान्य मानक त्रुटियों और परिकल्पना परीक्षण होते हैं। रैखिक संभावना मॉडल के साथ इन और अन्य समस्याओं की अधिक गहन चर्चा के लिए, लांग (1997, पृष्ठ 38-40) देखें। दो-समूह भेदभाव समारोह विश्लेषण द्विपातिक परिणाम चर के लिए एक बहुभिन्नरूपी विधि Hotellings T 2. 01 परिणाम समूह चर में बदल गया है, और पूर्व predictors परिणाम चर में बदल रहे हैं। यह महत्व का एक समग्र परीक्षण का उत्पादन करेगा, लेकिन प्रत्येक चर के लिए अलग-अलग गुणांक नहीं देगा, और यह स्पष्ट नहीं है कि प्रत्येक उद्धरण चिह्न को अन्य उद्धरणों के प्रभाव के लिए समायोजित किया जाता है। प्रश्नोत्तरी प्रतिगमन प्रोबेट कमांड का उपयोग करने के लिए हम प्रोबेट प्रतिगमन मॉडल मैं रैंक से पहले यह इंगित करता है कि रैंक एक कारक वैरिएबल (यानि स्पष्ट वैरिएबल) है, और यह मॉडल में सूचक चर की एक श्रृंखला के रूप में शामिल किया जाना चाहिए। ध्यान दें कि यह सिंटैक्स स्टैटा 11 में पेश किया गया था। ऊपर दिए गए आउटपुट में, हम पहले चलने वाले लॉग को देखते हैं, यह इंगित करता है कि मॉडल को कितनी तेजी से इकट्ठा किया गया। लॉग की संभावना (-22 9.20658) नेस्टेड मॉडलों की तुलना में इस्तेमाल किया जा सकता है, लेकिन हम इसके उदाहरण का एक उदाहरण नहीं दिखाते हैं। इसके अलावा आउटपुट के शीर्ष पर हम देखते हैं कि हमारे डेटा सेट के सभी 400 निरीक्षणों का उपयोग विश्लेषण में किया गया था (हमारे अवलोकनों में से कोई भी वैल्यू नहीं है अगर कम अवलोकन प्रयोग किया गया होता) 0.000101 की पी-मान के साथ 41.56 की संभावना अनुपात ची-स्क्वायर हमें बताता है कि हमारे पूरे मॉडल सांख्यिकीय रूप से महत्वपूर्ण है, यह है कि यह किसी मॉडल के मुकाबले काफी बेहतर फिट बैठता है, जिसमें कोई अनुमान नहीं है। तालिका में हम गुणांक, उनकी मानक त्रुटियों, जेड-आंकड़े, जुड़े पी-मान, और गुणकों के 95 आत्मविश्वास अंतराल को देखते हैं। दोनों gre जीपीए और रैंक के लिए तीन सूचक चर सांख्यिकीय रूप से महत्वपूर्ण हैं। प्रोबेट प्रतिगमन गुणांक ने भविष्यवक्ता में एक इकाई परिवर्तन के लिए z-score या probit सूचकांक में परिवर्तन दिया है। ग्रिल में एक इकाई वृद्धि के लिए z-score 0.001 से बढ़ता है जीपीए में प्रत्येक एक यूनिट के लिए बढ़ोतरी z स्कोर 0.478 से बढ़ता है। रैंक के लिए सूचक चर एक थोड़ा अलग व्याख्या है। उदाहरण के लिए, 2 के रैंक के एक स्नातक संस्थान में भाग लेते हुए, एक रैंक (1 संदर्भ समूह) के साथ एक संस्था बनाम, 0.415 द्वारा z - स्कोर कम करता है। हम टेस्ट कमान का उपयोग करके रैंक के संपूर्ण प्रभाव के लिए परीक्षण कर सकते हैं। नीचे हम देखते हैं कि रैंक का समग्र प्रभाव सांख्यिकीय रूप से महत्वपूर्ण है। हम रैंक के विभिन्न स्तरों के लिए गुणांकों में अंतर के बारे में अतिरिक्त अनुमानों का परीक्षण भी कर सकते हैं। नीचे हम यह जांचते हैं कि रैंक 2 के गुणांक रैंक 3 के गुणांक के बराबर है। आप मॉडल को समझने में सहायता के लिए अनुमानित संभाव्यताओं का भी उपयोग कर सकते हैं। आप मार्जिन कमांड का उपयोग करके भविष्यवाणी की संभावनाओं की गणना कर सकते हैं, जो स्टेटा 11 में पेश किया गया था। नीचे हम रैंक के प्रत्येक स्तर पर प्रवेश की भविष्यवाणी की संभावना की गणना के लिए मार्जिन कमांड का उपयोग करते हैं। मॉडल में अपने सभी तरीकों को अपने साधनों पर रखते हुए पूर्वानुमानित संभावनाओं की गणना करने के लिए मार्जिन कमांड का उपयोग करने के बारे में अधिक जानकारी के लिए, हमारे पेज को भविष्यवाणी की संभावनाओं के लिए मार्जिन का उपयोग करना देखें। उपरोक्त आउटपुट में हम देखते हैं कि स्नातक कार्यक्रम में स्वीकार किए जाने की भविष्यवाणी की संभाव्यता उच्चतम प्रतिष्ठा स्नातक संस्थानों (रैंक 1) के लिए 0.52 है, और निम्नतम रैंक वाली संस्थानों (रैंक 4) के लिए 0.1 9 है, उनके माध्यम से ग्रीक और जीपी को धारण करते हैं नीचे हम ग्रेट के मूल्यों की 200 से 800 के मूल्यों के लिए अनुमानित संभाव्यता उत्पन्न करते हैं 100. क्योंकि हमने या तो atmeans को निर्दिष्ट नहीं किया है या उन मानों को निर्दिष्ट करने के लिए उपयोग किया है, जिस पर अन्य प्रिकेटर चर रखा जाता है, तालिका में मान हैं औसत अनुमानित संभाव्यता, अन्य पूर्वानुमानकर्ता चर के नमूना मूल्यों का उपयोग करके गणना की गई है। उदाहरण के लिए, औसत अनुमानित संभाव्यता की गणना करने के लिए जब gre 200, अनुमानित संभावना प्रत्येक मामले के लिए गणना की गई थी, उस स्थिति का उपयोग करके रैंक और जीपीए का मूल्य। उपरोक्त तालिका में हम देख सकते हैं कि स्वीकार्य होने की संभावना का अनुमान केवल 0.16 है अगर जीआरई स्कोर 200 है और 0.42 हो जाता है, यदि जीआरई स्कोर 800 है (जीपीए और रैंक के नमूना मूल्यों में औसत )। मॉडल को प्रस्तुत करने और समझने के लिए पूर्वानुमानित संभावनाओं के ग्राफ का उपयोग करने के लिए भी उपयोगी हो सकता है। हम यह भी देख सकते हैं कि हमारे मॉडल को कितनी अच्छी तरह फिट बैठता है। प्रतिस्पर्धा मॉडल की तुलना करते समय यह विशेष रूप से उपयोगी हो सकता है उपयोगकर्ता द्वारा लिखित कमान फिटस्टैट विभिन्न प्रकार के फिट आँकड़े बनाती है Findst fitstat टाइप करके फिटस्टेट पर अधिक जानकारी प्राप्त कर सकते हैं (देखें कि मैं प्रोग्राम को खोजने के लिए कैसे खोजी कमांड का उपयोग कर सकता हूं और खोज के उपयोग के बारे में अधिक जानकारी के लिए अतिरिक्त सहायता प्राप्त कर सकता हूं)। रिक्त कोशिकाओं या छोटे कक्षों पर विचार करने के लिए चीजें: स्पष्ट पूर्वानुमानियों और परिणाम चर के बीच क्रॉसस्टैब करके खाली या छोटे कक्षों की जांच करनी चाहिए। यदि एक कक्ष में बहुत कम मामलों (एक छोटा सेल) है, तो मॉडल अस्थिर हो सकता है या यह बिल्कुल भी नहीं चल सकता है। पृथक्करण या अर्ध-पृथक्करण (जिसे पूर्ण भविष्यवाणी भी कहा जाता है), ऐसी स्थिति जिसमें परिणाम स्वतंत्र चर के कुछ स्तरों पर भिन्न नहीं होता है। हमारा पृष्ठ अक्सर पूछे जाने वाले प्रश्न: लॉगिस्टिकप्रोबिट प्रतिगमन में पूर्ण या अर्ध-पूर्ण जुदाई क्या है और हम सही भविष्यवाणियों के साथ मॉडल के बारे में जानकारी के लिए कैसे व्यवहार करते हैं। नमूना आकार: प्रोबिट और लॉजिट मॉडल दोनों में ओएलएस प्रतिगमन की तुलना में अधिक मामलों की आवश्यकता होती है क्योंकि वे अधिकतम संभावना अनुमान तकनीकों का उपयोग करते हैं। डेटासेट में द्विआधारी परिणामों के लिए मॉडल का अनुमान लगाने के लिए कभी-कभी संभव है, सटीक रिक्तियां रिग्रेसन (एक्सलोगिस्टिक कमांड का उपयोग करके) का उपयोग करके केवल कुछ ही मामलों में। अधिक जानकारी के लिए सटीक रसद प्रतिगमन के लिए हमारा डेटा विश्लेषण उदाहरण देखें। यह भी ध्यान में रखना महत्वपूर्ण है कि जब परिणाम बहुत कम होता है, भले ही संपूर्ण डाटासेट बड़ा हो, तो एक मॉडल का अनुमान लगाने में मुश्किल हो सकती है। छद्म - R - वर्ग: psuedo-R - squared के कई अलग-अलग उपाय मौजूद हैं। वे सभी को ओएलएस प्रतिगमन में आर-स्क्ववर्ड द्वारा प्रदान की गई जानकारी के समान जानकारी प्रदान करने का प्रयास करते हैं, हालांकि उनमें से कोई भी ठीक से व्याख्या नहीं की जा सकती है क्योंकि ओएलएस प्रतिगमन में आर-स्क्वायर व्याख्या की गई है। विभिन्न छद्म-आर-स्क्वेर के बारे में चर्चा के लिए लांग एंड फ्रेज़ (2006) या हमारे अकसर किये गए पृष्ठ देखें, छद्म आर-स्क्वेर, स्टैट्स में क्या है, 0 के मान को परिणाम वैरिएबल के एक स्तर के रूप में माना जाता है, और अन्य सभी गैर-अनुपलब्ध मान परिणाम के दूसरे स्तर के रूप में माना जाता है डायग्नोस्टिक्स: प्रोस्टेट प्रतिगमन के लिए निदान ओएलएस प्रतिगमन के लिए अलग हैं प्रोबिट मॉडल के लिए निदान उन लोगों के समान हैं जो लॉजिट मॉडल हैं। रिक्तिगत प्रतिगमन के लिए मॉडल निदान के बारे में चर्चा के लिए, होस्मर और लेमेसो (2000, अध्याय 5) देखें। सन्दर्भ होस्मर, डी। लेमेसो, एस (2000)। व्यावहारिक उपस्कर प्रतिगमन (द्वितीय संस्करण) न्यूयॉर्क: जॉन विली सन्स, इंक लांग, जे स्कॉट (1 99 7) श्रेणीबद्ध और सीमित निर्भर चर के लिए प्रतिगमन मॉडल हजार ओक्स, सीए: ऋषि प्रकाशन इस वेब साइट की सामग्री को कैलिफोर्निया विश्वविद्यालय द्वारा किसी विशेष वेब साइट, किताब या सॉफ़्टवेयर उत्पाद के समर्थन के रूप में नहीं समझा जाना चाहिए।

No comments:

Post a Comment