सांख्यिकीय डेटा प्रस्तुत करने के तरीके। सांख्यिकीय विशेषताओं और अनुसंधान
यूओ एफपीबी मित्सो
रसद विभाग
सुर नंबर 1
विषय पर अनुशासन सांख्यिकी: "सांख्यिकीय जानकारी की प्रस्तुति के तरीके और रूप"
प्रदर्शन किया
द्वितीय वर्ष का छात्र
एफ-टा एमईओआईएम डी / ओ
समूह 916
वरीना ई. ए.
शिक्षक द्वारा जाँच की गई
बोंदर एस.वी.
मिन्स्क, 2010
एक विशेष सांकेतिक प्रणाली - एक कृत्रिम सांकेतिक भाषा - के रूप में सांख्यिकीय डेटा का प्रतिनिधित्व करने की ग्राफिकल विधि की व्याख्या सांकेतिक विज्ञान, संकेतों और संकेत प्रणालियों के विज्ञान के विकास से जुड़ी है।
एक सांख्यिकीय ग्राफ एक रेखाचित्र है जिसमें सशर्त ज्यामितीय छवियों या संकेतों का उपयोग करके कुछ संकेतकों की विशेषता वाली सांख्यिकीय आबादी का वर्णन किया गया है। ग्राफ़ के रूप में तालिका डेटा की प्रस्तुति संख्याओं की तुलना में अधिक मजबूत प्रभाव डालती है, आपको सांख्यिकीय अवलोकन के परिणामों को बेहतर ढंग से समझने की अनुमति देती है, उनकी सही व्याख्या करती है, सांख्यिकीय सामग्री की समझ को बहुत आसान बनाती है, इसे दृश्य और सुलभ बनाती है। हालांकि, इसका मतलब यह नहीं है कि रेखांकन केवल उदाहरण हैं। प्रारंभिक जानकारी को सामान्य बनाने की एक विधि होने के नाते, वे शोध के विषय के बारे में नया ज्ञान प्रदान करते हैं।
ग्राफिक छवि का निर्माण करते समय, कई आवश्यकताओं को देखा जाना चाहिए। सबसे पहले, ग्राफ पर्याप्त रूप से दृश्य होना चाहिए, क्योंकि विश्लेषण की एक विधि के रूप में ग्राफिक छवि का पूरा बिंदु सांख्यिकीय संकेतकों को नेत्रहीन रूप से चित्रित करना है। इसके अलावा, अनुसूची अभिव्यंजक, समझदार और समझने योग्य होनी चाहिए।
ग्राफ में एक ग्राफिक छवि होती है और सहायक तत्व. एक ग्राफिक छवि रेखाओं, आंकड़ों, बिंदुओं का एक संग्रह है जो सांख्यिकीय डेटा का प्रतिनिधित्व करती है। सांख्यिकीय रेखांकन में उपयोग किए जाने वाले व्यास चिह्न, रेखाचित्र या चित्र विविध हैं। ये बिंदु, सीधी रेखाओं के खंड, आकृतियों के रूप में चिन्ह हैं विभिन्न आकार, हैचिंग या कलरिंग (वृत्त, वर्ग, आयत, आदि)। इन संकेतों का उपयोग तुलना की गई आबादी के पूर्ण और सापेक्ष आकार का प्रतिनिधित्व करने वाले सांख्यिकीय मूल्यों की तुलना करने के लिए किया जाता है। ग्राफ पर तुलना कुछ मापों के अनुसार की जाती है: आकृति के किसी एक पक्ष का क्षेत्रफल या लंबाई, बिंदुओं का स्थान, उनका घनत्व, हैचिंग का घनत्व, रंग की तीव्रता या रंग।
सहायक तत्वों में एक सामान्य शीर्षक शामिल होता है, कन्वेंशनों, कुल्हाड़ियों का समन्वय, तराजू के साथ तराजू और एक संख्यात्मक ग्रिड।
ग्राफ़ पर रखी गई ज्यामितीय छवियों की मौखिक व्याख्या (ग्राफ़ की व्याख्या), उनके विन्यास, छायांकन या रंग में भिन्न, आपको ज्यामितीय छवियों से ग्राफ़ पर दर्शाई गई घटनाओं और प्रक्रियाओं के लिए मानसिक रूप से स्थानांतरित करने की अनुमति देती है।
सांख्यिकीय रेखांकन में, आयताकार निर्देशांक प्रणाली का सबसे अधिक उपयोग किया जाता है, लेकिन ध्रुवीय निर्देशांक (परिपत्र रेखांकन) के सिद्धांत पर आधारित ग्राफ भी होते हैं।
जब ग्राफ़ को आयताकार निर्देशांक में प्लॉट किया जाता है, तो दर्शाई गई घटनाओं या प्रक्रियाओं की सांख्यिकीय विशेषताओं की विशेषताओं को एक निश्चित क्रम में क्षैतिज भुज और निर्देशांक के ऊर्ध्वाधर अक्ष पर रखा जाता है, और ज्यामितीय संकेत जो स्वयं ग्राफ़ बनाते हैं ग्राफ क्षेत्र में। ग्राफ़ फ़ील्ड वह स्थान है जिसमें ग्राफ़ बनाने वाले ज्यामितीय चिह्न स्थित होते हैं।
समन्वय अक्षों पर स्थित विशेषताएं गुणात्मक और मात्रात्मक हो सकती हैं।
में से एक महत्वपूर्ण कार्यसांख्यिकीय ग्राफ इसकी रचना है: सांख्यिकीय सामग्री का चयन, छवि पद्धति का चुनाव, अर्थात। चार्ट प्रारूप। ग्राफ का आकार इसके उद्देश्य के अनुरूप होना चाहिए।
ग्राफ़ का शीर्षक (नाम) उस कार्य को परिभाषित करता है जिसे ग्राफ़ की सहायता से हल किया जाता है, उस स्थान और समय का विवरण देता है जिसे ग्राफ़ संदर्भित करता है।
तराजू के शिलालेख उन इकाइयों को इंगित करते हैं जिनमें सुविधाओं को मापा जाता है। प्रत्येक पैरामीटर के मानों के अंक स्केल स्केल के सीमा चिह्नों पर रखे जाते हैं।
एक स्केल बार एक रेखा (आमतौर पर एक सांख्यिकीय ग्राफ पर एक सीधी रेखा) होती है, जिसमें उनके संख्यात्मक पदनामों के साथ स्केल के निशान होते हैं। इन पदनामों को केवल गोल संख्याओं के अनुरूप अंकों पर बनाना बेहतर है: इस मामले में, मध्यवर्ती अंकों को पैमाने पर इंगित निकटतम संख्या से गिनकर पढ़ा जाता है। आरेख क्षेत्र पर पैमाने के निशान के अनुसार, चित्रित घटना या प्रक्रिया के आयाम प्लॉट किए जाते हैं। पैमाने के निशान समान रूप से (समान, अंकगणितीय पैमाने) या असमान (कार्यात्मक पैमाने, लघुगणकीय पैमाने) पैमाने पर स्थित होते हैं।
कार्यात्मक पैमाना - पैमाना पैमाना, जहाँ संख्यात्मक मूल्यलेबल किए गए बिंदु तर्क के मूल्यों को व्यक्त करते हैं, और इन बिंदुओं का स्थान समान तर्क के कुछ कार्यों के समान रूप से वितरित मूल्यों से मेल खाता है। सांख्यिकीय रेखांकन में कार्यात्मक पैमानों में से, मुख्य रूप से लघुगणकीय पैमाने का उपयोग किया जाता है। इसके अलावा, यदि दो मात्राओं पर विचार किया जाता है, तो ऐसा पैमाना दोनों या उनमें से केवल एक ("सेमिलोगैरिथमिक" ग्राफ या स्केल) पर लागू हो सकता है। लॉगरिदमिक स्केल के संख्यात्मक अंकों पर प्लॉट किए गए बिंदुओं के बीच की दूरी संबंधित संख्याओं के लॉगरिदम के बीच के अंतर के अनुरूप होती है और इसलिए, संख्याओं के बीच संबंध को चिह्नित करती है।
रेखांकन के प्रकारों का वर्गीकरण।
ग्राफिक्स कई प्रकार के होते हैं। उनका वर्गीकरण कई विशेषताओं पर आधारित है:
ए) ग्राफिक छवि बनाने का एक तरीका;
बी) सांख्यिकीय संकेतकों और संबंधों को दर्शाने वाले ज्यामितीय संकेत;
c) ग्राफिक इमेज की मदद से हल किए गए कार्य।
ग्राफिक छवि के रूप में सांख्यिकीय रेखांकन:
1. रैखिक: सांख्यिकीय वक्र।
2. प्लानर: बार, स्ट्रिप, स्क्वायर, सर्कुलर, सेक्टर, कर्ली, डॉट, बैकग्राउंड।
3. वॉल्यूमेट्रिक: वितरण सतहों।
निर्माण और छवि कार्यों की विधि के अनुसार सांख्यिकीय रेखांकन:
1. आरेख: तुलना आरेख, गतिकी आरेख, संरचनात्मक आरेख।
2. सांख्यिकीय मानचित्र: कार्टोग्राम, कार्टोग्राम।
निर्माण की विधि के अनुसार, सांख्यिकीय रेखांकन आरेख और सांख्यिकीय मानचित्र में विभाजित होते हैं। चार्ट ग्राफिक प्रतिनिधित्व का सबसे आम तरीका है। ये मात्रात्मक संबंधों के रेखांकन हैं। उनके निर्माण के प्रकार और तरीके विविध हैं। आरेखों का उपयोग एक दूसरे से स्वतंत्र मूल्यों के विभिन्न पहलुओं (स्थानिक, लौकिक, आदि) में दृश्य तुलना के लिए किया जाता है: क्षेत्र, जनसंख्या, आदि। इस मामले में, अध्ययन की गई आबादी की तुलना कुछ महत्वपूर्ण भिन्नता के अनुसार की जाती है। गुण। सांख्यिकीय मानचित्र - सतह पर मात्रात्मक वितरण के रेखांकन। अपने मुख्य उद्देश्य में, वे आरेखों से निकटता से जुड़े हुए हैं और केवल इस अर्थ में विशिष्ट हैं कि वे एक समोच्च रेखा पर सांख्यिकीय डेटा के सशर्त प्रतिनिधित्व हैं। भौगोलिक नक्शा, यानी, सांख्यिकीय डेटा का स्थानिक वितरण या स्थानिक वितरण दिखाएं। जैसा कि ऊपर उल्लेख किया गया है, ज्यामितीय चिह्न या तो बिंदु हैं, या रेखाएँ या तल, या ज्यामितीय निकाय हैं। इसके अनुसार, बिंदु, रेखा, तलीय और स्थानिक (वॉल्यूमेट्रिक) रेखांकन होते हैं।
स्कैटर प्लॉट्स का निर्माण करते समय, बिंदुओं के सेट का उपयोग ग्राफ़िक छवियों के रूप में किया जाता है; रैखिक - रेखाएँ बनाते समय। सभी समतलीय आरेखों के निर्माण का मूल सिद्धांत यह है कि सांख्यिकीय मात्राओं को प्रपत्र में प्रदर्शित किया जाता है ज्यामितीय आकारऔर, बदले में, स्तंभ, पट्टी, परिपत्र, वर्ग और घुंघराले में बांटा गया है।
ग्राफिक छवि के अनुसार सांख्यिकीय मानचित्रों को कार्टोग्राम और कार्टोग्राम में विभाजित किया गया है।
हल किए जाने वाले कार्यों की श्रेणी के आधार पर, तुलना आरेख, संरचनात्मक आरेख और गतिकी आरेख प्रतिष्ठित हैं।
परिवर्तनशील श्रृंखला को चित्रित करने के लिए सबसे अधिक उपयोग किए जाने वाले रेखांकन, अर्थात्, फ़ीचर मानों और संबंधित आवृत्तियों या सापेक्ष आवृत्तियों के बीच संबंध, एक बहुभुज, एक हिस्टोग्राम और एक संचयी हैं।
बहुभुजबहुधा असतत श्रृंखला का प्रतिनिधित्व करने के लिए उपयोग किया जाता है। एक आयताकार समन्वय प्रणाली में एक बहुभुज का निर्माण करने के लिए, तर्क के मान, अर्थात, विकल्प, मनमाने ढंग से चुने गए पैमाने पर एब्सिस्सा अक्ष पर और ऑर्डिनेट अक्ष पर, मनमाने ढंग से चुने गए पैमाने पर भी प्लॉट किए जाते हैं, मान आवृत्तियों या सापेक्ष आवृत्तियों की। पैमाना चुना जाता है ताकि आवश्यक दृश्यता प्रदान की जा सके, और ताकि ड्राइंग में वांछित आकार हो। इसके अलावा, इस समन्वय प्रणाली में, अंक बनाए जाते हैं, जिनमें से निर्देशांक भिन्नता श्रृंखला से संबंधित संख्याओं के जोड़े होते हैं। परिणामी बिंदु श्रृंखला में सीधी रेखा खंडों से जुड़े हुए हैं। चरम "बाएं" बिंदु एब्सिस्सा अक्ष के बिंदु से जुड़ा हुआ है, जिसका एब्सिस्सा बिंदु के बाईं ओर उसी दूरी पर स्थित है, जिस बिंदु पर दाईं ओर निकटतम एब्सिस्सा है। इसी प्रकार, चरम "दाएं" बिंदु भी एक्स-अक्ष के बिंदु से जुड़ा हुआ है।
गणित में एक निश्चित कक्षा के छात्रों की शैक्षिक उपलब्धियों को तालिका में प्रस्तुत आंकड़ों की विशेषता है।
आवृत्तियों का एक बहुभुज बनाएँ।
§1. सांख्यिकी, सांख्यिकीय नियमितता और समग्रता की अवधारणाएं ..... 2
§2. सांख्यिकीय जनसंख्या की इकाइयों के संकेत, उनका वर्गीकरण ...... 2
§1। सांख्यिकीय अवलोकन की अवधारणा, इसकी तैयारी .............. 4
§2. सांख्यिकीय अवलोकन के प्रकार ................................................ ................... 5
§3। अवलोकन त्रुटियां ................................................ .................. ................... 6
§4। सारांश और समूहन ………………………………………। ........................................................ 6
§5। सांख्यिकीय समूहों के प्रकार ………………………………………। ........... 6
§6। सांख्यिकीय तालिकाएँ ………………………………………। ............ 7
§7। सांख्यिकीय रेखांकन ………………………………………। .................. ........... 8
§1। वास्तविक और सैद्धांतिक वितरण ................................................ 21
§2. सामान्य वितरण वक्र ................................................ 21
§3। सामान्य वितरण की परिकल्पना का परीक्षण........................... 21
§4। समरूपता मानदंड: पियर्सन, रोमानोव्स्की, कोलमोगोरोव ........... 21
§5। व्यावहारिक मूल्यवितरण श्रृंखला मॉडलिंग..... 22
§1। चयनात्मक अवलोकन की अवधारणा। इसके उपयोग के कारण...... 23
§3। नमूनाकरण त्रुटियां ………………………………………। ............ 24
§4। नमूना अवलोकन कार्य ……………………………………… 25
§5। सामान्य आबादी के लिए नमूना अवलोकन डेटा का विस्तार... 26
§6। छोटा सा नमूना ................................................ ........................................ 26
§1। सहसंबंध और सीआरए की अवधारणा ........................................... 27
§2. केपीए के उपयोग और सीमाओं के लिए शर्तें ........................... 27
§3। कम से कम वर्गों की विधि के आधार पर जोड़ीदार प्रतिगमन .. 28
§4। भाप का प्रयोग रेखीय समीकरणप्रतिगमन........... 29
§6। बहु सहसंबंध ................................................ 32
विषय 1.: सांख्यिकी का परिचय।
- सांख्यिकी, सांख्यिकीय नियमितता और जनसंख्या की अवधारणा।
- सांख्यिकीय जनसंख्या की इकाइयों के संकेत, उनका वर्गीकरण।
- सांख्यिकी का विषय और तरीका।
§1. सांख्यिकी, सांख्यिकीय नियमितता और समग्रता की अवधारणा।
सांख्यिकी शब्द लैटिन से आया है " दर्जा” अनुवाद में - राज्य, मामलों की स्थिति।
सांख्यिकी शब्द की उत्पत्ति 18वीं शताब्दी के उत्तरार्ध में हुई। राज्यों के ज्ञान के संबंध में, उनकी विशेषताओं का अध्ययन। विश्वविद्यालय में शिक्षण सांख्यिकी की शुरुआत उसी समय से होती है। सांख्यिकीय अनुसंधान की शाखा के आधार पर, ये हैं: जनसंख्या, उद्योग, कृषि, आदि के आँकड़े। - एप्लाईड स्टैटस्टिक्स।
आंकड़ों का सामान्य सिद्धांत संख्यात्मक डेटा एकत्र करने, प्रसंस्करण, प्रस्तुत करने और विश्लेषण करने के तरीकों और तकनीकों का एक समूह है। सांख्यिकी शब्द का प्रयोग आज तीन अर्थों में किया जाता है:
- "डेटा" शब्द के पर्यायवाची के रूप में
- अर्थ की एक शाखा जो बड़े पैमाने पर घटनाओं की विशेषता संख्यात्मक डेटा के साथ काम करने के सिद्धांतों और विधियों को जोड़ती है (पुरुषों के लिए जीवन प्रत्याशा महिलाओं की तुलना में कम है)
- संख्यात्मक डेटा के प्रसंस्करण और विश्लेषण के उद्देश्य से व्यावहारिक गतिविधि की एक शाखा।
सांख्यिकी सामाजिक-आर्थिक प्रक्रियाओं और घटनाओं के विकास के पैटर्न को पहचानने और मापने के साथ-साथ स्थान और समय की विशिष्ट परिस्थितियों में उनके बीच संबंध को संभव बनाती है।
नियमितता घटना में परिवर्तनों की पुनरावृत्ति, अनुक्रम और क्रम को संदर्भित करती है।
सांख्यिकीय नियमितता - एक नियमितता जिसमें आवश्यकता प्रत्येक व्यक्तिगत घटना में आकस्मिक रूप से जुड़ी होती है और केवल घटनाओं की भीड़ में ही एक कानून के रूप में प्रकट होती है। एक सांख्यिकीय नियमितता की अवधारणा एक गतिशील नियमितता की अवधारणा का विरोध करती है जो हर घटना में खुद को प्रकट करती है। (उदाहरण: S वृत्त =pr 2 तुलना > r विषय > S वृत्त)। सांख्यिकीय अनुसंधान का उद्देश्य एक सांख्यिकीय सेट है - इकाइयों का एक समूह जिसमें बड़े पैमाने पर चरित्र, एकरूपता, अखंडता द्वारा निर्धारित और भिन्नता की उपस्थिति होती है। प्रत्येक व्यक्तिगत तत्व को एक सांख्यिकीय जनसंख्या इकाई (ईएसएस) कहा जाता है
§2. सांख्यिकीय जनसंख्या की इकाइयों के संकेत, उनका वर्गीकरण।
ECC में कुछ गुण होते हैं जिन्हें विशेषताएँ कहा जाता है। सांख्यिकी अपने संकेतों के माध्यम से घटनाओं का अध्ययन करती है, जितना अधिक सजातीय सेट, उतना ही अधिक सामान्य सुविधाएंइकाइयों के पास यह है और इन सुविधाओं के मूल्य कम भिन्न होते हैं।
एक वर्णनात्मक संकेत एक संकेत है जिसे केवल मौखिक रूप से व्यक्त किया जा सकता है।
- मात्रात्मक संकेत - एक संकेत जिसे संख्यात्मक रूप से व्यक्त किया जा सकता है।
- एक प्रत्यक्ष संकेत एक गुण है जो एक विशिष्ट वस्तु में सीधे निहित है।
- एक अप्रत्यक्ष संकेत विशेषता वस्तु का गुण नहीं है, बल्कि उससे जुड़ी वस्तु या उसमें शामिल वस्तु का है।
- प्राथमिक विशेषता एक निरपेक्ष मान है जिसे मापा जा सकता है।
- द्वितीयक विशेषता - तुलना का परिणाम प्राथमिक संकेत, इसे सीधे मापा जाता है।
- प्राकृतिक संकेत - टुकड़ों, किलो, टन, लीटर, आदि में मापा जाता है।
- श्रम चिह्न - मानव-दिनों, मानव-घंटे में मापा जाता है।
- मूल्य विशेषता - रूबल, $, €, ₤ में मापा जाता है।
- आयाम रहित चिह्न - शेयरों में माप,%
- एक वैकल्पिक विशेषता एक ऐसी विशेषता है जो कई संभावित मूल्यों में से केवल एक मान लेती है।
- असतत चिह्न - केवल एक पूर्णांक मान लेता है, बिना किसी मध्यवर्ती के।
- एक सतत विशेषता एक विशेषता है जो एक निश्चित सीमा के भीतर कोई भी मान लेती है।
- एक कारक विशेषता एक विशेषता है जो दूसरे गुण को बदल देती है।
- प्रभावी लक्षण - एक गुण जो दूसरे के गुण के तहत बदलता है
- क्षणिक चिन्ह - एक निश्चित समय पर मापा गया चिन्ह।
- अंतराल चिह्न - एक निश्चित अवधि के लिए एक संकेत।
एक ही विशेषता को विभिन्न वर्गीकरणों के अनुसार एक साथ वर्गीकृत किया जा सकता है।
§3। सांख्यिकी का विषय और तरीका.
सांख्यिकीय अनुसंधान का विषय सांख्यिकीय समुच्चय है - एक-गुणवत्ता वाली अलग-अलग वस्तुओं का एक सेट।
सांख्यिकी के विषय की बारीकियां विधि की बारीकियों को निर्धारित करती हैं, उनमें शामिल हैं:
- डेटा संग्रह (सांख्यिकीय अवलोकन, प्रकाशन)
- डेटा का सामान्यीकरण (सारांश, समूहीकरण)
- डेटा प्रस्तुति (टेबल और ग्राफ़)
- संख्यात्मक डेटा का विश्लेषण और व्याख्या (औसत की गणना, विविधताओं का विश्लेषण, केआरए, गतिकी की श्रृंखला, सूचकांक)
विषय 2: सांख्यिकीय अवलोकन का संगठन।
डेटा का सारांश और समूहीकरण।
§1। सांख्यिकीय अवलोकन की अवधारणा, इसकी तैयारी।
§2. सांख्यिकीय अवलोकन के प्रकार।
§3 अवलोकन की त्रुटियां।
§4 सारांश और समूहीकरण
§5 प्रकार के सांख्यिकीय समूह।
§6 सांख्यिकीय टेबल।
§7 सांख्यिकीय रेखांकन।
§1। सांख्यिकीय अवलोकन की अवधारणा, इसकी तैयारी।
किसी भी सांख्यिकीय अनुसंधान की शुरुआत आंकड़ों के संग्रह से होती है।
सूत्रों की जानकारी:
- विभिन्न प्रकाशन (समाचार पत्र, पत्रिकाएं, आदि)
- प्रकाशित सांख्यिकीय जानकारी का मुख्य स्रोत राज्य सांख्यिकी निकायों (2001 में RF, GOSKOMSTAT पब्लिशिंग हाउस) का प्रकाशन है।
- सांख्यिकीय अवलोकन करना, अर्थात वैज्ञानिक संगठित संग्रहआंकड़े।
सांख्यिकीय अवलोकन सामाजिक और आर्थिक जीवन की घटना का एक सामूहिक, नियोजित, वैज्ञानिक रूप से संगठित अवलोकन है, जिसमें अध्ययन की गई आबादी की प्रत्येक इकाई के लिए पंजीकरण संकेत शामिल हैं।
अवलोकन प्रक्रिया:
- निरीक्षण की तैयारी
- बड़े पैमाने पर डेटा संग्रह का संचालन करना
- प्रसंस्करण के लिए डेटा तैयार करना
- सांख्यिकीय अवलोकन में सुधार के लिए प्रस्तावों का विकास।
अवलोकन तैयारी:
- अवलोकन के उद्देश्य और वस्तु का निर्धारण
- पंजीकरण के अधीन संकेतों की संरचना का निर्धारण
- डेटा संग्रह के लिए दस्तावेजों का विकास
- रिपोर्टिंग इकाई और उस इकाई का चुनाव जिसके विरुद्ध अवलोकन किया जाएगा।
- डेटा प्राप्त करने के तरीकों और साधनों को परिभाषित करना आवश्यक है।
समाधान के लिए संगठनात्मक समस्याएं:
- अध्ययन करने वाली सेवाओं की संरचना का निर्धारण करना आवश्यक है
- कर्मचारियों को संक्षिप्त करें
- लिखें कैलेंडर योजनाकाम
- डेटा संग्रह के लिए दस्तावेजों को दोहराएं
अवलोकन का उद्देश्य सामाजिक-आर्थिक घटनाएं और प्रक्रियाएं हैं।
पंजीकरण के लिए संकेतों की स्पष्ट रूप से पहचान करना आवश्यक है।
अवलोकन कार्यक्रम - अवलोकन की प्रक्रिया में पंजीकरण के अधीन संकेतों के संकेतों की एक सूची।
अवलोकन कार्यक्रम आवश्यकताएँ:
- कार्यक्रम में शामिल होना चाहिए आवश्यक सुविधाएं, जो सीधे तौर पर अध्ययन के तहत घटना की विशेषता बताते हैं, उन्हें कार्यक्रम के उन संकेतों में शामिल नहीं किया जाना चाहिए जिनमें द्वितीयक घटनाएं या संकेत हैं, जिनके मूल्य स्पष्ट रूप से अविश्वसनीय होंगे या पूरी तरह से अनुपस्थित होंगे।
- अवलोकन कार्यक्रम के प्रश्न सटीक और अस्पष्ट नहीं होने चाहिए, और उत्तर प्राप्त करने में कठिनाइयों से बचने के लिए समझने में आसान होने चाहिए।
- प्रश्नों का क्रम निश्चित होना चाहिए।
- निगरानी कार्यक्रम में एकत्र किए गए डेटा के संचालन और स्पष्टीकरण के लिए प्रत्यक्ष प्रकृति के प्रश्न शामिल होने चाहिए।
- प्राप्त सूचनाओं की एकरूपता सुनिश्चित करने के लिए, कार्यक्रम को एक दस्तावेज़ के रूप में तैयार किया जाता है - जिसे सांख्यिकीय रूप कहा जाता है।
एक सांख्यिकीय रूप एक एकल नमूने का एक दस्तावेज है जिसमें एक कार्यक्रम और टिप्पणियों के परिणाम होते हैं।
एक व्यक्तिगत रूप (अवलोकन की एक इकाई पर प्रश्नों के उत्तर) और अपलिखित (सांख्यिकीय जनसंख्या की कई इकाइयों पर जानकारी) के बीच एक अंतर किया जाता है।
फॉर्म और इसे भरने के निर्देश सांख्यिकीय अवलोकन के उपकरण हैं।
अवलोकन समय का चुनाव 2 प्रश्नों को हल करने में होता है: एक महत्वपूर्ण तिथि या अंतराल स्थापित करना, अवलोकन अवधि निर्धारित करना।
महत्वपूर्ण तिथि - वर्ष का एक विशिष्ट दिन, दिन का वह घंटा जिसके अनुसार अध्ययन की गई जनसंख्या की प्रत्येक इकाई के लिए संकेत दर्ज किए जाने चाहिए।
अवलोकन अवधि - वह समय जिसके दौरान सांख्यिकीय प्रपत्र भरे जाते हैं, अर्थात डेटा एकत्र करने के लिए आवश्यक समय।
यह ध्यान में रखा जाना चाहिए कि महत्वपूर्ण तिथि या अंतराल से अवलोकन अवधि की दूरी प्राप्त जानकारी की विश्वसनीयता में कमी ला सकती है।
§2. सांख्यिकीय अवलोकन के प्रकार।
घरेलू सांख्यिकी में, सांख्यिकीय अवलोकनों के तीन रूपों का उपयोग किया जाता है।
- उद्यमों, संगठनों, संस्थानों की सांख्यिकीय रिपोर्टिंग।
- विशेष रूप से आयोजित सांख्यिकीय अवलोकन (जनगणना, आदि)
- रजिस्टर - दीर्घकालिक प्रक्रियाओं की निरंतर सांख्यिकीय निगरानी का एक रूप
सांख्यिकीय अवलोकन को वर्गीकृत किया गया है:
अवलोकन समय से:
- वर्तमान अवलोकन - संकेतों का निरंतर पंजीकरण किया जाता है (रजिस्ट्री कार्यालय, अपराध, आदि)।
- आवधिक अवलोकन - समय के निश्चित अंतराल पर किया जाता है (चेल्याबिंस्क शहर में रहने का मानक, उपभोक्ता टोकरी की लागत, जनसंख्या जनगणना)।
- एक बार - किसी विशिष्ट उद्देश्य के लिए एक बार किया गया अवलोकन।
जनसंख्या इकाइयों के कवरेज द्वारा:
- सतत अवलोकन - सभी ईसीसी पर जानकारी प्राप्त की जानी चाहिए
- पूर्ण अवलोकन नहीं
- मुख्य सरणी की विधि - अध्ययन की गई आबादी की सबसे महत्वपूर्ण इकाइयों की जांच की जाती है (चेल्याबिंस्क क्षेत्र के इंजीनियरिंग उद्यम का अध्ययन करने के लिए)।
- चयनात्मक अवलोकन देखे जाने वाले ईसीसी का एक यादृच्छिक चयन है।
- मोनोग्राफिक अवलोकन - जब एक ईसीसी मनाया जाता है, तो उनका उपयोग अक्सर बड़े पैमाने पर अवलोकन कार्यक्रम तैयार करने के लिए किया जाता है।
डेटा संग्रह के माध्यम से:
- प्रत्यक्ष अवलोकन - रजिस्ट्रार स्वयं, प्रत्यक्ष माप, वजन द्वारा, पंजीकृत किए जाने वाले विषय के तथ्य को स्थापित करते हैं (एक पॉलीक्लिनिक में 1 वर्ष से कम उम्र का बच्चा)।
- दस्तावेजी अवलोकन - विभिन्न दस्तावेजों का उपयोग किया जाता है (घोषणा तैयार करना)
पोल - उत्तरदाता के शब्दों से आवश्यक जानकारी प्राप्त होती है।
- अभियान सर्वेक्षण - विशेष रूप से प्रशिक्षित श्रमिकों द्वारा किया जाता है जो प्राप्त करते हैं आवश्यक जानकारीप्रासंगिक व्यक्तियों के एक सर्वेक्षण के आधार पर और फॉर्म में स्वयं उत्तर दर्ज करें। अभियान सर्वेक्षण प्रत्यक्ष (आमने-सामने) और अप्रत्यक्ष (फोन द्वारा सर्वेक्षण) हो सकता है
- संवाददाता सर्वेक्षण - जानकारी स्वैच्छिक संवाददाताओं के एक कर्मचारी द्वारा प्रदान की जाती है, यह विधिछोटे की आवश्यकता है वित्तीय लागत, लेकिन किए जा रहे अवलोकन का सटीक मान नहीं देता है।
- स्व-पंजीकरण - प्रपत्र स्वयं उत्तरदाताओं द्वारा भरे जाते हैं, और रजिस्ट्रार केवल उन्हें प्रश्नावली के प्रपत्र वितरित करते हैं और समझाते हैं कि उन्हें कैसे भरना है।
§3। अवलोकन त्रुटियां
सांख्यिकीय अवलोकन के लिए लागू मुख्य आवश्यकता सटीकता है।
शुद्धता - सांख्यिकीय अवलोकन की सामग्री से निर्धारित वास्तविक मूल्य के साथ किसी विशेषता संकेतक के अनुपालन की डिग्री।
गणना और वास्तविक मूल्य के बीच की विसंगति को अवलोकन त्रुटि कहा जाता है, घटना के कारणों के आधार पर, वे भेद करते हैं: पंजीकरण त्रुटियां और प्रतिनिधित्व त्रुटियां। पंजीकरण त्रुटियों को यादृच्छिक और व्यवस्थित में विभाजित किया गया है।
यादृच्छिक त्रुटियाँ - यादृच्छिक कारकों की क्रियाओं का परिणाम (पंक्तियाँ, स्तंभ मिश्रित होते हैं)
व्यवस्थित त्रुटियां - हमेशा या तो सूचक को अधिक या कम आंकने की प्रवृत्ति होती है। (आयु)
प्रतिनिधित्व त्रुटियाँ गैर-निरंतर अवलोकन की प्रकृति हैं और संपूर्ण मूल जनसंख्या के नमूने के गलत पुनरुत्पादन के परिणामस्वरूप उत्पन्न होती हैं।
सांख्यिकीय प्रपत्र प्राप्त करने के बाद, आपको चाहिए:
- एकत्रित डेटा की पूर्णता की जाँच करें।
- एक दूसरे से विभिन्न विशेषताओं के संबंध के आधार पर अंकगणितीय नियंत्रण करें।
- ज्ञान के आधार पर तार्किक नियंत्रण करें तार्किक कनेक्शनसंकेतों के बीच।
§4। सारांश और समूहन
एकत्रित आंकड़ों के आधार पर, गणना करना और निष्कर्ष निकालना असंभव है, पहले उन्हें एक ही तालिका में सारांशित और सारांशित करने की आवश्यकता है। इन उद्देश्यों के लिए, सारांश और समूहीकरण का उपयोग किया जाता है।
सारांश - विशिष्ट एकल तथ्यों को सामान्य बनाने के लिए अनुक्रमिक संचालन का एक सेट जो एक सेट का निर्माण करता है और समग्र रूप से अध्ययन के तहत घटना में निहित विशिष्ट विशेषताओं और पैटर्न की पहचान करता है।
सरल वोदका - जनसंख्या के योग की गिनती।
एक जटिल सारांश व्यक्तिगत टिप्पणियों को समूहीकृत करने के लिए संचालन का एक सेट है, प्रत्येक समूह के लिए परिणामों की गणना और समग्र रूप से संपूर्ण वस्तु के लिए, और परिणामों को सांख्यिकीय तालिकाओं के रूप में प्रस्तुत करना।
सामग्री प्रसंस्करण के रूप में, सारांश को विकेंद्रीकृत, केंद्रीकृत किया जा सकता है - ऐसा सारांश एक बार के सांख्यिकीय अवलोकन के साथ किया जाता है।
समूहीकरण - कुछ विशेषताओं के अनुसार समूहों में अध्ययन की गई जनसंख्या की इकाइयों के समूह का विभाजन।
§5। सांख्यिकीय समूहों के प्रकार
समूहों को संरचना और सामग्री द्वारा वर्गीकृत किया जा सकता है।
विश्लेषणात्मक समूहीकरण सुविधाओं के बीच संबंध को दर्शाता है, जिनमें से एक कारक है और दूसरा उत्पादक है।
शिक्षा |
|||
अपूर्ण उच्चतर |
|||
§6। सांख्यिकीय तालिकाएँ
सारांश और समूहीकरण के परिणामों को इस प्रकार प्रस्तुत किया जाना चाहिए कि उनका उपयोग किया जा सके।
डेटा प्रस्तुत करने के 3 तरीके हैं:
- डेटा को टेक्स्ट में शामिल किया जा सकता है।
- तालिकाओं में प्रस्तुति।
- ग्राफिक तरीका
सांख्यिकीय तालिका - पंक्तियों और स्तंभों की एक प्रणाली जिसमें एक निश्चित क्रम में सामाजिक-आर्थिक घटनाओं पर सांख्यिकीय जानकारी प्रस्तुत की जाती है।
तालिका के विषय और विधेय के बीच भेद।
विषय संख्याओं की विशेषता वाली वस्तु है, आमतौर पर विषय तालिका के बाईं ओर दिया जाता है।
विधेय संकेतकों की एक प्रणाली है जिसके द्वारा वस्तु की विशेषता होती है।
सांख्यिकीय तालिका में 3 प्रकार के शीर्षलेख होते हैं: सामान्य, पार्श्व
सामान्य शीर्षक केंद्र में तालिका के ऊपर स्थित संपूर्ण तालिका की सामग्री को प्रतिबिंबित करना चाहिए।
टेबल नियम।
- शब्द संक्षिप्तीकरण के बिना सभी तीन प्रकार के शीर्षकों की आवश्यकता होती है, माप की सामान्य इकाइयों को शीर्षक में रखा जा सकता है।
- तालिका में अतिरिक्त रेखाएँ नहीं होनी चाहिए, ऊर्ध्वाधर चिह्न गायब हो सकते हैं।
- अंतिम पंक्ति आवश्यक है। यह या तो शुरुआत में या दस्तावेज़ के अंत में हो सकता है। यदि दस्तावेज़ की शुरुआत में तो यदि अंत में तो कुल:
- एक कॉलम में डिजिटल डेटा को एक डिग्री सटीकता के साथ रिकॉर्ड किया जाता है। रैंकों को रैंकों के तहत कड़ाई से लिखा जाता है, पूरा हिस्साएक अल्पविराम से अलग।
- तालिका में खाली कक्ष नहीं होने चाहिए, यदि कोई डेटा नहीं है, तो वे "कोई जानकारी नहीं" या "..." लिखते हैं, यदि डेटा शून्य है, तो "-"। यदि मान शून्य के बराबर नहीं है लेकिन निर्दिष्ट परिशुद्धता 0.01®0.0 के बाद पहला महत्वपूर्ण अंक प्रकट होता है - यदि स्वीकृत सटीकता दसवीं तक है।
- यदि तालिका में कई स्तंभ हैं, तो विषय के स्तंभों को बड़े अक्षरों में और विधेय के स्तंभों को संख्याओं द्वारा इंगित किया जाता है।
- यदि तालिका उधार डेटा पर आधारित है, तो डेटा का स्रोत तालिका के नीचे इंगित किया गया है, यदि आवश्यक हो, तो तालिका नोट्स के साथ हो सकती है।
§7। सांख्यिकीय रेखांकन
सांख्यिकीय तालिकाओं को रेखांकन के साथ पूरक किया जा सकता है।
सांख्यिकीय रेखांकन संख्यात्मक मानों और रेखाओं, ज्यामितीय आकृतियों, रेखाचित्रों के माध्यम से उनके अनुपात की सशर्त छवियां हैं।
एक ग्राफिक छवि के लाभ
- स्पष्ट रूप से, स्पष्ट रूप से, स्पष्ट रूप से।
- सूचक के परिवर्तन की सीमा, परिवर्तन और अस्थिरता की तुलनात्मक दर तुरंत दिखाई दे रही है
एक ग्राफिक छवि के विपक्ष
- तालिका से कम डेटा शामिल करें।
- ग्राफ गोलाकार डेटा दिखाता है, सामान्य परिस्थितिलेकिन कोई विवरण नहीं।
सांख्यिकीय रेखांकन |
चित्र |
घुँघराले |
विषय 3: सांख्यिकीय संकेतक।
§1। एक सांख्यिकीय संकेतक का सार और अर्थ, इसकी विशेषताएं।
§2. सांख्यिकीय संकेतकों का वर्गीकरण।
§3। सापेक्ष संकेतकों के प्रकार। निर्माण सिद्धांत।
§4। सांख्यिकीय संकेतकों की प्रणाली।
एक सांख्यिकीय संकेत ईएसएस में निहित एक संपत्ति है, यह एक विज्ञान के रूप में अध्ययन किया जाता है या नहीं, यह निष्पक्ष रूप से मौजूद है।
एक सांख्यिकीय संकेतक जनसंख्या की कुछ संपत्ति की सामान्यीकरण विशेषता है।
एक सांख्यिकीय संकेतक की संरचना (इसकी विशेषताएँ):
- औसत मान
- भिन्नता संकेतक
- फ़ीचर कनेक्शन संकेतक
- वितरण की संरचना और प्रकृति के संकेतक
- गतिशील संकेतक
- परिवर्तनशीलता संकेतक
- नमूना अनुमानों की सटीकता और विश्वसनीयता के संकेतक
- पूर्वानुमान सटीकता और विश्वसनीयता संकेतक
प्रकार से: इकाइयों की कुल संख्या या वस्तु की कुल संपत्ति। यह प्राथमिक विशेषताओं का योग है, जिसे टुकड़ों, किग्रा, मी, $, आदि में मापा जाता है।
सापेक्ष सूचक- अंतरिक्ष में, समय में या संकेतकों की तुलना में पूर्ण या सापेक्ष संकेतकों की तुलना करके प्राप्त किया गया विभिन्न गुणअध्ययन के तहत वस्तु।
पहले ऑर्डर का रिलेटिव इंडिकेटर 2 x निरपेक्ष संकेतकों की तुलना करके प्राप्त किया जाता है। दूसरे क्रम के सापेक्ष सूचक को पहले क्रम के सापेक्ष संकेतकों आदि की तुलना करके प्राप्त किया जाता है।
तीसरे क्रम और उच्चतर का एक सापेक्ष सूचकांक बहुत दुर्लभ है।
प्रत्यक्ष संकेतक - ऐसे संकेतक, जिनका मूल्य अध्ययन के तहत घटना में वृद्धि के साथ बढ़ता है।
व्युत्क्रम संकेतक - संकेतक जिनका मूल्य अध्ययन के तहत घटना में वृद्धि के साथ घटता है।
… संरचनाएं |
… वक्ता |
…रिश्तों |
… तीव्रता |
…मानक के संबंध में |
... तुलना |
संरचना संकेतकभाग को पूर्ण से जोड़कर प्राप्त किया जाता है।
गतिकी के सापेक्ष संकेतक
ü गतिशीलता के संकेतक (विकास दर, वृद्धि)
ü सूचकांक
संबंध संकेतकसुविधाओं के बीच संबंध को चिह्नित करें:
ü सहसंबंध गुणांक
ü विश्लेषणात्मक सूचकांक
तीव्रता संकेतकविभिन्न आधारों पर दो वस्तुओं के संबंध को चिह्नित करें।
ü श्रम गहनता - उत्पाद की एक इकाई के निर्माण में लगने वाला समय
ü उत्पादन - समय की प्रति इकाई उत्पादित उत्पादों की मात्रा
आउटपुट \u003d 1 / श्रम तीव्रता
मानक के प्रति दृष्टिकोण के संकेतक- मानक, नियोजित, इष्टतम के संकेतक के संकेत के वास्तविक मूल्यों का अनुपात।
तुलनात्मक संकेतक -एक ही आधार पर विभिन्न वस्तुओं की तुलना।
सांख्यिकीय संकेतकों के निर्माण के लिए सामान्य सिद्धांत:
- आँकड़े निष्पक्ष रूप से संबंधित हैं।
- तुलना किए गए संकेतक केवल एक विशेषता में भिन्न हो सकते हैं; आप किसी संकेतक की तुलना दो या अधिक विशेषताओं से नहीं कर सकते।
- सूचक की सीमाओं को जानना और ध्यान में रखना आवश्यक है।
किसी वस्तु की प्रत्येक विशेषता के लिए, सांख्यिकीय संकेतकों की एक प्रणाली की आवश्यकता होती है।
- संज्ञानात्मक कार्य - डेटा विश्लेषण के आधार पर
- प्रचार करना
- उत्तेजक समारोह
विषय 4: औसत
§1। औसत की अवधारणा
§2. औसत के प्रकार
§3। अंकगणितीय माध्य और उसके गुण
§4। हार्मोनिक माध्य, ज्यामितीय माध्य, द्विघात माध्य।
§5। बहुभिन्नरूपी औसत
सांख्यिकीय संकेतकों का सबसे सामान्य रूप औसत है।
औसत की सबसे महत्वपूर्ण संपत्ति यह है कि यह उस सामान्य को दर्शाता है जो अध्ययन के तहत जनसंख्या की प्रत्येक इकाई में निहित है, हालांकि जनसंख्या की व्यक्तिगत इकाइयों की विशेषता का मूल्य एक दिशा या किसी अन्य में उतार-चढ़ाव कर सकता है।
माध्य की विशिष्टता सीधे अध्ययन की गई जनसंख्या की एकरूपता से संबंधित है। गैर-सजातीय आबादी के मामले में, इसे गुणात्मक रूप से सजातीय समूहों में विभाजित करना और प्रत्येक सजातीय समूहों के लिए औसत की गणना करना आवश्यक है।
आप औसत के प्रारंभिक अनुपात (आईएसएस) के तार्किक सूत्र के माध्यम से औसत निर्धारित कर सकते हैं।
संरचनात्मक औसत
फैशन- मो
माध्यिका - मैं
गतिकी की श्रृंखला में, अंकगणितीय माध्य और कालानुक्रमिक माध्य की गणना की जाती है।
अंकगणित औसत सुविधा का ऐसा औसत मूल्य कहा जाता है जिसकी गणना में सुविधा का कुल आयतन नहीं बदलता है।
उदाहरण: भार।
बुध सरल अंकगणित
एक्स मैं- सुविधा का व्यक्तिगत मूल्य
एन- कुल गणनाअध्ययन आबादी
सी एफ अंकगणित भारित
गुण सी.एफ. अंकगणित।
इसके औसत मूल्य से किसी विशेषता के व्यक्तिगत मूल्यों के विचलन का योग शून्य है
यदि किसी विशेषता के प्रत्येक व्यक्तिगत मूल्य को समान स्थिर संख्या से गुणा या विभाजित किया जाता है, तो औसत उसी राशि से बढ़ेगा या घटेगा।
यदि विशेषता के प्रत्येक व्यक्तिगत मूल्य में एक और एक ही स्थिर संख्या जोड़ी जाती है, तो उसी संख्या के अनुसार औसत मूल्य बदल जाएगा।
सबूत
यदि भारित औसत के भार f को उसी संख्या से गुणा या विभाजित किया जाता है, तो औसत नहीं बदलेगा।
विशेषता के वर्ग विचलन का योग किसी भी अन्य संख्या से कम है।
अन्य प्रकार के औसत
मध्य का प्रकार |
साधारण औसत |
भारित औसत |
लयबद्ध |
||
ज्यामितिक |
||
द्विघात |
समूहीकरण को एक आधार पर चिह्नित करना बहुत मुश्किल है और बहुत कम जानकारी स्मृति में रहती है।
बहुभिन्नरूपी माध्य - कई सुविधाओं के लिए औसत मूल्य ई.एस.एस.
ई.एस. के लिए फीचर वैल्यू के अनुपात से। इन लक्षणों के औसत मूल्यों के लिए।
के लिए बहुभिन्नरूपी औसत मैं इकाइयों
एक्स आईजे- आई यूनिट के लिए फीचर जे का मूल्य
फीचर जे का औसत मूल्य
k सुविधाओं की संख्या है
j विशेषता की संख्या और इसकी जनसंख्या की संख्या है
शीर्षक 5: विभिन्नताओं का विश्लेषण
§1। संकेतों और उसके कारणों की भिन्नता
§2. वितरण रैंक
§3। संरचनात्मक विशेषताएंभिन्नता श्रृंखला।
§4। भिन्नता संकेतकों की शक्ति।
§5। भिन्नता तीव्रता संकेतक
§6। फैलाव के प्रकार। भिन्न योग नियम।
किसी जनसंख्या में किसी विशेषता के मूल्य में भिन्नता एक ही अवधि या समय में किसी दिए गए जनसंख्या की विभिन्न इकाइयों के बीच उसके मूल्यों में अंतर है।
भिन्नता का कारण: अलग शर्तेंईएसएस का अस्तित्व, यह विविधता है जो सांख्यिकी जैसे विज्ञान की आवश्यकता पैदा करती है।
परिवर्तनशील विश्लेषण का संचालन एक परिवर्तनशील श्रृंखला के निर्माण के साथ शुरू होता है - बढ़ते या घटते संकेतों के अनुसार जनसंख्या इकाइयों का एक क्रमबद्ध वितरण और इसी आवृत्तियों की गिनती।
वितरण रैंक
ü रैंक किया गया
ü असतत
ü अंतराल
रैंक भिन्नता श्रृंखला- व्यक्तिगत इकाइयों की एक सूची। रैंक की गई सुविधा के बढ़ते अवरोही क्रम में एकत्रीकरण
असतत भिन्नता श्रृंखला -एक तालिका जिसमें 2 पंक्तियाँ होती हैं - एक चर विशेषता के बहुलक मान और एक दिए गए गुण मान के साथ इकाइयों की संख्या।
निम्नलिखित मामलों में एक अंतराल परिवर्तनशील श्रृंखला का निर्माण किया जाता है:
- सुविधा असतत मान लेती है, लेकिन उनकी संख्या बहुत बड़ी है
- विशेषता एक निश्चित सीमा में कोई मान लेती है
अंतराल भिन्नता श्रृंखला का निर्माण करते समय, समूहों की इष्टतम संख्या चुनना आवश्यक है, स्टर्गेस सूत्र का उपयोग करने वाली सबसे आम विधि
कश्मीर - अंतराल की संख्या
n जनसंख्या का आयतन है
गणनाओं में, भिन्नात्मक मान लगभग हमेशा प्राप्त होते हैं, एक पूर्णांक तक गोल होते हैं।
अंतराल की लंबाई - एल
अंतराल के प्रकार
बाद के अंतराल की निचली सीमा बाद के अंतराल की ऊपरी सीमा को दोहराती है
खुला अंतराल, एक सीमा के साथ अंतराल
अंतराल भिन्नता श्रृंखला की गणना करते समय, अंतराल के मध्य को x i के रूप में लिया जाता है।
एनएमई = 60 औसत = 1
संचयी - से कम वितरण
ओगिवा - से अधिक वितरण
माध्यिका एक विशेषता का मान है जो संपूर्ण जनसंख्या को दो समान भागों में विभाजित करता है।
असतत परिवर्तनशील श्रृंखला के लिए, माध्यिका की गणना: यदि n सम है, तो नहीं। माध्यिका इकाई
अंतराल भिन्नता श्रृंखला:
कश्मीर - अंतराल की संख्या
x 0 - मध्य अंतराल की निचली सीमा
एलमाध्यिका अंतराल की लंबाई है
आवृत्तियों का योग
माध्यिका से पहले के अंतराल की संचयी आवृत्ति।
मध्य अंतराल आवृत्ति
मध्य अंतराल- पहला अंतराल जिसकी संचित आवृत्ति आवृत्तियों के कुल योग के आधे से अधिक हो।
रेखांकन के रूप में, माध्य संचयी पर है।
- चतुर्थक - जनसंख्या को 4 बराबर भागों में विभाजित करने वाली विशेषता का मान।
पहला चतुर्थक
तीसरा चतुर्थक
दूसरा चतुर्थक - माध्यिका।
एक्सक्यू 1 x Q 3 - पहली और तीसरी चतुर्थक वाले अंतराल की निचली सीमा।
एल - अंतराल की लंबाई
और - पहले और तीसरे क्वार्टाइल वाले पिछले अंतरालों के अंतरालों की संचित आवृत्तियाँ।
चतुर्थक अंतराल की आवृत्तियाँ।
विविधता श्रृंखला को चिह्नित करने के लिए, निम्नलिखित का उपयोग किया जाता है:
Deciles - जनसंख्या को 10 समान भागों में विभाजित करते हैं, पर्सिटाइल्स - जनसंख्या को 100 समान भागों में विभाजित करते हैं।
- मोड एक बार-बार होने वाली विशेषता विशेषता है। असतत परिवर्तनशील श्रृंखला के लिए - उच्चतम आवृत्ति। अंतराल भिन्नता श्रृंखला के लिए, मोड की गणना निम्न सूत्र का उपयोग करके की जाती है:
मोडल अंतराल की निचली सीमा
एल- मोडल अंतराल लंबाई
एफएमओ-मोडल अंतराल आवृत्ति
च मो +1 मोडल के बाद अंतराल की आवृत्ति है
मोडल अंतराल - उच्चतम आवृत्ति वाला अंतराल।ग्राफिक रूप से, मोड हिस्टोग्राम पर पाया जाता है।
- स्पैन भिन्नता
- औसत रैखिक विचलन
भारित
- फैलाव:
भारित
- मानक विचलन
फैलाव संपत्ति।
- किसी विशेषता के सभी मूल्यों में समान मात्रा में कमी से विचरण का मान नहीं बदलता है।
- सभी फीचर वैल्यू को k गुना कम करने से विचरण कम हो जाता है 2टाइम्स, और आरएमएस इन कोएक बार
- यदि आप अंकगणितीय माध्य से भिन्न किसी मान A से विचलनों के माध्य वर्ग की गणना करते हैं, तो यह हमेशा अंकगणितीय माध्य से परिकलित विचलनों के माध्य वर्ग से अधिक होगा। इस प्रकार, औसत से हमेशा किसी अन्य मूल्य से गणना की तुलना में कम होता है, अर्थात इसकी न्यूनतम संपत्ति है। RMS = 1.25 - सामान्य के करीब वितरण के साथ।
सामान्य वितरण की शर्तों के तहत, 68.3% टिप्पणियों के बीच और टिप्पणियों की संख्या के बीच निम्नलिखित संबंध है।
95.4% अवलोकन सीमा के भीतर हैं
99.7% अवलोकन सीमा के भीतर हैं
विभिन्न आबादी में लक्षणों की भिन्नता की तुलना करने के लिए या एक ही जनसंख्या में विभिन्न लक्षणों की भिन्नता की तुलना करने के लिए सापेक्ष संकेतकों का उपयोग किया जाता है, आधार अंकगणितीय माध्य है।
- भिन्नता की सापेक्ष सीमा।
- सापेक्ष रैखिक विचलन
- भिन्नता का गुणांक
ये संकेतक न केवल एक तुलनात्मक मूल्यांकन देते हैं बल्कि जनसंख्या की एकरूपता भी बनाते हैं। भिन्नता का गुणांक 33% से अधिक नहीं होने पर सेट को सजातीय माना जाता है।
पूरी आबादी में एक विशेषता की भिन्नता के अध्ययन के साथ-साथ, विशेषता में मात्रात्मक परिवर्तनों का पता लगाना अक्सर आवश्यक होता है, लेकिन उन समूहों के लिए जिनमें आबादी विभाजित होती है और उनके बीच होती है। यह विभिन्न विचारों की गणना करके प्राप्त किया जाता है।
फैलाव के प्रकार:
- कुल विचरण
- इंटरग्रुप विचरण
- भीतर-समूह विचरण (अवशिष्ट)
1. इस भिन्नता का कारण बनने वाले सभी कारकों के प्रभाव में पूरी आबादी में एक विशेषता की भिन्नता को मापता है
उदाहरण:दही का सेवन: 100 लोगों के सैंपल के आधार पर
सामाजिक स्थिति
x i - सुविधा का व्यक्तिगत मूल्य
पूरी आबादी पर विशेषता का औसत मूल्य
इस सुविधा की आवृत्ति।
- 2. समूहीकरण के अंतर्निहित कारक के गुण के प्रभाव के तहत विशेषता की भिन्नता को दर्शाता है।
समूह औसत
समग्र समूह औसत
समूह द्वारा आवृत्ति
- 3. समूहीकरण में शामिल नहीं किए गए कारकों के प्रभाव में एक विशेषता की भिन्नता को चिह्नित करता है
एक्स आईजे – मैं जे समूह में मूल्य दिखाता हूं
में सुविधा का औसत मूल्य जेसमूह
च आईजे - आवृत्तिi-वें फीचर मेंजे समूह
3 प्रकार के प्रसरण को जोड़ने वाला एक नियम है, इसे प्रसरण जोड़ नियम कहते हैं।
द्वारा अवशिष्ट फैलाव जेसमूह
आवृत्तियों का योग खत्म जेसमूह
एनआवृत्तियों का कुल योग है
चर श्रृंखला के विश्लेषण का मुख्य कार्य आवृत्ति वितरण के पैटर्न की पहचान करना है।
वितरण वक्र - एक कार्यात्मक में भिन्नता श्रृंखला में आवृत्ति परिवर्तन की निरंतर रेखा के रूप में एक ग्राफिकल प्रतिनिधित्व संबंधित परिवर्तनगुण मान।
वितरण वक्र को बहुभुज और हिस्टोग्राम का उपयोग करके प्लॉट किया जा सकता है। सैद्धांतिक वितरण को एक अच्छी तरह से अध्ययन किए गए रूपों में से एक के लिए अनुभवजन्य वितरण को कम करने की सलाह दी जाती है।
सामान्य वितरण का वक्र।
निम्न प्रकार के वितरण वक्र हैं:
- एकरूप
- कई शिखर
सजातीय आबादी को एकल-शीर्ष वक्रों की विशेषता है, एक बहु-शीर्ष वक्र जनसंख्या की विषमता और पुनर्व्यवस्था की आवश्यकता को इंगित करता है।
वितरण की सामान्य प्रकृति का पता लगाने में इसकी एकरूपता का आकलन और तिरछापन और कर्टोसिस की गणना शामिल है। सममित वितरण के लिए
विषमता के तुलनात्मक अध्ययन के लिए विभिन्न वितरणविषमता गुणांक की गणना की जाती है।
तीसरे क्रम का केंद्रीय क्षण; - आरएमएस घनाकार;
यदि, तो विषमता महत्वपूर्ण है
के रूप में अगर<0, то As – левосторонняя, если As>0, तो As दाएँ हाथ का है।
यदि, तो अस नगण्य है। सममित और मध्यम असममित के लिए, कर्टोसिस सूचक की गणना की जाती है: यदि E k > 0, तो वितरण चरम पर है, यदि E k<0, то распределение плосковершинное.
वैकल्पिक विशेषता की भिन्नता मात्रात्मक रूप से निम्नानुसार प्रकट होती है।
0 - इकाइयाँ जिनमें यह सुविधा नहीं है;
1 - इस विशेषता वाली इकाइयाँ;
आर- इस सुविधा के साथ इकाइयों का अनुपात;
क्यू- उन इकाइयों का अनुपात जिनमें यह सुविधा नहीं है;
तब पी +क्यू = 1।
वैकल्पिक विशेषता भार के साथ 2 मान 0 और 1 लेती है पीऔर क्यू।
प्रत्यक्ष संकेत- ये संकेत हैं, जिनका मूल्य अध्ययन के तहत घटना में वृद्धि के साथ बढ़ता है।
विपरीत संकेत -संकेत, जिसका परिमाण अध्ययन के तहत घटना में वृद्धि के साथ घटता है।
पीढ़ी (प्रत्यक्ष) |
श्रम तीव्रता (रिवर्स) |
शेयर का अधिकतम विचरण 0.25 है।
शीर्षक 6: मॉडलिंग वितरण श्रृंखला।
§1। वास्तविक और सैद्धांतिक वितरण
§2. सामान्य वितरण का वक्र।
§3। एक सामान्य वितरण की परिकल्पना का परीक्षण करना।
§4। सहमति मानदंड: पियर्सन, रोमानोव्स्की, कोलमोगोरोव।
§5। मॉडलिंग वितरण श्रृंखला का व्यावहारिक मूल्य।
§1। वास्तविक और सैद्धांतिक वितरण
वितरण श्रृंखला का अध्ययन करने का सबसे महत्वपूर्ण लक्ष्य वितरण के पैटर्न को प्रकट करना और इसकी प्रकृति का निर्धारण करना है। वितरण पैटर्न सबसे स्पष्ट रूप से केवल बड़ी संख्या में टिप्पणियों के साथ प्रकट होते हैं।
वास्तविक वितरण को वितरण वक्र का उपयोग करके रेखांकन के रूप में चित्रित किया जा सकता है - ग्राफिक रूप से परिवर्तन से संबंधित कार्यात्मक रूप से भिन्नता श्रृंखला में आवृत्ति परिवर्तन की एक सतत रेखा के रूप में दर्शाया गया है।
सैद्धांतिक वितरण वक्र को सामान्य शब्दों में इस प्रकार के वितरण के वक्र के रूप में समझा जाता है जो नियमितता के लिए यादृच्छिक कारकों के प्रभाव को बाहर करता है।
सैद्धांतिक वितरण को एक विश्लेषणात्मक सूत्र द्वारा व्यक्त किया जा सकता है जिसे विश्लेषणात्मक सूत्र कहा जाता है। सबसे आम सामान्य वितरण है।
§2. सामान्य वितरण का वक्र।
सामान्य वितरण कानून:
y सामान्य बंटन की कोटि है
टी सामान्यीकृत विचलन है।
; ई = 2.7218; एक्स आई -भिन्नता श्रृंखला विकल्प; - औसत;
गुण:
सामान्य बंटन फलन सम है, अर्थात च(टी)=च(-टी), . सामान्य बंटन फलन पूरी तरह से मानक विचलन द्वारा निर्धारित होता है।
§3। एक सामान्य वितरण की परिकल्पना का परीक्षण करना।
वितरण के नियम के बार-बार संदर्भ का कारण यह है कि कई यादृच्छिक कारणों की कार्रवाई से उत्पन्न निर्भरता, जिनमें से कोई भी प्रमुख नहीं है। यदि मो = मी की गणना परिवर्तनशील श्रृंखला में की गई थी, तो यह सामान्य वितरण से निकटता का संकेत दे सकता है। सामान्य कानून के अनुपालन का सबसे सटीक परीक्षण विशेष मानदंडों का उपयोग करके किया जाता है।
§4। सहमति मानदंड: पियर्सन, रोमानोव्स्की, कोलमोगोरोव।
पियर्सन की कसौटी।
सैद्धांतिक आवृत्ति
अनुभवजन्य आवृत्ति
सैद्धांतिक आवृत्तियों की गणना के लिए विधि।
- अंकगणितीय माध्य निर्धारित किया जाता है और अंतराल भिन्नता श्रृंखला के अनुसार प्रत्येक अंतराल के लिए टी की गणना की जाती है।
- हम सामान्यीकृत वितरण कानून के लिए संभाव्यता घनत्व का मान पाते हैं। पृष्ठ 49
- हम सैद्धांतिक आवृत्ति पाते हैं।
एल - अंतराल की लंबाई
- अनुभवजन्य आवृत्तियों का योग
- संभावित गहराई
मान को पूर्णांकों तक गोल करें
- पियर्सन के अनुपात की गणना
- तालिका मूल्य
डी.एफ. - अंतराल की संख्या - 3
डी.एफ. स्वतंत्रता की डिग्री की संख्या है।
- यदि > , तो वितरण सामान्य नहीं है, अर्थात एक सामान्य वितरण की परिकल्पना रद्द कर दी जाती है। अगर< , то распределение является нормальным.
रोमानोव्स्की मानदंड।
पियर्सन की कसौटी की गणना की जाती है;
डिग्रियों की संख्या।
अगर साथ<3, то распределение близко к нормальному.
कोलमोगोरोव की कसौटी
, डी-संचित अनुभवजन्य और सैद्धांतिक आवृत्तियों के बीच अधिकतम मूल्य। कोल्मोगोरोव का उपयोग करने के लिए एक आवश्यक शर्त: टिप्पणियों की संख्या 100 से अधिक है। एक विशेष संभावना तालिका के अनुसार जिसके साथ यह तर्क दिया जा सकता है कि यह वितरण सामान्य है।
§5। मॉडलिंग वितरण श्रृंखला का व्यावहारिक मूल्य।
- अनुभवजन्य वितरण के लिए सामान्य वितरण के नियमों को लागू करने की क्षमता।
- 3 x सिग्मा नियम का उपयोग करने की क्षमता।
- यह जानते हुए कि वितरण सामान्य है, जनसंख्या की जांच करके अतिरिक्त समय लेने वाली और महंगी गणनाओं से बचने की क्षमता।
टॉपिक 7: चयनात्मक अवलोकन।
§1। चयनात्मक अवलोकन की अवधारणा। इसके उपयोग के कारण।
§2. चयनात्मक अवलोकन के प्रकार।
§3। नमूनाकरण त्रुटियां।
§4। नमूना अवलोकन कार्य
§5। सामान्य आबादी के लिए नमूना अवलोकन डेटा का वितरण।
§6। छोटा सा नमूना।
§1। चयनात्मक अवलोकन की अवधारणा। इसके उपयोग के कारण।
चयनात्मक अवलोकन - ऐसा गैर-निरंतर अवलोकन, जिसमें अध्ययन की गई जनसंख्या की इकाइयाँ, एक निश्चित तरीके से चुनी जाती हैं, सांख्यिकीय परीक्षा के अधीन होती हैं।
नमूना अवलोकन का उद्देश्य (कार्य): जांच किए गए भाग के लिए, सांख्यिकीय अवलोकन के सभी नियमों और सिद्धांतों के अधीन इकाइयों की पूरी आबादी को चिह्नित करने के लिए।
चयनात्मक अवलोकन का उपयोग करने के कारण:
- बचत सामग्री, श्रम लागत और समय;
- अधिक विस्तार से और विस्तार से सांख्यिकीय आबादी और उनके समूहों की व्यक्तिगत इकाइयों का अध्ययन करने का अवसर।
- कुछ विशिष्ट समस्याओं को केवल चयनात्मक अवलोकन के उपयोग से ही हल किया जा सकता है।
- सक्षम और सुव्यवस्थित चयनात्मक अवलोकन परिणामों की उच्च सटीकता देता है।
सामान्य जनसंख्या उन इकाइयों का समूह है जिनसे चयन किया जाता है।
सैंपलिंग फ्रेम सर्वेक्षण के लिए चुनी गई इकाइयों का समूह है। आँकड़ों में, सामान्य जनसंख्या और नमूना जनसंख्या के मापदंडों के बीच अंतर करना प्रथागत है।
नमूने के प्रकार
चयन विधि द्वारा:
दोहराया गया
देखी गई विशेषताओं के पंजीकरण के बाद नमूने में शामिल इकाई को आगे की चयन प्रक्रिया में भाग लेने के लिए सामान्य आबादी में वापस कर दिया जाता है।
सामान्य आबादी का आयतन अपरिवर्तित रहता है, जिससे किसी भी इकाई के नमूने में लगातार गिरावट आती है।
न दोहराई
जिस आबादी से चयन किया गया है, उस आबादी को नमूना इकाई नहीं लौटाई जाती है।
चयन विधि:
दरअसल-यादृच्छिक सामान्य आबादी से इकाइयों के संबंध में यादृच्छिक या यादृच्छिक रूप से स्थिरता के किसी भी तत्व के बिना है। हालाँकि, इस तरह के नमूने का संचालन करने से पहले, यह सुनिश्चित करना चाहिए कि सामान्य आबादी की सभी इकाइयों को नमूने में शामिल होने का समान मौका मिले, अर्थात। सांख्यिकीय आबादी की इकाइयों की पूरी सूची में व्यक्तिगत इकाइयों की कोई चूक या अज्ञानता नहीं है। सामान्य जनसंख्या की सीमाओं को स्पष्ट रूप से स्थापित करना भी आवश्यक है। तकनीकी रूप से स्थापित चयन बहुत सारे ड्रा करके या यादृच्छिक संख्याओं की तालिका का उपयोग करके किया जाता है।
यांत्रिक नमूनाकरण (प्रत्येक 5 सूची में) उन मामलों में उपयोग किया जाता है जहां सामान्य आबादी को किसी तरह आदेश दिया जाता है, अर्थात इकाइयों के वितरण में एक निश्चित क्रम होता है। यांत्रिक नमूनाकरण करते समय, चयन का अनुपात स्थापित किया जाता है, जो सामान्य जनसंख्या और नमूना जनसंख्या के अनुपात द्वारा स्थापित किया जाता है।
यांत्रिक नमूनाकरण में त्रुटि का खतरा निम्न के कारण प्रकट हो सकता है: सामान्य जनसंख्या की इकाइयों की व्यवस्था में चयनित अंतराल और चक्रीय पैटर्न का यादृच्छिक संयोग।
ज़ोन्ड सैंपलिंग इसका उपयोग तब किया जाता है जब सामान्य जनसंख्या की सभी इकाइयों को किसी विशेषता के अनुसार समूहों (क्षेत्रों, देशों) में विभाजित किया जा सकता है।
संयुक्त नमूना।
इकाइयों का चयन किया जा सकता है:
- या समूह के आकार के अनुपात में
- या विशेषता के इंट्राग्रुप भेदभाव के अनुपात में
- , जहाँ n नमूने का आकार है, N सामान्य जनसंख्या का आकार है, n मैं – नमूने का आकार मैं-समूह, एन मैं – आयतन मैंनमूने।
- - यह विधि अधिक सटीक है, लेकिन नमूनाकरण के दौरान भिन्नता के बारे में पहले से निर्धारित करना बहुत कठिन है। (अवलोकन से पहले)।
धारावाहिक चयन।
इसका उपयोग तब किया जाता है जब ईसीसी को छोटे समूहों (श्रृंखला) में जोड़ा जाता है, उदाहरण के लिए तैयार उत्पादों, छात्र समूहों के साथ पैकेजिंग। सीरियल सैंपलिंग का सार यह है कि श्रृंखला को या तो यादृच्छिक या यांत्रिक तरीकों से चुना जाता है, और फिर चयनित श्रृंखला के भीतर एक सतत सर्वेक्षण किया जाता है।
संयुक्त चयन।
यह ऊपर चर्चा की गई चयन विधियों का एक संयोजन है, अधिक बार विशिष्ट और क्रमिक श्रृंखला के संयोजन का उपयोग किया जाता है, अर्थात। कई विशिष्ट समूहों से श्रृंखला का चयन।
चयन बहु-चरण और एकल-चरण, बहु-वाक्यांश और एकल-वाक्यांश भी हो सकता है।
मल्टी-स्टेज चयन: सामान्य आबादी से, पहले, बड़े समूह निकाले जाते हैं, फिर छोटे समूह, और इसी तरह तब तक जब तक उन इकाइयों का चयन नहीं किया जाता है जो सर्वेक्षण के अधीन हैं।
बहु-वाक्यांश चयन: इसके कार्यान्वयन के सभी चरणों में चयन की एक ही इकाई का संरक्षण शामिल है। इसी समय, प्रत्येक बाद के चरण में चुनी गई चयन इकाइयाँ परीक्षा के अधीन हैं, जिसका कार्यक्रम विस्तार कर रहा है (उदाहरण: पूरे संस्थान के छात्र, फिर कुछ संकायों के छात्र)।
§3। नमूनाकरण त्रुटियां।
व्यवस्थित |
प्रतिनिधित्व संबंधी त्रुटियां केवल चयनात्मक अवलोकन में होती हैं। इस तथ्य के कारण उत्पन्न होती है कि नमूना जनसंख्या सामान्य जनसंख्या को सटीक रूप से पुनरुत्पादित नहीं कर सकती है। उन्हें टाला नहीं जा सकता है, लेकिन उनका अनुमान लगाना आसान है और यदि आवश्यक हो, तो उन्हें कम से कम किया जा सकता है।
नमूनाकरण त्रुटि सामान्य जनसंख्या में पैरामीटर के मान और नमूना अवलोकन के परिणामों से गणना की गई उसके मूल्य के बीच का अंतर है। Dх=-m+ , Dх – नमूने में मामूली त्रुटि, m – सामान्य औसत; - नमूना माध्य।
सीमांत नमूनाकरण त्रुटि एक यादृच्छिक मूल्य है। चेबिशेव के कार्य यादृच्छिक नमूनाकरण त्रुटियों के पैटर्न के अध्ययन के लिए समर्पित हैं। चेबिशेव की प्रमेय सिद्ध करती है कि Dx निम्न से अधिक नहीं है: - औसत प्रतिचयन त्रुटि. t-आत्मविश्वास गुणांक इस त्रुटि की संभावना को इंगित करता है. पीपी 42-43।
मामले में जब ज्ञात एफ (टी) से टी निर्धारित करना आवश्यक होता है, तो हम निकटतम बड़े एफ (टी) लेते हैं और इससे टी निर्धारित करते हैं।
सीमा त्रुटि अंश
पी - साझा करें।
यदि चयन गैर-दोहराव वाले तरीके से किया गया था, तो सीमा त्रुटि सूत्र जोड़े जाते हैं
गैर-दोहराव के लिए सुधार।
प्रत्येक प्रकार के नमूना अवलोकन के लिए, प्रस्तुत त्रुटि की गणना अलग तरीके से की जाती है:
- उचित यादृच्छिक और यांत्रिक अवलोकन;
- ज़ोन्ड निगरानी
- सीरियल सैंपलिंग
आर नमूने में श्रृंखला की संख्या है;
आर सामान्य जनसंख्या में श्रृंखला की संख्या है;
अनुपात का इंटरग्रुप विचरण।
§4। नमूना अवलोकन कार्य
निम्नलिखित कार्यों के लिए प्रयुक्त:
- एन-? ज्ञात F(t), Dx से नमूना आकार निर्धारित करने के लिए।
- ज्ञात F(t), n से Dx नमूने का निर्धारण
- ज्ञात डीएक्स और एन से एफ (टी) का निर्धारण
1 टास्क n - ? सबसे पहले, गैर-दोहराव वाले चयन के लिए n को पुनर्चयन सूत्र द्वारा निर्धारित किया जाता है:
भिन्नता निर्धारित करने के तरीके:
- यह पिछले समान अध्ययनों से लिया गया है।
- एक सामान्य वितरण के साथ आरएमएस »भिन्नता की सीमा का 1/6।
- यदि वितरण स्पष्ट रूप से असममित है, तो भिन्नता की सीमा का RMS »1/5
- शेयर के लिए, अधिकतम संभव प्रसरण p(1-p)=0.25 लागू किया जाता है
- N³100 के साथ, फिर s 2 \u003d S 2 - नमूना विचरण
£30 एन£100, तब s 2 \u003d S 2 (n / n-1), s 2 - सामान्य विचरण
एन<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2
एन की गणना करते समय, किसी को टी के बड़े मूल्य और छोटी मामूली त्रुटियों का पीछा नहीं करना चाहिए इससे n में वृद्धि होती है और इसलिए लागत में वृद्धि होती है। निम्नलिखित कानून समान है।
§5। सामान्य आबादी के लिए नमूना अवलोकन डेटा का वितरण।
किसी भी वीएन का अंतिम लक्ष्य सामान्य जनसंख्या को चिह्नित करना है।
वीएन के परिणामों से गणना किए गए मान सामान्य जनसंख्या को उनकी सीमांत त्रुटि की सीमा को ध्यान में रखते हुए वितरित किए जाते हैं।
एक व्यक्ति द्वारा प्रति माह दही का सेवन मान लें।
£250-20m£250+20; £230m£270
और सिर्फ 1000 लोग
£230,000m£270,000
48%-5%£p£48%+5%
§6। छोटा सा नमूना।
आधुनिक परिस्थितियों में सांख्यिकीय अनुसंधान के अभ्यास में, छोटे नमूनों से निपटना तेजी से आवश्यक हो गया है।
छोटा सा नमूना- जिन इकाइयों की अवलोकन नमूना संख्या 30, n £ 30 / से अधिक नहीं है
छोटे नमूने के सिद्धांत का विकास अंग्रेजी सांख्यिकीविद् गॉसेट द्वारा किया गया था, जिन्होंने छद्म नाम छात्र के तहत 1908 में लिखा था।
उन्होंने साबित किया कि एक छोटे नमूने और सामान्य नमूने के साधनों के बीच विसंगति का अनुमान एक विशेष वितरण कानून है। एक छोटे नमूने के लिए गणना करते समय, s2 के मान की गणना नहीं की जाती है। संभावित त्रुटि सीमाओं के लिए टी सेंट छात्र मानदंड का उपयोग करें। पृष्ठ 44-45। विपरीत घटना की संभावना है।
स्वतंत्रता की डिग्री की संख्या
छोटे नमूना त्रुटि को सीमित करना
सीमांत शेयर त्रुटि
टॉपिक 8: सहसंबंध-रिग्रेशन विश्लेषण और मॉडलिंग।
§1। सहसंबंध और सीआरए की अवधारणा।
§2. केआरए के उपयोग और प्रतिबंधों के लिए शर्तें।
§3। कम से कम वर्ग विधि के आधार पर जोड़ी प्रतिगमन।
§4। युग्मित रेखीय प्रतिगमन समीकरण का अनुप्रयोग।
§5। कनेक्शन की जकड़न और कनेक्शन की ताकत के संकेतक।
§6। एकाधिक सहसंबंध।
§1। सहसंबंध और सीआरए की अवधारणा।
कार्यात्मक कनेक्शन वाई = 5x
सह - संबंध
विभिन्न घटनाओं और उनके संकेत, कार्यात्मक और सांख्यिकीय के बीच 2 प्रकार के संबंध हैं।
इस तरह के कनेक्शन को कार्यात्मक कहा जाता है, जब एक चर के मूल्य में परिवर्तन के साथ, दूसरा कड़ाई से परिभाषित तरीके से बदलता है, अर्थात, एक चर का मान दूसरे चर के एक या अधिक सटीक निर्दिष्ट मानों से मेल खाता है . एक कार्यात्मक कनेक्शन तभी संभव है जब चर y चर x पर निर्भर करता है और किसी अन्य कारक पर निर्भर नहीं करता है, लेकिन वास्तविक जीवन में यह असंभव है।
एक सांख्यिकीय संबंध तब मौजूद होता है, जब एक चर के मूल्य में परिवर्तन के साथ, दूसरा एक निश्चित सीमा के भीतर कोई भी मान ले सकता है, लेकिन इसकी सांख्यिकीय विशेषताएं एक निश्चित कानून के अनुसार बदल जाती हैं।
एक सांख्यिकीय संबंध का सबसे महत्वपूर्ण मामला एक सहसंबंध संबंध है। सहसंबंध के साथ, एक चर के विभिन्न मान दूसरे चर के विभिन्न औसत मूल्यों के अनुरूप होते हैं, अर्थात विशेषता x के मान में परिवर्तन के साथ, विशेषता y का औसत मान स्वाभाविक रूप से बदल जाता है।
सहसंबंध शब्द अंग्रेजी जीवविज्ञानी और सांख्यिकीविद् फ्रांसिस गैल (सहसंबंध) द्वारा पेश किया गया था
सहसंबंध विभिन्न तरीकों से उत्पन्न हो सकता है:
- कारक विशेषता की भिन्नता पर परिणामी विशेषता की भिन्नता का कारण निर्भरता।
- एक ही कारण के 2 प्रभावों के बीच एक सहसंबंध हो सकता है (आग, अग्निशामकों की संख्या, आग का आकार)
- संकेतों का संबंध, जिनमें से प्रत्येक एक ही समय में कारण और प्रभाव दोनों है (श्रम उत्पादकता और वेतन)
आँकड़ों में, निम्नलिखित प्रकार की निर्भरता के बीच अंतर करना प्रथागत है:
- जोड़ी सहसंबंध - परिणामी और तथ्यात्मक के 2 संकेतों के बीच संबंध, या दो कारक वाले के बीच।
- आंशिक सहसंबंध - प्रभावी और एक कारक विशेषता के बीच संबंध दूसरे कारक विशेषता के निश्चित मूल्य के साथ।
- एकाधिक सहसंबंध - अध्ययन में शामिल दो या दो से अधिक कारक लक्षणों पर परिणामी विशेषता की निर्भरता।
सहसंबंध विश्लेषण का कार्य सुविधाओं के बीच संबंधों की निकटता को मापना है। 19वीं शताब्दी के अंत में, गैल्टन और पियर्सन ने पिता और बच्चों की ऊंचाई के बीच संबंधों की जांच की।
प्रतिगमन कनेक्शन के रूप की जांच करता है। प्रतिगमन विश्लेषण का कार्य संबंध की विश्लेषणात्मक अभिव्यक्ति का निर्धारण करना है।
एक सामान्य अवधारणा के रूप में सहसंबंध-प्रतिगमन विश्लेषण में कनेक्शन की जकड़न में बदलाव और कनेक्शन की एक विश्लेषणात्मक अभिव्यक्ति की स्थापना शामिल है।
§2. केआरए के उपयोग और प्रतिबंधों के लिए शर्तें।
- बड़े पैमाने पर डेटा की उपस्थिति, क्योंकि सहसंबंध सांख्यिकीय है
- जनसंख्या की गुणात्मक एकरूपता की आवश्यकता है।
- परिणामी और कारक विशेषताओं के अनुसार जनसंख्या वितरण का अधीनता, सामान्य वितरण कानून के अनुसार, जो कम से कम वर्ग विधि के उपयोग से जुड़ा है।
§3। कम से कम वर्ग विधि के आधार पर जोड़ी प्रतिगमन।
प्रतिगमन विश्लेषण में संबंध की विश्लेषणात्मक अभिव्यक्ति का निर्धारण होता है। प्रपत्र रेखीय प्रतिगमन के बीच अंतर करता है, जिसे एक सीधी रेखा के समीकरण और गैर-रैखिक प्रतिगमन या द्वारा व्यक्त किया जाता है।
संचार की दिशा के अनुसार, उन्हें एक सीधी रेखा में प्रतिष्ठित किया जाता है, अर्थात। जैसे-जैसे x बढ़ता है, y बढ़ता जाता है।
उलटना |
उलटा अर्थात्। जैसे x बढ़ता है, y घटता है।
- ग्राफिकल विधि - सहसंबंध क्षेत्र पर अनुभवजन्य डेटा को प्लॉट करके, लेकिन कम वर्ग विधि का उपयोग करके अधिक सटीक अनुमान लगाया जाता है।
एक्स - वास्तविक संकेत
यू - प्रभावी का संकेत
वास्तविक मान और वर्ग युग्मन समीकरण द्वारा परिकलित मान के बीच का अंतर न्यूनतम होना चाहिए।
एलएसएम मिनट के साथ चयनित प्रतिगमन समीकरण के अनुसार प्राप्त सैद्धांतिक मूल्यों से अनुभवजन्य मूल्यों y के चुकता विचलन का योग है।
एक रैखिक संबंध के लिए
Þ ए,बी |
पैराबोला के लिए
अतिशयोक्ति के लिए
पैरामीटर ए, बी, सी समीकरण में लिखे गए हैं, फिर हम परिणामी समीकरण को अनुभवजन्य मान के साथ प्रतिस्थापित करते हैं एक्स मैंऔर सैद्धांतिक मूल्य पाएं यी ।फिर हम तुलना करते हैं यीसैद्धांतिक और यीअनुभवजन्य। उनके बीच के अंतर के वर्गों का योग न्यूनतम होना चाहिए। हम उस प्रकार की निर्भरता का चयन करते हैं जिसमें यह निर्भरता प्रदर्शित की जाती है।
जोड़ीदार रैखिक प्रतिगमन समीकरण में:
b युग्मित रेखीय प्रतिगमन का गुणांक है,यह बंधन की ताकत को मापता है, अर्थात माप की प्रति स्वीकृत इकाई के औसत मूल्य से y के जनसंख्या औसत विचलन की विशेषता है।
बी\u003d 20 जब x 1 चिन्ह y से बदलता है तो जनसंख्या में औसतन 20 से इसके औसत मूल्य से विचलन होता है।
प्रतिगमन गुणांक पर एक सकारात्मक संकेत सुविधाओं के बीच सीधा संबंध इंगित करता है, "-" चिह्न सुविधाओं के बीच एक प्रतिक्रिया दर्शाता है।
§4। युग्मित रेखीय प्रतिगमन समीकरण का अनुप्रयोग।
मुख्य अनुप्रयोग प्रतिगमन समीकरण के अनुसार भविष्यवाणी कर रहा है। पूर्वानुमान अन्य कारकों और प्रक्रिया स्थितियों की स्थिरता की स्थितियों से सीमित है। यदि चल रही प्रक्रिया का वातावरण इसमें तेजी से बदलता है, तो यह प्रतिगमन समीकरण नहीं होगा।
प्रतिगमन समीकरण में कारक के अपेक्षित मूल्य को प्रतिस्थापित करके एक बिंदु पूर्वानुमान प्राप्त किया जाता है। इस तरह के पूर्वानुमान के सटीक कार्यान्वयन की संभावना बेहद कम है।
यदि एक बिंदु पूर्वानुमान औसत पूर्वानुमान त्रुटि के मान के साथ है, तो ऐसे पूर्वानुमान को अंतराल पूर्वानुमान कहा जाता है।
औसत पूर्वानुमान त्रुटि दो प्रकार की त्रुटियों से बनती है:
- टाइप 1 एरर - रिग्रेशन लाइन एरर
- दूसरी तरह की त्रुटि - भिन्नता की त्रुटि से जुड़ी त्रुटि।
औसत पूर्वानुमान त्रुटि।
सामान्य जनसंख्या में प्रतिगमन रेखा की स्थिति में त्रुटि
एन - नमूना आकार
एक्स के - कारक का गलत मूल्य
सामान्य आबादी में प्रतिगमन रेखा से परिणामी विशेषता का आरएमएस
सहसंबंध विश्लेषण में रिश्ते की मजबूती का आकलन शामिल है। संकेतक:
- रैखिक सहसंबंध गुणांक - उनके बीच एक रैखिक संबंध के मामले में दो विशेषताओं के बीच संबंधों की जकड़न और दिशा की विशेषता है
= -1 पर कनेक्शन कार्यात्मक व्युत्क्रम है, = 1 कनेक्शन कार्यात्मक प्रत्यक्ष है, = 0 पर कोई कनेक्शन नहीं है।
इसका उपयोग केवल रैखिक संबंधों के लिए किया जाता है, इसका उपयोग मात्रात्मक विशेषताओं के बीच संबंधों का मूल्यांकन करने के लिए किया जाता है। केवल व्यक्तिगत मूल्यों पर गणना की जाती है।
सहसंबंध अनुपात:
अनुभवजन्य: परिणामी विशेषता के अनुसार दोनों प्रकार के विचरण की गणना की जाती है।
सैद्धांतिक:
प्रतिगमन समीकरण द्वारा गणना की गई प्रभावी सुविधा के मूल्यों का फैलाव
परिणामी विशेषता के अनुभवजन्य मूल्य का फैलाव
- उच्च स्तर की सटीकता
- एक वर्णनात्मक और मात्रात्मक विशेषता के बीच संबंध की निकटता का आकलन करने के लिए उपयुक्त है, लेकिन मात्रात्मक प्रभावी होना चाहिए
- सभी प्रकार के कनेक्शन के लिए उपयुक्त
स्पीयरमैन का सहसंबंध गुणांक
रैंक - क्रमित श्रृंखला में जनसंख्या इकाइयों की क्रम संख्या। दोनों सुविधाओं को एक ही क्रम में सबसे छोटे से सबसे बड़े या इसके विपरीत क्रम में रखना आवश्यक है। यदि जनसंख्या इकाइयों के रैंक को p x और p y द्वारा निरूपित किया जाता है, तो रैंकों का सहसंबंध गुणांक निम्न रूप लेगा:
सहसंबंध श्रृंखला गुणांक के लाभ:
- आप वर्णनात्मक विशेषताओं द्वारा भी रैंक कर सकते हैं जिन्हें संख्यात्मक रूप से व्यक्त नहीं किया जा सकता है, इसलिए, निम्नलिखित जोड़ी सुविधाओं के लिए स्पीयरमैन गुणांक की गणना संभव है: संख्या - संख्या; वर्णनात्मक - मात्रात्मक; वर्णनात्मक – वर्णनात्मक। (शिक्षा एक वर्णनात्मक विशेषता है)
- कनेक्शन की दिशा दिखाता है
स्पीयरमैन गुणांक के नुकसान।
- समान रैंक के अंतर एक विशेषता के मूल्य (मात्रात्मक लक्षणों के मामले में) में पूरी तरह से अलग अंतर के अनुरूप हो सकते हैं। उदाहरण: प्रति वर्ष देश की बिजली उत्पादन
यूएसए 2400 kWh 1
आरएफ 800 kWh 2
कनाडा 600 kWh 3
यदि स्पीयरमैन के मूल्यों में कई समान मूल्य होते हैं, तो संबंधित रैंक बनते हैं, अर्थात समान मध्य संख्याएँ
इस मामले में, स्पीयरमैन गुणांक की गणना निम्नानुसार की जाती है:
जे-फ़ीचर x के क्रम में लिंक की संख्या
अज- x द्वारा j लिंक में समान रैंक की संख्या
क-सुविधा y के क्रम में बंधन संख्या
बीके-में समान रैंकों की संख्या कौनगुच्छा
- 4. केंडल रैंक सहसंबंध गुणांक
अधिकतम रैंक राशि
S रैंकों का वास्तविक योग है
स्पीयरमैन गुणांक की तुलना में अधिक सख्त अनुमान देता है।
गणना के लिए, सभी इकाइयों को विशेषता x के अनुसार विशेषता के अनुसार रैंक किया गया है परप्रत्येक रैंक के लिए, दिए गए योग से अधिक के बाद के रैंकों की संख्या की गणना की जाती है, जिसे P द्वारा निरूपित किया जाता है और इस पदनाम Q के नीचे आने वाले रैंकों की संख्या।
पी+क्यू= 1/2 एन(एन-1)
- फेचनर रैंक सहसंबंध गुणांक।
फेचनर गुणांक - इन संख्याओं के योग के लिए मिलान और गैर-संयोग के जोड़े की संख्या में अंतर के अनुपात के रूप में कनेक्शन की जकड़न का एक उपाय।
- एक्स और वाई के लिए औसत की गणना
- व्यक्तिगत मान x i y i की तुलना "+" या "-" चिन्ह के अनिवार्य संकेत के साथ औसत मूल्यों से की जाती है। यदि चिह्न x और y में मेल खाते हैं, तो हम उन्हें संख्या "C" से संदर्भित करते हैं, यदि नहीं, तो "H" से।
- सुमेलित और अमिलित युग्मों की संख्या गिनें।
वर्णनात्मक विशेषताओं के संबंध में संबंध को मापने का कार्य सांख्यिकीविद् के समक्ष हो जाता है, ऐसे कार्य का एक महत्वपूर्ण विशेष मामला, 2 वैकल्पिक विशेषताओं के बीच संबंध को मापना, जिनमें से एक दूसरे परिणाम का कारण है।
2 वैकल्पिक विशेषताओं के बीच संबंधों की जकड़न को 2 गुणांकों का उपयोग करके मापा जा सकता है:
- संघ गुणांक
- आकस्मिक कारक
आकस्मिक गुणांक में एक खामी है: जब दो विषम संयोजनों में से एक Av या Ba शून्य के बराबर होता है, तो गुणांक एक में बदल जाता है। वह बहुत उदारता से कनेक्शन की जकड़न का आकलन करता है - वह इसे कम आंकता है।
पियर्सन का अनुपात
यदि दो नहीं हैं, लेकिन परस्पर संबंधित विशेषताओं में से प्रत्येक के अधिक संभावित मान हैं, तो निम्न गुणांक की गणना की जाती है:
- पियर्सन का अनुपात
- एक वर्णनात्मक विशेषता के लिए चुप्रोव गुणांक
पियर्सन गुणांक की गणना वर्ग आव्यूह से की जाती है
सामान्य से नीचे |
||||
1 और 2 - संकेत 1 और 2 के अनुसार समूह की संख्या क्रमशः। पियर्सन गुणांक का नुकसान यह है कि यह समूहों की संख्या में वृद्धि के साथ भी 1 तक नहीं पहुंचता है।
चुप्रोव गुणांक (1874-1926)
चुप्रोव गुणांक अधिक कठोरता से कनेक्शन की जकड़न का अनुमान लगाता है।
§6। एकाधिक सहसंबंध।
परिणामी और दो या दो से अधिक कारक विशेषताओं के बीच संबंध के अध्ययन को कहा जाता है एकाधिक प्रतिगमन। एकाधिक प्रतिगमन के तरीकों द्वारा निर्भरता के अध्ययन में, 2 कार्य निर्धारित किए गए हैं।
- प्रभावी फीचर y और वास्तविक फीचर्स x 1 , x 2 , x 3 , ... x k , यानी के बीच संबंध की विश्लेषणात्मक अभिव्यक्ति का निर्धारण। फ़ंक्शन y \u003d f (x 1, x 2, ... x k) खोजें
- प्रभावी और प्रत्येक कारक संकेतों के बीच संबंधों की जकड़न का मूल्यांकन।
सहसंबंध-प्रतिगमन मॉडल (CRM) एक प्रतिगमन समीकरण है जिसमें मुख्य कारक शामिल होते हैं जो परिणामी विशेषता की भिन्नता को प्रभावित करते हैं।
एकाधिक प्रतिगमन मॉडल के निर्माण में निम्नलिखित चरण शामिल हैं:
- संचार के रूप का चुनाव
- कारक सुविधाओं का चयन
- यह सुनिश्चित करना कि जनसंख्या सही अनुमान प्रदान करने के लिए काफी बड़ी है।
I. व्यवहार में आने वाले चर के बीच संबंधों का पूरा सेट 5 प्रकार के कार्यों द्वारा पूरी तरह से वर्णित है:
- रैखिक:
- शक्ति:
- सांकेतिक:
- परवलय:
- अतिपरवलय:
हालांकि सीआरए के अभ्यास में सभी 5 कार्य मौजूद हैं, रैखिक निर्भरता का सबसे अधिक उपयोग किया जाता है, सबसे सरल और सबसे आसानी से व्याख्या योग्य रैखिक निर्भरता समीकरण के रूप में: , k - समीकरण में शामिल कारकों का एक सेट, बी जे
0 - क्योंकि >0.7 इसलिए हम उन पर विशेष ध्यान देते हैं
पर्यावरण। संचार तंगी पैमाने:
यदि कनेक्शन 0 - 0.3 है - एक कमजोर कनेक्शन
0.3 - 0.5 - ध्यान देने योग्य
0.3 - 0.5 - करीब
0.7 - 0.9 - उच्च
0.9 से अधिक - बहुत अधिक
फिर हम दो विशेषताओं (आय और लिंग) की तुलना करते हैं<0,7, то включаем в уравнение множественной регрессии.
एकाधिक प्रतिगमन समीकरण में शामिल करने के लिए कारकों का चयन:
- प्रभावी और वास्तविक संकेतों के बीच एक कारण संबंध होना चाहिए।
- प्रभावी और वास्तविक संकेत एक-दूसरे से निकटता से जुड़े होने चाहिए, अन्यथा घटना उत्पन्न होती है बहुसंरेखता (>06) , अर्थात। समीकरण में शामिल कारक संकेत न केवल परिणाम को प्रभावित करते हैं, बल्कि एक दूसरे को भी प्रभावित करते हैं, जिससे संख्यात्मक डेटा की गलत व्याख्या होती है।
एकाधिक प्रतिगमन समीकरण में शामिल किए जाने वाले कारकों के चयन के तरीके:
1. विशेषज्ञ विधि - अत्यधिक योग्य विशेषज्ञों द्वारा किए गए सहज तार्किक विश्लेषण पर आधारित।
2. युग्मित सहसंबंध गुणांक के मेट्रिसेस का उपयोग पहली विधि के समानांतर किया जाता है, मैट्रिक्स इकाई विकर्ण के संबंध में सममित है।
3. चरणबद्ध प्रतिगमन विश्लेषण - प्रतिगमन समीकरण और महत्व परीक्षण में कारक सुविधाओं का क्रमिक समावेश प्रत्येक चरण में दो संकेतकों के मूल्यों के आधार पर किया जाता है। सहसंबंध, प्रतिगमन संकेतक।
सहसंबंध स्कोर: अनुपात के सैद्धांतिक सहसंबंध में परिवर्तन या माध्य अवशिष्ट विचरण में परिवर्तन की गणना करें। प्रतिगमन सूचक सशर्त रूप से शुद्ध प्रतिगमन गुणांक में परिवर्तन है।
कुल
31
32
22
85
सांख्यिकीय आँकड़ों को इस प्रकार प्रस्तुत किया जाना चाहिए कि उनका उपयोग किया जा सके। 3 मुख्य हैं सांख्यिकीय डेटा की प्रस्तुति के रूप:
- पाठ - पाठ में डेटा का समावेश;
- सारणीबद्ध - तालिकाओं में डेटा की प्रस्तुति;
- ग्राफिकल - रेखांकन के रूप में डेटा की अभिव्यक्ति।
पाठ प्रपत्रडिजिटल डेटा की एक छोटी राशि के साथ प्रयोग किया जाता है।
सारणीबद्ध प्रपत्रइसका सबसे अधिक उपयोग किया जाता है, क्योंकि यह सांख्यिकीय डेटा प्रस्तुत करने का एक अधिक कुशल रूप है। गणितीय तालिकाओं के विपरीत, जो प्रारंभिक स्थितियों के अनुसार, एक या दूसरे परिणाम प्राप्त करने की अनुमति देते हैं, सांख्यिकीय तालिकाएँ अध्ययन की जा रही वस्तुओं के बारे में संख्याओं की भाषा बताती हैं।
सांख्यिकीय तालिका- यह पंक्तियों और स्तंभों की एक प्रणाली है, जिसमें एक निश्चित क्रम और संबंध में सामाजिक-आर्थिक घटनाओं के बारे में सांख्यिकीय जानकारी प्रस्तुत की जाती है।
उदाहरण के लिए, निम्न तालिका रूस के विदेशी व्यापार के बारे में जानकारी प्रदान करती है जो पाठ के रूप में व्यक्त करने में अक्षम होगी।
1995 | 2000 | 2001 | 2002 | 2003 | 2004 | 2005 | 2006 | 2007 | |
अरब अमेरिकी डॉलर | |||||||||
विदेश व्यापार कारोबार | 145,0 | 149,9 | 155,6 | 168,3 | 212,0 | 280,6 | 369,2 | 468,6 | 578,2 |
निर्यात | 82,4 | 105,0 | 101,9 | 107,3 | 135,9 | 183,2 | 243,8 | 303,9 | 355,2 |
आयात | 62,6 | 44,9 | 53,8 | 61,0 | 76,1 | 97,4 | 125,4 | 164,7 | 223,1 |
व्यापार का संतुलन | 19,8 | 60,1 | 48,1 | 46,3 | 59,9 | 85,8 | 118,4 | 139,2 | 132,1 |
विदेशों के साथ | |||||||||
निर्यात | 65,4 | 90,8 | 86,6 | 90,9 | 114,6 | 153,0 | 210,2 | 260,6 | 301,5 |
आयात | 44,3 | 31,4 | 40,7 | 48,8 | 61,0 | 77,5 | 103,5 | 140,1 | 191,2 |
व्यापार का संतुलन | 21,2 | 59,3 | 45,9 | 42,1 | 53,6 | 75,5 | 106,7 | 120,4 | 110,3 |
सीआईएस देशों के साथ | |||||||||
निर्यात | 17,0 | 14,3 | 15,3 | 16,4 | 21,4 | 30,2 | 33,5 | 43,4 | 53,7 |
आयात | 18,3 | 13,4 | 13,0 | 12,2 | 15,1 | 19,9 | 21,9 | 24,6 | 31,9 |
व्यापार का संतुलन | -1,4 | 0,8 | 2,2 | 4,2 | 6,3 | 10,3 | 11,7 | 18,8 | 21,9 |
सांख्यिकीय तालिका के विषय और विधेय में भेद करें। विषय विशेषता वस्तु को इंगित करता है - या तो जनसंख्या की इकाइयाँ, या इकाइयों के समूह, या समग्रता। विधेय में, विषय की विशेषता आमतौर पर संख्यात्मक रूप में दी जाती है। तालिका का शीर्षक आवश्यक है, जो इंगित करता है कि तालिका डेटा किस श्रेणी और किस समय से संबंधित है।
विषय की प्रकृति के अनुसार सांख्यिकीय सारणियों को सरल, समूह और संयोजन सारणियों में विभाजित किया जाता है। एक साधारण तालिका के विषय में, अध्ययन की वस्तु को समूहों में विभाजित नहीं किया जाता है, लेकिन या तो जनसंख्या की सभी इकाइयों की सूची दी जाती है, या समग्र रूप से जनसंख्या का संकेत दिया जाता है। समूह तालिका के विषय में, अध्ययन की वस्तु को एक विशेषता के अनुसार समूहों में विभाजित किया जाता है, और विधेय समूहों में इकाइयों की संख्या (पूर्ण या प्रतिशत के रूप में) और समूहों के सारांश संकेतकों को इंगित करता है। संयोजन तालिका के विषय में, जनसंख्या को एक के अनुसार नहीं, बल्कि कई मानदंडों के अनुसार समूहों में विभाजित किया गया है।
तालिकाओं का निर्माण करते समय, निम्नलिखित सामान्य नियमों का पालन किया जाना चाहिए।
- तालिका का विषय बाएं (शायद ही कभी - ऊपरी) भाग में स्थित है, और विधेय - दाईं ओर (कम अक्सर - निचला)।
- स्तंभ शीर्षकों में संकेतकों के नाम और उनकी माप की इकाइयां होती हैं।
- अंतिम पंक्ति तालिका को पूरा करती है और इसके अंत में स्थित होती है, लेकिन कभी-कभी यह पहली होती है: इस मामले में, दूसरी पंक्ति "सहित" लिखी जाती है, और बाद की पंक्तियों में कुल रेखा के घटक होते हैं।
- अंकों के नीचे स्थित संख्याओं के अंकों के साथ, संख्यात्मक डेटा को प्रत्येक कॉलम के भीतर सटीकता की समान डिग्री के साथ लिखा जाता है, और पूर्णांक भाग भिन्नात्मक अल्पविराम से अलग होता है।
- तालिका में रिक्त कक्ष नहीं होने चाहिए: यदि डेटा शून्य है, तो "-" चिन्ह (डैश) लगाया जाता है; यदि डेटा ज्ञात नहीं है, तो प्रविष्टि "कोई जानकारी नहीं" बनाई जाती है या "..." (दीर्घवृत्त) चिन्ह लगाया जाता है। यदि प्रतिपादक मान शून्य नहीं है, लेकिन पहला महत्वपूर्ण अंक सटीकता की स्वीकृत डिग्री के बाद प्रकट होता है, तो 0.0 दर्ज किया जाता है (यदि, कहते हैं, 0.1 की सटीकता की डिग्री स्वीकार की गई थी)।
कभी-कभी सांख्यिकीय तालिकाओं को ग्राफ़ के साथ पूरक किया जाता है, जब लक्ष्य डेटा की कुछ विशेषताओं पर जोर देना होता है, उनकी तुलना करना। चित्रमय रूप उनकी धारणा के संदर्भ में डेटा प्रस्तुति का सबसे प्रभावी रूप है। रेखांकन की सहायता से, संरचना की विशेषताओं, गतिकी, घटना के संबंध और उनकी तुलना की दृश्यता प्राप्त की जाती है।
सांख्यिकीय रेखांकन संख्यात्मक मानों और रेखाओं, ज्यामितीय आकृतियों, रेखाचित्रों या भौगोलिक चार्ट के माध्यम से उनके अनुपात की सशर्त छवियां हैं। ग्राफिकल रूप सांख्यिकीय डेटा पर विचार करने की सुविधा देता है, उन्हें दृश्य, अभिव्यंजक और दृश्यमान बनाता है। हालाँकि, ग्राफ़ की कुछ सीमाएँ हैं: सबसे पहले, एक ग्राफ़ में उतना डेटा शामिल नहीं हो सकता जितना वह एक तालिका में फिट हो सकता है; इसके अलावा, ग्राफ़ हमेशा गोलाकार डेटा दिखाता है - सटीक नहीं, बल्कि अनुमानित। इस प्रकार, ग्राफ़ का उपयोग केवल सामान्य स्थिति दिखाने के लिए किया जाता है, विवरण नहीं। अंतिम दोष प्लॉटिंग की जटिलता है। इसे एक निजी कंप्यूटर (उदाहरण के लिए, Microsoft Office Excel पैकेज से "चार्ट विज़ार्ड") का उपयोग करके दूर किया जा सकता है।
सांख्यिकीय जानकारी की एक दृश्य और कॉम्पैक्ट प्रस्तुति के लिए, सांख्यिकीय तालिकाओं और ग्राफ़ (चार्ट, कार्टोग्राम और कार्टोग्राम सहित) का उपयोग किया जाता है।
सांख्यिकीय अवलोकन सामग्री के सारांश और समूहीकरण के परिणाम, एक नियम के रूप में, तालिकाओं के रूप में प्रस्तुत किए जाते हैं।
टेबल - सांख्यिकीय सामग्री की प्रस्तुति का सबसे तर्कसंगत, दृश्य और कॉम्पैक्ट रूप।
एक सांख्यिकीय तालिका एक तालिका है जिसमें एक या एक से अधिक आवश्यक विशेषताओं के अनुसार अध्ययन की गई जनसंख्या का सारांश संख्यात्मक विशेषता होती है, जो आर्थिक विश्लेषण के तर्क से परस्पर जुड़ी होती है।
अंजीर में दिखाए गए सांख्यिकीय तालिका के मुख्य तत्व। 5.1, इसका लेआउट बनाएं:
चावल। 5.1। सांख्यिकीय तालिका
तालिका का निर्माण करते समय, संख्यात्मक जानकारी पंक्तियों और ग्राफ़ के चौराहे पर स्थित होती है। इस प्रकार, बाह्य रूप से, तालिका स्तंभों और पंक्तियों का एक संग्रह है जो इसे बनाते हैं।
कंकाल। तालिका का आकार पंक्तियों की संख्या को स्तंभों की संख्या से गुणा करके निर्धारित किया जाता है।
सांख्यिकीय तालिका में तीन प्रकार के शीर्षक होते हैं: सामान्य, शीर्ष और पार्श्व। सामान्य शीर्षक संपूर्ण तालिका की सामग्री को दर्शाता है, केंद्र में इसके लेआउट के ऊपर स्थित है और बाहरी शीर्षक है। शीर्ष शीर्षक (विधेय शीर्षक) स्तंभों की सामग्री की विशेषता बताते हैं, और पार्श्व शीर्षक (विषय शीर्षक) पंक्तियों की सामग्री की विशेषता बताते हैं। वे आंतरिक शीर्षलेख हैं।
शीर्षकों से भरा तालिका का ढांचा इसका लेआउट बनाता है। यदि ग्राफ और रेखाओं के चौराहे पर हम संख्याएँ लिखते हैं, तो हमें एक पूर्ण सांख्यिकीय तालिका मिलती है। डिजिटल सामग्री को निरपेक्ष, सापेक्ष (खाद्य मूल्य सूचकांक) और औसत मूल्यों द्वारा दर्शाया जा सकता है। यदि आवश्यक हो, तो तालिकाओं के साथ शीर्षकों को स्पष्ट करने के लिए उपयोग की जाने वाली टिप्पणी, कुछ संकेतकों की गणना करने की पद्धति, सूचना के स्रोत आदि शामिल हो सकते हैं।
तार्किक सामग्री के अनुसार, तालिका एक "सांख्यिकीय वाक्य" है, जिसके मुख्य तत्व विषय और विधेय हैं।
सांख्यिकीय तालिका के विषय में संख्याओं की विशेषता वाले संकेतकों की एक सूची होती है। यह एक या एक से अधिक समुच्चय हो सकते हैं, समुच्चय की अलग-अलग इकाइयाँ (फर्म, संघ) उनकी सूची के क्रम में या कुछ मानदंडों के अनुसार समूहीकृत (अलग-अलग क्षेत्रीय इकाइयाँ, कालानुक्रमिक तालिकाओं में समय अवधि, आदि)। आमतौर पर तालिका का विषय पंक्ति नामों में बाईं ओर दिया जाता है।
सांख्यिकीय तालिका का विधेय संकेतकों की एक प्रणाली बनाता है जो अध्ययन की वस्तु की विशेषता है, अर्थात तालिका का विषय। विधेय शीर्ष शीर्षक बनाता है और बाएं से दाएं संकेतकों की तार्किक रूप से अनुक्रमिक व्यवस्था के साथ ग्राफ की सामग्री बनाता है।
शोधकर्ता की पसंद के आधार पर विषय और विधेय का स्थान स्थान बदल सकता है। विषय की संरचना और इकाइयों के समूहीकरण के आधार पर, इसमें सरल और जटिल सांख्यिकीय तालिकाओं को प्रतिष्ठित किया जाता है, और बाद में, समूह और संयोजन तालिकाओं में विभाजित किया जाता है।
एक साधारण तालिका में, विषय जनसंख्या की किसी भी वस्तु या क्षेत्रीय इकाइयों की एक सरल सूची देता है। सरल तालिकाएं मोनोग्राफिक और सूची हैं। मोनोग्राफिक वाले अध्ययन किए गए वॉल्यूम की इकाइयों के पूरे सेट को चिह्नित नहीं करते हैं, लेकिन इसमें से किसी एक समूह को एक निश्चित, पूर्व-तैयार विशेषता के अनुसार अलग किया जाता है। इस प्रकार, सरल सूची तालिकाओं को तालिकाएँ कहा जाता है, जिसके विषय में अध्ययन की गई जनसंख्या की इकाइयों की सूची होती है।
निम्नलिखित सिद्धांतों के अनुसार एक साधारण तालिका का विषय बनाया जा सकता है: प्रजातियां, क्षेत्रीय (सीआईएस देशों में जनसंख्या); अस्थायी, आदि। सरल सारणियाँ अध्ययन के तहत सामाजिक-आर्थिक प्रकार की घटनाओं, उनकी संरचना, साथ ही उन विशेषताओं के बीच अंतर्संबंधों और अन्योन्याश्रितताओं की पहचान करना संभव नहीं बनाती हैं। इन कार्यों को जटिल तालिकाओं की सहायता से पूरी तरह से हल किया जाता है: समूह और विशेष रूप से संयोजन तालिकाएँ।
समूह तालिकाओं को सांख्यिकीय तालिकाएँ कहा जाता है, जिसके विषय में एक मात्रात्मक या गुणात्मक विशेषता के अनुसार जनसंख्या इकाइयों का समूह होता है। समूह तालिकाओं में विधेय में विषय को चिह्नित करने के लिए आवश्यक संकेतक होते हैं।
सबसे सरल प्रकार की समूह तालिकाएँ विशेषता और भिन्नता वितरण श्रृंखला हैं। समूह तालिका अधिक जटिल हो सकती है यदि विधेय में न केवल प्रत्येक समूह में इकाइयों की संख्या होती है, बल्कि कई अन्य महत्वपूर्ण संकेतक भी होते हैं जो मात्रात्मक और गुणात्मक रूप से विषय समूहों की विशेषता रखते हैं। ऐसी तालिकाओं का उपयोग अक्सर समूहों में सारांश संकेतकों की तुलना करने के लिए किया जाता है, जो कुछ व्यावहारिक निष्कर्ष निकालने की अनुमति देता है। समूह तालिकाएँ केवल एक विशेषता के आधार पर सामाजिक-आर्थिक प्रकार की घटनाओं, उनकी संरचना की पहचान करना और उन्हें चिह्नित करना संभव बनाती हैं।
संयोजन तालिकाओं को सांख्यिकीय तालिकाएँ कहा जाता है, जिसके विषय में दो या दो से अधिक विशेषताओं के अनुसार एक साथ जनसंख्या इकाइयों का समूह होता है: प्रत्येक समूह, एक आधार पर निर्मित, किसी अन्य विशेषता के अनुसार उपसमूहों में विभाजित होता है, आदि।
संयोजन तालिकाएँ कई विशेषताओं के अनुसार पहचाने जाने वाले विशिष्ट समूहों और बाद के बीच के संबंधों को चिह्नित करना संभव बनाती हैं। विशेषताओं के अनुसार जनसंख्या की इकाइयों को सजातीय समूहों में विभाजित करने का क्रम या तो उनके संयोजन में उनमें से एक के महत्व से निर्धारित होता है, या जिस क्रम में उनका अध्ययन किया जाता है।
विधेय के जटिल विकास में उस विशेषता का विभाजन शामिल है जो इसे उपसमूहों में बनाता है। इससे वस्तु का अधिक पूर्ण और विस्तृत विवरण प्राप्त होता है। इस मामले में, उद्यमों के प्रत्येक समूह या उनमें से प्रत्येक को व्यक्तिगत रूप से उन विशेषताओं के एक अलग संयोजन द्वारा चित्रित किया जा सकता है जो विधेय बनाते हैं।
सांख्यिकीय आँकड़ों को इस प्रकार प्रस्तुत किया जाना चाहिए कि उनका उपयोग किया जा सके। सांख्यिकीय डेटा प्रस्तुत करने के 3 मुख्य रूप हैं:
1) पाठ - पाठ में डेटा का समावेश;
2) सारणीबद्ध - तालिकाओं में डेटा की प्रस्तुति;
3) ग्राफिक - रेखांकन के रूप में डेटा की अभिव्यक्ति।
टेक्स्ट फॉर्म का उपयोग तब किया जाता है जब डिजिटल डेटा की थोड़ी मात्रा होती है।
सारणीबद्ध रूप का सबसे अधिक उपयोग किया जाता है, क्योंकि यह सांख्यिकीय डेटा प्रस्तुत करने का अधिक कुशल रूप है। गणितीय तालिकाओं के विपरीत, जो प्रारंभिक स्थितियों के अनुसार, एक या दूसरे परिणाम प्राप्त करने की अनुमति देते हैं, सांख्यिकीय तालिकाएँ अध्ययन की जा रही वस्तुओं के बारे में संख्याओं की भाषा बताती हैं।
सांख्यिकीय तालिका- यह पंक्तियों और स्तंभों की एक प्रणाली है, जिसमें एक निश्चित क्रम और संबंध में सामाजिक-आर्थिक घटनाओं के बारे में सांख्यिकीय जानकारी प्रस्तुत की जाती है।
तालिका 2. 2000 - 2006 के लिए रूसी संघ का विदेशी व्यापार, अरब डॉलर
अनुक्रमणिका | 2000 | 2001 | 2002 | 2003 | 2004 | 2005 | 2006 |
विदेश व्यापार कारोबार | 149,9 | 155,6 | 168,3 | 280,6 | 368,9 | 468,4 | |
निर्यात | 101,9 | 107,3 | 135,9 | 183,2 | 243,6 | 304,5 | |
आयात | 44,9 | 53,8 | 76,1 | 97,4 | 125,3 | 163,9 | |
व्यापार का संतुलन | 60,1 | 48,1 | 46,3 | 59,9 | 85,8 | 118,3 | 140,7 |
शामिल: | |||||||
विदेशों के साथ | |||||||
निर्यात | 90,8 | 86,6 | 90,9 | 114,6 | 210,1 | 261,1 | |
आयात | 31,4 | 40,7 | 48,8 | 77,5 | 103,5 | 138,6 | |
व्यापार का संतुलन | 59,3 | 45,9 | 42,1 | 53,6 | 75,5 | 106,6 | 122,5 |
उदाहरण के लिए, तालिका में। 2 रूस के विदेशी व्यापार के बारे में जानकारी प्रस्तुत करता है, जिसे पाठ्य रूप में व्यक्त करना अक्षम होगा।
अंतर करना विषयऔर विधेयसांख्यिकीय तालिका। विषय विशेषता वस्तु को इंगित करता है - या तो जनसंख्या की इकाइयाँ, या इकाइयों के समूह, या समग्रता। विधेय में, विषय की विशेषता आमतौर पर संख्यात्मक रूप में दी जाती है। अनिवार्य हैडरतालिका, जो इंगित करती है कि तालिका में डेटा किस श्रेणी और किस समय से संबंधित है।
विषय की प्रकृति के अनुसार सांख्यिकीय सारणियों में विभाजित किया गया है सरल, समूहऔर संयोजन. एक साधारण तालिका के विषय में, अध्ययन की वस्तु को समूहों में विभाजित नहीं किया जाता है, लेकिन या तो जनसंख्या की सभी इकाइयों की एक सूची दी जाती है, या समग्र रूप से जनसंख्या का संकेत दिया जाता है (उदाहरण के लिए, तालिका 11)। समूह तालिका के विषय में, अध्ययन की वस्तु को एक विशेषता के अनुसार समूहों में विभाजित किया गया है, और विधेय समूहों में इकाइयों की संख्या (पूर्ण या प्रतिशत के रूप में) और समूहों के लिए सारांश संकेतक (उदाहरण के लिए, तालिका) को इंगित करता है। 4). संयोजन तालिका के विषय में, जनसंख्या को एक के अनुसार नहीं, बल्कि कई मानदंडों (उदाहरण के लिए, तालिका 2) के अनुसार समूहों में विभाजित किया गया है।
तालिकाओं का निर्माण करते समय, आपको निम्नलिखित द्वारा निर्देशित किया जाना चाहिए सामान्य नियम.
1. तालिका का विषय बाईं ओर (कम अक्सर - ऊपरी) भाग में स्थित होता है, और विधेय - दाईं ओर (कम अक्सर - निचला)।
2. स्तंभ शीर्षकों में संकेतकों और उनकी इकाइयों के नाम होते हैं।
3. अंतिम पंक्ति तालिका को पूरा करती है और इसके अंत में स्थित होती है, लेकिन कभी-कभी यह पहली होती है: इस मामले में, दूसरी पंक्ति को "सहित" लिखा जाता है, और बाद की पंक्तियों में कुल रेखा के घटक होते हैं।
4. अंकों के नीचे स्थित संख्याओं के अंकों के साथ, संख्यात्मक डेटा को प्रत्येक कॉलम के भीतर सटीकता की समान डिग्री के साथ लिखा जाता है, और पूर्णांक भाग को भिन्नात्मक अल्पविराम से अलग किया जाता है।
5. तालिका में खाली कक्ष नहीं होना चाहिए: यदि डेटा शून्य है, तो "-" चिन्ह (डैश) लगाया जाता है; यदि डेटा ज्ञात नहीं है, तो प्रविष्टि "कोई जानकारी नहीं" बनाई जाती है या "..." (दीर्घवृत्त) चिन्ह लगाया जाता है। यदि प्रतिपादक मान शून्य नहीं है, लेकिन पहला महत्वपूर्ण अंक सटीकता की स्वीकृत डिग्री के बाद प्रकट होता है, तो 0.0 दर्ज किया जाता है (यदि, कहते हैं, 0.1 की सटीकता की डिग्री स्वीकार की गई थी)।
कभी-कभी सांख्यिकीय तालिकाओं को ग्राफ़ के साथ पूरक किया जाता है, जब लक्ष्य डेटा की कुछ विशेषताओं पर जोर देना होता है, उनकी तुलना करना। चित्रमय रूप उनकी धारणा के संदर्भ में डेटा प्रस्तुति का सबसे प्रभावी रूप है। रेखांकन की सहायता से, संरचना की विशेषताओं, गतिकी, घटना के संबंध और उनकी तुलना की दृश्यता प्राप्त की जाती है।
सांख्यिकीय रेखांकन- ये संख्यात्मक मानों और रेखाओं, ज्यामितीय आकृतियों, रेखाचित्रों या भौगोलिक चार्टों के माध्यम से उनके अनुपात की सशर्त छवियां हैं। ग्राफिकल रूप सांख्यिकीय डेटा पर विचार करने की सुविधा देता है, उन्हें दृश्य, अभिव्यंजक और दृश्यमान बनाता है। हालाँकि, ग्राफ़ की कुछ सीमाएँ हैं: सबसे पहले, एक ग्राफ़ में उतना डेटा शामिल नहीं हो सकता जितना वह एक तालिका में फिट हो सकता है; इसके अलावा, ग्राफ़ हमेशा गोलाकार डेटा दिखाता है - सटीक नहीं, बल्कि अनुमानित। इस प्रकार, ग्राफ़ का उपयोग केवल सामान्य स्थिति दिखाने के लिए किया जाता है, विवरण नहीं। अंतिम दोष प्लॉटिंग की जटिलता है। इसे पर्सनल कंप्यूटर (उदाहरण के लिए, पैकेज से "आरेख विज़ार्ड") का उपयोग करके दूर किया जा सकता है माइक्रोसॉफ्ट ऑफिस एक्सेल).
ग्राफिक्स के निर्माण की विधि के अनुसार, उन्हें विभाजित किया गया है चित्र, कार्टोग्रामऔर चार्ट आरेख.
डेटा के ग्राफिकल प्रतिनिधित्व का सबसे आम तरीका चार्ट हैं, जो निम्न प्रकार के होते हैं: रैखिक, रेडियल, स्कैटर, प्लानर, वॉल्यूमेट्रिक, कर्ली। आरेखों का प्रकार प्रस्तुत किए गए डेटा के प्रकार और निर्माण कार्य पर निर्भर करता है। किसी भी स्थिति में, ग्राफ़ के साथ एक शीर्षक होना चाहिए - ग्राफ़ फ़ील्ड के ऊपर या नीचे। शीर्षक इंगित करता है कि कौन सा संकेतक प्रदर्शित किया गया है, किस क्षेत्र के लिए और किस समय के लिए।
लाइन ग्राफ़ का उपयोग मात्रात्मक चर का प्रतिनिधित्व करने के लिए किया जाता है: चर के बीच उनके मूल्यों, गतिशीलता, संबंधों की भिन्नता की विशेषताएं। डेटा भिन्नता का उपयोग करके विश्लेषण किया जाता है वितरण क्षेत्र, जमा करता है(वक्र से कम) और तोरण(वक्र "से बड़ा")। वितरण बहुभुज पर विषय 4 में चर्चा की गई है (उदाहरण चित्र 5.)। एक संचयी बनाने के लिए, चर विशेषता के मूल्यों को भुज के साथ प्लॉट किया जाता है, और निर्देशांक आवृत्तियों या आवृत्तियों के संचित योग होते हैं (से f1से ∑ एफ). एक तोरण बनाने के लिए, आवृत्तियों के संचित योग को y-अक्ष पर उल्टे क्रम में (∑ से) रखा जाता है एफपहले f1). टेबल के अनुसार कम्यूलेट और ऑगिव करें। 4. चित्र में दर्शाइए। 1.
चावल। 1. सीमा शुल्क मूल्य के मूल्य के अनुसार माल के वितरण का संचयन और तोरण
प्रवृत्ति विश्लेषण में लाइन चार्ट का उपयोग विषय 5 (उदाहरण चित्र 13) में शामिल है और विषय 6 में लिंक विश्लेषण के लिए उनका उपयोग (उदाहरण चित्र 21)। विषय 6 में स्कैटर प्लॉट्स का उपयोग भी शामिल है (उदाहरण चित्र 20)।
लाइन चार्ट में विभाजित हैं एक आयामी, एक चर पर डेटा का प्रतिनिधित्व करने के लिए प्रयोग किया जाता है, और दो आयामी- दो चर के लिए। एक-आयामी रेखा ग्राफ़ का एक उदाहरण एक वितरण बहुभुज है, और एक द्वि-आयामी एक प्रतिगमन रेखा है (उदाहरण के लिए, चित्र 21)।
कभी-कभी, संकेतक में बड़े बदलाव के साथ, एक लघुगणकीय पैमाने का उपयोग किया जाता है। उदाहरण के लिए, यदि एक संकेतक का मान 1 से 1000 तक भिन्न होता है, तो यह प्लॉट करते समय कठिनाइयाँ पैदा कर सकता है। ऐसे मामलों में, वे सूचक मानों के लघुगणक पर स्विच करते हैं, जो इतना भिन्न नहीं होगा: एलजी 1 = 0, एलजी 1000 = 3.
के बीच समतलबार ग्राफ (हिस्टोग्राम) उपयोग की आवृत्ति के अनुसार प्रतिष्ठित होते हैं, जिसमें संकेतक को बार के रूप में प्रस्तुत किया जाता है, जिसकी ऊंचाई संकेतक के मान से मेल खाती है (उदाहरण के लिए, चित्र 4)।
संकेतक के मूल्य के लिए एक विशेष ज्यामितीय आकृति के क्षेत्र की आनुपातिकता अन्य प्रकार के प्लानर आरेखों को रेखांकित करती है: त्रिकोणीय, वर्ग, आयताकार. आप एक वृत्त के क्षेत्रों की तुलना का भी उपयोग कर सकते हैं - इस मामले में, वृत्त की त्रिज्या निर्धारित है।
खंड चार्टक्षैतिज रूप से फैले हुए आयतों के रूप में संकेतक प्रस्तुत करता है, और अन्यथा बार चार्ट के समान होता है।
प्लानर आरेखों में, यह अक्सर प्रयोग किया जाता है पाई चार्ट, जिसका उपयोग अध्ययन की गई जनसंख्या की संरचना को दर्शाने के लिए किया जाता है। पूरे सेट को 100% के रूप में लिया जाता है, यह सर्कल के कुल क्षेत्रफल से मेल खाता है, सेक्टरों के क्षेत्र सेट के कुछ हिस्सों के अनुरूप होते हैं। तालिका के अनुसार 2006 में रूसी संघ के विदेशी व्यापार की संरचना का एक सेक्टर आरेख बनाएं। 2 (अंजीर देखें। 2)। कंप्यूटर प्रोग्राम का उपयोग करते समय, सेक्टर आरेख त्रि-आयामी रूप में बनाए जाते हैं, अर्थात दो में नहीं, बल्कि तीन विमानों में (चित्र 3 देखें)।
चावल। 2. सरल पाई चार्ट 3. 3डी पाई चार्ट
घुंघराले (चित्र) आरेख छवि की स्पष्टता को बढ़ाते हैं, क्योंकि उनमें प्रदर्शित संकेतक की एक तस्वीर शामिल होती है, जिसका आकार संकेतक के आकार से मेल खाता है।
ग्राफ़ बनाते समय, सब कुछ समान रूप से महत्वपूर्ण होता है - ग्राफ़िक छवि का सही विकल्प, अनुपात, ग्राफ़ डिज़ाइन करने के नियमों का अनुपालन। इन मुद्दों को और अधिक विस्तार से कवर किया गया है।
अध्ययन की जा रही घटनाओं की भौगोलिक विशेषताओं को चित्रित करने के लिए कार्टोग्राम और कार्टोग्राम का उपयोग किया जाता है। वे अध्ययन के तहत घटना का स्थान दिखाते हैं, एक निश्चित क्षेत्र में इसकी तीव्रता - एक गणतंत्र, क्षेत्र, आर्थिक या प्रशासनिक जिले आदि में। कार्टोग्राम और कार्टोग्राम का निर्माण विशेष साहित्य में माना जाता है, उदाहरण के लिए।
काम का अंत -
यह विषय इससे संबंधित है:
सांख्यिकी की अवधारणा
सांख्यिकी की अवधारणा.. सांख्यिकी का विषय और पद्धति.. सांख्यिकीय अवलोकन सारांश और सांख्यिकीय डेटा का समूहन..
यदि आपको इस विषय पर अतिरिक्त सामग्री की आवश्यकता है, या आपको वह नहीं मिला जिसकी आप तलाश कर रहे थे, तो हम अपने कार्यों के डेटाबेस में खोज का उपयोग करने की सलाह देते हैं:
हम प्राप्त सामग्री के साथ क्या करेंगे:
यदि यह सामग्री आपके लिए उपयोगी साबित हुई है, तो आप इसे सामाजिक नेटवर्क पर अपने पृष्ठ पर सहेज सकते हैं:
करें |
इस खंड में सभी विषय:
सांख्यिकी का विषय और तरीका
"सांख्यिकी" शब्द को 1746 में जर्मन वैज्ञानिक गॉटफ्रीड अचेनवाल द्वारा वैज्ञानिक उपयोग में पेश किया गया था, जिन्होंने जर्मन विश्वविद्यालयों में पढ़ाए जाने वाले पाठ्यक्रम "स्टेट स्टडीज" के शीर्षक को "सेंट" के साथ बदलने का प्रस्ताव रखा था।
सांख्यिकीय अवलोकन
लोगों के पास सांख्यिकीय जानकारी के लिए अलग-अलग दृष्टिकोण हैं: कुछ इसे नहीं समझते हैं, दूसरों को बिना शर्त विश्वास करते हैं, और फिर भी अन्य लोग अंग्रेजी राजनेता डिसरायली की राय से सहमत हैं: "झूठ के 3 प्रकार हैं: झूठ,
आँकड़ों का सारांश और समूहन
सारांश - अवलोकन सामग्री का वैज्ञानिक रूप से संगठित प्रसंस्करण (पहले से विकसित कार्यक्रम के अनुसार), जिसमें एकत्रित डेटा के अनिवार्य नियंत्रण के अलावा, व्यवस्थितकरण, समूहीकरण शामिल है।
सम्पूर्ण मूल्य
सामूहिक परिघटनाओं को चिह्नित करने के लिए, आँकड़े सांख्यिकीय मात्राओं (संकेतकों) का उपयोग करते हैं जो इकाइयों के समूहों या समग्र (घटना) को समग्र रूप से चिह्नित करते हैं। सांख्यिकीय मात्रा
सापेक्ष मूल्य
एक सापेक्ष मूल्य दो निरपेक्ष मूल्यों को विभाजित (तुलना) करने का परिणाम है। भिन्न का अंश वह मान है जिसकी तुलना की जा रही है, और हर वह मान है जिसकी तुलना की जा रही है (ba
औसत मान
जैसा कि पहले भी कई बार कहा जा चुका है, सांख्यिकी सामूहिक परिघटनाओं और प्रक्रियाओं का अध्ययन करती है। इनमें से प्रत्येक घटना में पूरे सेट और विशेष, व्यक्तिगत गुणों दोनों के लिए सामान्य है।
एक वितरण श्रृंखला का निर्माण
आँकड़ों द्वारा अध्ययन की जाने वाली विशेषताएँ एक ही अवधि या बिंदु समय में जनसंख्या की विभिन्न इकाइयों के लिए भिन्न (एक दूसरे से भिन्न) होती हैं। उदाहरण के लिए, विदेशी व्यापार कारोबार का मूल्य भिन्न होता है
वितरण श्रृंखला की संरचनात्मक विशेषताओं की गणना
भिन्नता का अध्ययन करते समय, वितरण श्रृंखला की ऐसी विशेषताओं का उपयोग किया जाता है जो मात्रात्मक रूप से इसकी संरचना, संरचना का वर्णन करती हैं। उदाहरण के लिए, माध्यिका है - चर विशेषता का मान
भिन्नता के आकार और तीव्रता के उपायों की गणना
सबसे सरल संकेतक भिन्नता की सीमा है - अध्ययन की गई आबादी में उपलब्ध मूल्यों से किसी विशेषता के अधिकतम और न्यूनतम मूल्यों के बीच का पूर्ण अंतर (24):
वितरण क्षणों और उसके आकार के संकेतकों की गणना
भिन्नता की प्रकृति के आगे के अध्ययन के लिए, इसके अंकगणितीय माध्य मान से किसी विशेषता के व्यक्तिगत मूल्यों के विचलन की विभिन्न डिग्री के औसत मूल्यों का उपयोग किया जाता है। इन संकेतकों को कहा जाता है
यह जांचना कि वितरण श्रृंखला सामान्य है या नहीं
सैद्धांतिक वितरण वक्र को परिवर्तनशील श्रृंखला में आवृत्ति परिवर्तन की एक सतत रेखा के रूप में एक श्रृंखला के ग्राफिक प्रतिनिधित्व के रूप में समझा जाता है, कार्यात्मक रूप से विकल्पों में परिवर्तन के साथ जुड़ा हुआ है, अन्य
जाँच करना कि क्या वितरण श्रृंखला प्वासों के नियम के अनुरूप है
सीमा शुल्क निरीक्षण ने माल की रिहाई के बाद एक निरीक्षण किया। परिणामस्वरूप, प्रत्येक परीक्षण में पहचान किए गए उल्लंघनों की संख्या की निम्न असतत वितरण श्रृंखला प्राप्त की गई (तालिका 16)। तालिका नंबर एक
संरचना परिवर्तन के पूर्ण और सापेक्ष संकेतक
सांख्यिकीय जनसंख्या का विकास न केवल प्रणाली के तत्वों में मात्रात्मक वृद्धि या कमी में प्रकट होता है, बल्कि इसकी संरचना में परिवर्तन में भी होता है। संरचना कुल की संरचना है
संरचना परिवर्तन के रैंक संकेतक
संरचना में अंतर को मापने के लिए, कम सटीक, लेकिन गणना करने में आसान, संकेतक अक्सर उपयोग किए जाते हैं, जो कि शेयरों के मूल्यों में अंतर का आकलन करने पर आधारित होते हैं, लेकिन उनके रैंकों में, अर्थात् क्रमिक
चयनात्मक अवलोकन की अवधारणा
नमूनाकरण विधि का उपयोग तब किया जाता है जब बड़ी मात्रा में डेटा के कारण निरंतर अवलोकन का उपयोग शारीरिक रूप से असंभव हो या आर्थिक रूप से संभव न हो। एक शारीरिक असंभवता है
नमूना लेने के तरीके
1. वास्तव में यादृच्छिक चयन: HS की सभी इकाइयाँ क्रमांकित हैं, और ड्रा के परिणामस्वरूप निकाली गई संख्याएँ उन इकाइयों के अनुरूप हैं जो नमूने में गिरीं, और संख्याओं की संख्या नियोजित संख्या के बराबर है
औसत नमूनाकरण त्रुटि
नमूने में इकाइयों की आवश्यक संख्या का चयन पूरा करने और अवलोकन कार्यक्रम द्वारा प्रदान की गई इन इकाइयों की विशेषताओं को पंजीकृत करने के बाद, वे सामान्यीकरण संकेतकों की गणना के लिए आगे बढ़ते हैं। उन्हें से
सीमांत नमूना त्रुटि
यह देखते हुए कि एक नमूना सर्वेक्षण के आधार पर एचएस की सामान्यीकरण विशेषता का सही आकलन करना असंभव है, यह आवश्यक है कि यह पता लगाया जाए कि यह किस सीमा में स्थित है। एक विशेष नमूने में, अंतर
आवश्यक नमूना आकार
चयनात्मक अवलोकन का एक कार्यक्रम विकसित करते समय, उन्हें सीमांत त्रुटि और संभाव्यता के स्तर का एक विशिष्ट मूल्य दिया जाता है। न्यूनतम नमूना आकार जो प्रदान करता है
दिशा-निर्देश
काम। उद्यम में, 100 में से 100 श्रमिकों का साक्षात्कार यादृच्छिक गैर-दोहराए गए नमूने के क्रम में किया गया था और महीने के लिए उनकी आय पर निम्नलिखित डेटा प्राप्त किए गए थे (तालिका 24): टा
समय श्रृंखला की अवधारणा
आँकड़ों के सबसे महत्वपूर्ण कार्यों में से एक समय के साथ विश्लेषण किए गए संकेतकों में परिवर्तन का अध्ययन है, अर्थात उनकी गतिशीलता। गतिकी की श्रृंखला (समय श्रृंखला) का विश्लेषण करके इस समस्या को हल किया जाता है।
गतिकी की एक श्रृंखला के स्तरों में परिवर्तन के संकेतक
समय श्रृंखला का विश्लेषण यह निर्धारित करने के साथ शुरू होता है कि पूर्ण और सापेक्ष शर्तों में श्रृंखला के स्तर कैसे बदलते हैं (बढ़ते, घटते या अपरिवर्तित रहते हैं)। ट्रेस करना
गतिकी की एक श्रृंखला के औसत संकेतक
डायनामिक्स की प्रत्येक श्रृंखला को समय के साथ बदलते n संकेतकों के एक निश्चित सेट के रूप में माना जा सकता है, जिसे औसत मूल्यों के रूप में संक्षेपित किया जा सकता है। ऐसे सामान्यीकृत (औसत) संकेतक विशेष रूप से हैं
गतिकी की श्रृंखला में मुख्य प्रवृत्ति (प्रवृत्ति) की पहचान करने के तरीके
गतिकी की श्रृंखला का अध्ययन करने का एक मुख्य कार्य श्रृंखला के स्तरों को बदलने में मुख्य प्रवृत्ति (पैटर्न) की पहचान करना है, जिसे प्रवृत्ति कहा जाता है। कुछ मामलों में एक श्रृंखला के स्तरों को बदलने में नियमितता
प्रवृत्ति पर्याप्तता आकलन और पूर्वानुमान
पाए गए प्रवृत्ति समीकरण के लिए, इसकी विश्वसनीयता (पर्याप्तता) का आकलन करना आवश्यक है, जो आमतौर पर फिशर मानदंड का उपयोग करके किया जाता है, इसके परिकलित मान Fр की तुलना करता है
मौसमी विश्लेषण
गतिशीलता की श्रृंखला में, जिनमें से स्तर मासिक या त्रैमासिक संकेतक हैं, यादृच्छिक उतार-चढ़ाव के साथ, मौसमी उतार-चढ़ाव अक्सर देखे जाते हैं, जिन्हें समय-समय पर समझा जाता है
दिशा-निर्देश
संघीय राज्य सांख्यिकी सेवा के अनुसार, 2000-2006 की अवधि के लिए रूस के विदेशी व्यापार (एसवीटी) का संतुलन। तालिका में प्रस्तुत कई गतिकी की विशेषता। 36. तालिका 36. पी के लिए रूस का विदेशी व्यापार संतुलन (सीबीटी)।
सहसंबंध निर्भरता की अवधारणा
वस्तुगत दुनिया के सबसे सामान्य कानूनों में से एक घटना के बीच सार्वभौमिक संबंध और निर्भरता का कानून है। स्वाभाविक रूप से, सबसे विविध क्षेत्रों में घटना की जांच करते समय, आंकड़े अनिवार्य रूप से टकराते हैं
सहसंबंधों की पहचान और मूल्यांकन के तरीके
दो विशेषताओं के बीच सहसंबंध की उपस्थिति और प्रकृति की पहचान करने के लिए सांख्यिकी में कई विधियों का उपयोग किया जाता है। 1. समांतर डेटा पर विचार (केएन
रैंक सहसंबंध गुणांक
रैंक सहसंबंध गुणांक कम सटीक हैं, लेकिन दो सहसंबद्ध विशेषताओं के बीच संबंध की निकटता को मापने के लिए गैर-पैरामीट्रिक संकेतकों की गणना करना आसान है। इसमे शामिल है
समय श्रृंखला के सहसंबंध की ख़ासियतें
कई अध्ययनों में, एक साथ कई संकेतकों की गतिशीलता का अध्ययन करना आवश्यक है, अर्थात समानांतर में कई समय श्रृंखला पर विचार करें। इस मामले में, निर्भरता को मापना आवश्यक हो जाता है
गुणात्मक विशेषताओं के बीच संबंधों की मजबूती के संकेतक
सहसंबंध तालिकाओं की विधि न केवल मात्रात्मक पर लागू होती है, बल्कि वर्णनात्मक (गुणात्मक) विशेषताओं पर भी लागू होती है, जिसके बीच संबंध अक्सर विभिन्न समाजशास्त्रियों का संचालन करते समय अध्ययन किया जाता है।
एकाधिक सहसंबंध
व्यावहारिक समस्याओं को हल करते समय, शोधकर्ताओं को इस तथ्य का सामना करना पड़ता है कि सहसंबंध दो विशेषताओं के बीच संबंधों तक सीमित नहीं हैं: प्रभावी y और कारक x। कार्रवाई में
उद्देश्य और सूचकांक के प्रकार
सूचकांक एक सापेक्ष मूल्य है जो दिखाता है कि दी गई शर्तों के तहत अध्ययन की गई घटना का स्तर कितनी बार अन्य स्थितियों के तहत समान घटना के स्तर से भिन्न होता है। स्थितियों में अंतर हो सकता है
व्यक्तिगत सूचकांक
यदि अध्ययन के तहत घटना की संरचना कोई मायने नहीं रखती है तो स्तरों की तुलना करके प्राप्त सापेक्ष मूल्य को एक व्यक्तिगत सूचकांक कहा जाता है। अलग-अलग इंडेक्स i द्वारा निरूपित किए जाते हैं
सामान्य सूचकांक
यदि अध्ययन की जाने वाली घटना विषम है और स्तरों की तुलना उन्हें एक सामान्य माप में लाने के बाद ही की जा सकती है, तो सामान्य सूचकांकों के माध्यम से आर्थिक विश्लेषण किया जाता है। सूचकांक सामान्य हो जाता है
औसत सूचकांक
गुणात्मक संकेतकों का अध्ययन करते समय, एक निश्चित सजातीय आबादी के लिए अनुक्रमित संकेतक के औसत मूल्य के समय (या स्थान) में परिवर्तन पर विचार करना अक्सर आवश्यक होता है।
प्रादेशिक सूचकांक
प्रादेशिक सूचकांकों का उपयोग विभिन्न संकेतकों की स्थानिक, अंतर्क्षेत्रीय तुलना के लिए किया जाता है। उनकी गणना परंपरागत (गतिशील) सूचकांकों की गणना से अधिक जटिल है