एक्सेल में डेटा को सामान्य कैसे करें

एक्सेल के लिए कई उपकरण हैं डेटा विश्लेषण लेकिन जिस डेटा के साथ आप काम करते हैं वह सही रूप में होना चाहिए। यदि भिन्नताएँ बड़ी हैं, तो इनके बीच संबंध स्थापित करना कठिन हो सकता है अलग संख्या सेट। उस कारण से, माध्य और साथ ही मानक विचलन परिधि हैं जो एक्सेल में डेटा के किसी भी सेट को अक्सर सामान्य करने में मदद करते हैं।

यदि आप चाहते हैं सामान्य प्रति डेटा सेट इससे पहले कि आप उन पर अन्य विश्लेषणात्मक उपकरणों का उपयोग करें, ऐसा करना आसान है। आप कुछ खास तरीकों से एक्सेल में सामान्यीकृत या मानकीकृत डेटासेट प्राप्त कर सकते हैं।

सामान्यीकृत डेटा को समझना

मानकीकृत डेटा आमतौर पर सामान्यीकरण का परिणाम होता है . डेटा या संख्याओं का एक पूरा सेट औसत या माध्य के साथ-साथ पूरे सेट के लिए गणना किए गए मानक विचलन की मदद से बदलता है। सामान्यीकृत डेटा के लिए मानक वितरण आमतौर पर प्रतिनिधित्व करता है a विचरण के रूप में 1 के साथ 0 का माध्य .

जब एक डेटा सेट को सामान्यीकृत किया जाता है, तो आपको ऊपर रहने के लिए सकारात्मक मान मिलेंगे, जबकि नकारात्मक मान माध्य से नीचे हैं। +1 एक ऐसे मान का प्रतिनिधित्व करता है जो 1 से ऊपर विचलन करता है इस बीच -1 वह है जो तब दर्शाया जाता है जब मानक विचलन माध्य से एक नीचे होता है।

सामान्यीकरण के लिए प्रयुक्त कार्य

  • जब कोई डेटा सेट को सामान्य बनाना चाहता है तो दो मुख्य विश्लेषण आवश्यक हैं। उदाहरण के लिए, डेटा जो A2 से A51 तक चलता है, जब आप इसे सामान्य करना चाहते हैं, तो आपको इस सेट का औसत और मानक विचलन मान ज्ञात करना होगा।
  • औसत चुनने के लिए का ऐसा डेटा, एक सेल का चयन करें जो डेटा के बगल में है और खाली है; यहां आप माध्य के रूप में लेबल कर सकते हैं और दर्ज कर सकते हैं सूत्र '= औसत (A2: A51)'।

आप की सीमा बदल सकते हैं नंबर डेटासेट के अनुसार आप चाहते हैं विचार करना। उदाहरण के लिए, यदि आंकड़े B4 और B55 के बीच है, सूत्र '=AVERAGE(B4: B55)' टाइप करें।

  • एक मानक विचलन खोजने के लिए, एक अन्य सेल चुनें जो खाली हो। इसे मानक विचलन के रूप में लेबल करें और सूत्र '=STDEV(A2: A51)' टाइप करें। यहां, आप समायोजित कर सकते हैं सेल निर्देशांक डेटासेट रेंज के अनुसार।
  • अंतिम चरण to . है मानकीकरण फ़ंक्शन का उपयोग करें, एक्सेल में मौजूद एक उपयोगी टूल। इसमें दिए गए प्रारूप के अंदर तीन तर्क या सूचना बिट शामिल हैं: मानक (मान, माध्य, मानक विचलन) .
  • आप सामान्यीकृत डेटा को डेटा के बगल में एक सेल के अंदर एक लेबल के रूप में या उन कोशिकाओं के बाद टाइप कर सकते हैं जहां औसत और मानक विचलन दिखाया गया है।
  • चुने गए सेल में, आपको करने की आवश्यकता है सूत्र में टाइप करें '=STANDARDIZE(A2, $C$2, $D$2)'; यह सेल A2 के बीच डेटा को सामान्य करने की आवश्यकता को इंगित करता है, C2 में पाया गया माध्य और सेल D2 में मानक विचलन। $ चिह्न अगले चरणों में सूत्र को दोहराने में आसान बनाता है।
  • एक सेल के निचले कोने पर माउस पॉइंटर होवर करें और जब काला क्रॉस दिखाई दे तो आपको उस पर क्लिक करने और इसे नीचे खींचने की आवश्यकता है ताकि यह डेटा की कोशिकाओं को ऊपर ले जाए; यह सूत्र की नकल करेगा और इनपुट डेटा को स्थान बदलने, पंक्ति कोशिकाओं से मिलान करने और माध्य और मानक विचलन को स्थापित करने की अनुमति देगा।

एक्सेल में डेटा को सामान्य करने के लिए कदम

एक्सेल बड़े डेटा सेट को आसानी से संभालने में मदद करता है। सामान्यीकरण मापदंडों के साथ, यहां आप बड़ी संख्या के सेटों को छोटे पैमानों पर कम करने के लिए उपयोग कर सकते हैं। सामान्यीकरण समीकरण विभिन्न डेटा सेटों की तुलना करने में भी मदद करता है।

  1. एक्सेल में एक नया या मौजूदा खोलें

जब आप एक्सेल में डेटा को सामान्य करना चाहते हैं तो यह पहला कदम है। आपके पास मौजूदा डेटा की एक स्प्रेडशीट हो सकती है जिसे सामान्यीकृत करने की आवश्यकता है। माइक्रोसॉफ्ट एक्सेल लॉन्च करें। यह एक स्प्रेडशीट को एक नए दस्तावेज़ के रूप में खोलता है; आप द्वारा शुरू कर सकते हैं यहां डेटा दर्ज करना या सहेजे गए दस्तावेज़ को खोलना चुनना 'ओपन' विकल्प पर क्लिक करके।

  1. अंकगणित माध्य से प्रारंभ करें

सेल C1 से प्रारंभ करें और सूत्र में टाइप करें =AVERAGE(A1: AX) . AX के बजाय कॉलम A में डेटा की अंतिम सेल दर्ज करें। यह के लिए इनपुट पूरा करेगा औसत समारोह। यह के लिए प्रयुक्त अंकगणितीय माध्य भी लौटाएगा सामान्यीकरण

  1. मानक विचलन की गणना करें

जैसा कि ऊपर की छवि में देखा गया है, सेल C2 का चयन करें जहां आप फंक्शन STDEV.S(A1: AX) टाइप कर सकते हैं। उद्धरण चिह्न आवश्यक नहीं हैं और आपको औसत के लिए उल्लिखित कॉलम ए में अंतिम डेटा सेल के अनुसार एएक्स के मूल्य को बदलने की जरूरत है गणना समारोह। यह मानक विचलन गणना शुरू करता है और डेटा को सामान्य करने के लिए उपयोग में आता है।

सेल B1 . पर क्लिक करके मानक सूत्र दर्ज करें जहां आप STANDARDISE(A1, C$1, C$2) टाइप करते हैं। हालांकि, प्रतीकों के इनपुट के समय, आपको उद्धरण चिह्न लगाने की आवश्यकता नहीं है। डॉलर के चिह्न का उपयोग इसे बहुमुखी बनाने में मदद करता है। आप इसे कॉपी कर सकते हैं और इसे किसी अन्य सेल में पेस्ट कर सकते हैं और पंक्तियों और स्तंभों में सेल के सापेक्ष संदर्भ स्वचालित रूप से उठाए जाते हैं।

यह उपयोगकर्ता को कहीं भी सूत्र का उपयोग करने में मदद करता है और सेल संदर्भ C1, C2 को बदलने की आवश्यकता नहीं है। इस फंक्शन के पूरा होने पर नॉर्मलाइज्ड फॉर्म सेल A1 B1 पर आ जाता है।

  1. शेष डेटा को सामान्य करें

एक बार जब आप कॉलम ए के पहले सेल में डेटा को सामान्य कर लेते हैं, तो आपको बाकी कॉलम ए के लिए भी ऐसा ही करना होगा। बी 1 का चयन करें, उसी पर क्लिक करें और माउस को कॉलम और बाकी सेल के नीचे खींचकर रखें। इसे तब तक बनाए रखें जब तक कि बी कॉलम में सभी सेल कवर न हो जाएं। कॉलम बी पर लागू मानकीकृत सूत्र को देखने के लिए माउस को छोड़ दें।

एक्सेल फ़ंक्शंस जो डेटा को सामान्य करने में मदद करते हैं

जब आप स्प्रेडशीट में डेटा को सामान्य कर रहे होते हैं, तो फ़ॉर्मूला IF, 'AND' और 'DATEDIF' उपयोगी होते हैं यदि फ़ंक्शन डेटा को फ़िल्टर करने वाले फ़्लैग बनाने में मदद करता है। 'DATEDIF' है एक फ़ंक्शन जो समय अवधि निर्धारित करने में मदद करता है जो दो दी गई तिथियों के बीच से गुजरती है। 'AND' फ़ंक्शन दो या दो से अधिक स्तंभों के बीच संबंध प्रदर्शित करता है।

आप a . का एक उदाहरण देख सकते हैं डेटा स्प्रेडशीट यहां,

  • यहां डेटा किसान द्वारा काटे गए सेबों की संख्या और किस खेत और दिनों को दर्शाता है।
  • शुरू होने के 30 दिनों के भीतर कटाई का दिन तय करने के लिए, उपयोग करने का सूत्र है =DATEDIF(E2, A2,d)।
  • दो चर के लिए खाते में एक ध्वज सेट करें। यह सूत्र =AND(D2 = 1, F2 .) का उपयोग करके किया जाता है<= 30).
  • अंतिम चरण में जोड़े गए दो क्षेत्रों को चलाना और संपूर्ण रूप से डेटा सेट पर लागू करना शामिल हो सकता है।

उपरोक्त चरण और कार्य एक्सेल में डेटा के विभिन्न सेटों को प्रभावी ढंग से सामान्य बनाने में मदद करते हैं।

एक्सेल में डेटा को सामान्य करने का क्या मतलब है?

मानकीकरण - मूल संख्यात्मक मानों को एक निश्चित सीमा के भीतर फिट करने के लिए बदलना।
  • उदाहरण के लिए, आप टेस्ट स्कोर को संशोधित करना चाहते हैं कि सकता है 0-100 के बीच होना 0-1 की सीमा के भीतर होना।
  • हो सकता है कि आप यह चाहते हों सामान्य जब आपके पास अलग-अलग श्रेणियों के साथ कई चर हों।

आप डेटा को सामान्य कैसे करते हैं?

मैं एक्सेल में 100 को सामान्य कैसे करूं?

प्रति सामान्य डेटासेट में मान 0 और . के बीच होना चाहिए 100 , आप निम्न सूत्र का उपयोग कर सकते हैं:
  1. साथमैं= (एक्समैं- न्यूनतम(x)) / (अधिकतम(x) - मिनट(x)) * 100 .
  2. साथमैं= (एक्समैं- न्यूनतम(x)) / (अधिकतम(x) - मिनट(x)) * Q.
  3. न्यूनतम अधिकतम मानकीकरण .
  4. अर्थ मानकीकरण .

सबसे अच्छा सामान्यीकरण तरीका क्या है?

सर्वोत्तम सामान्यीकरण तकनीक अनुभवजन्य रूप से अच्छा काम करता है, इसलिए नए विचारों को आज़माएं यदि आपको लगता है कि वे आपके सुविधा वितरण पर अच्छा काम करेंगे। जब सुविधा कमोबेश एक निश्चित सीमा में समान रूप से वितरित की जाती है। जब फीचर में कुछ एक्सट्रीम आउटलेयर होते हैं।

आप आयु डेटा को सामान्य कैसे करते हैं?

सिद्धांत। मान लीजिए नाम की एक विशेषता की वास्तविक सीमा उम्र 5 से 100 है। हम कर सकते हैं सामान्य इन मानों को के प्रत्येक मान से 5 घटाकर [0, 1] की श्रेणी में लाया जाता है उम्र कॉलम और फिर परिणाम को 95 (100-5) से विभाजित करना।

कौन सा बेहतर सामान्यीकरण या मानकीकरण है?

मानकीकरण है अच्छा उपयोग करने के लिए जब आप जानते हैं कि आपके डेटा का वितरण गाऊसी वितरण का पालन नहीं करता है। मानकीकरण दूसरी ओर, उन मामलों में मददगार हो सकता है जहां डेटा गाऊसी वितरण का अनुसरण करता है। हालांकि, यह जरूरी नहीं कि सच हो।

मानकीकरण और सामान्यीकरण के बीच अंतर क्या है?

मानकीकरण आमतौर पर इसका मतलब है कि मानों को [0,1] की श्रेणी में पुनर्विक्रय करता है। मानकीकरण आम तौर पर इसका मतलब है कि डेटा को 0 के माध्य और 1 के मानक विचलन (इकाई विचरण) के लिए पुनर्विक्रय करता है।

क्या मुझे आयु डेटा को सामान्य करना चाहिए?

मशीन लर्निंग के लिए, प्रत्येक डेटासेट की आवश्यकता नहीं होती है मानकीकरण . इसकी आवश्यकता तभी होती है जब सुविधाओं की अलग-अलग श्रेणियां हों। उदाहरण के लिए, एक पर विचार करें आंकड़े दो विशेषताओं वाला सेट, उम्र , और आय (x2)। कहां उम्र 0-100 के बीच है, जबकि आय 0-100,000 और उच्चतर के बीच है।

आपको डेटा को कब सामान्य नहीं करना चाहिए?

कुछ अच्छे कारण नहीं प्रति सामान्य
  1. जुड़ना महंगा है। सामान्य आपके डेटाबेस में अक्सर बहुत सारी टेबल बनाना शामिल होता है।
  2. सामान्यीकृत डिजाइन मुश्किल है।
  3. जल्दी और गंदा जल्दी और गंदा होना चाहिए।
  4. यदि आप NoSQL डेटाबेस का उपयोग कर रहे हैं, तो पारंपरिक मानकीकरण है नहीं वांछित।

क्या सामान्यीकरण हमेशा अच्छा होता है?

3 उत्तर। यह एल्गोरिथम पर निर्भर करता है। कुछ एल्गोरिदम के लिए मानकीकरण कोई प्रभाव नहीं है। आमतौर पर, दूरियों के साथ काम करने वाले एल्गोरिदम काम करते हैं बेहतर पर सामान्यीकृत डेटा लेकिन इसका मतलब यह नहीं है कि प्रदर्शन होगा हमेशा के बाद उच्च हो मानकीकरण .

हम छवि डेटा को सामान्य क्यों करते हैं?

छवि को सामान्य करना इनपुट: डेटा सामान्यीकरण एक महत्वपूर्ण कदम है जो यह सुनिश्चित करता है कि प्रत्येक इनपुट पैरामीटर (इस मामले में पिक्सेल) में एक समान है आंकड़े वितरण। यह नेटवर्क को प्रशिक्षित करते समय अभिसरण को तेज करता है। ऐसे का वितरण डेटा होगा शून्य पर केंद्रित एक गाऊसी वक्र जैसा दिखता है।

सामान्यीकरण का लक्ष्य क्या है?

मूल रूप से, मानकीकरण एक डेटाबेस में डेटा को कुशलतापूर्वक व्यवस्थित करने की प्रक्रिया है। के दो मुख्य उद्देश्य हैं मानकीकरण प्रक्रिया: अनावश्यक डेटा को समाप्त करें (एक ही डेटा को एक से अधिक टेबल में संग्रहीत करना) और सुनिश्चित करें कि डेटा निर्भरता समझ में आती है (केवल एक तालिका में संबंधित डेटा संग्रहीत करना)।

क्या हमें छवियों को सामान्य करने की आवश्यकता है?

इसका सामान्य उद्देश्य किसी इनपुट को परिवर्तित करना है छवि पिक्सेल मूल्यों की एक श्रेणी में जो इंद्रियों के लिए अधिक परिचित या सामान्य हैं, इसलिए शब्द मानकीकरण . अगर हम ग्रेस्केल का उपयोग कर रहे हैं छवि , हम केवल सामान्य करने की जरूरत एक चैनल का उपयोग करना।

आप छवि को सामान्य कैसे करते हैं?

पर कुछ भिन्नताएं हैं सामान्य कैसे करें इमेजिस लेकिन अधिकांश इन दो विधियों का उपयोग करते प्रतीत होते हैं:
  1. कुल परिकलित प्रति चैनल माध्य घटाएं इमेजिस (उदा. VGG_ILSVRC_16_layers)
  2. पिक्सेल/चैनल के आधार पर घटाना सभी पर परिकलित इमेजिस (जैसे CNN_S, Caffe का संदर्भ नेटवर्क भी देखें)

आप पायथन में डेटा को सामान्य कैसे करते हैं?

अजगर प्रीप्रोसेसिंग लाइब्रेरी प्रदान करता है, जिसमें शामिल है सामान्य करने के लिए कार्य सामान्य आंकड़े . यह एक इनपुट के रूप में एक सरणी लेता है और 0 और 1 के बीच इसके मानों को सामान्य करता है। फिर यह इनपुट के समान आयामों के साथ एक आउटपुट सरणी देता है।

आप आरजीबी मूल्यों को कैसे सामान्य करते हैं?

कब सामान्य आरजीबी मूल्य एक छवि के, आप प्रत्येक पिक्सेल को विभाजित करते हैं मूल्य पिक्सेल के योग से मूल्य सभी चैनलों पर। तो यदि आपके पास संबंधित चैनलों में तीव्रता वाले आर, जी, और बी के साथ एक पिक्सेल है सामान्यीकृत मान आर/एस, जी/एस और बी/एस (जहां, एस=आर+जी+बी) होगा।

हम छवि को 255 से विभाजित क्यों करते हैं?

तब से 255 अधिकतम मूल्य है, भाग देनेवाला द्वारा 255 0-1 प्रतिनिधित्व व्यक्त करता है। प्रत्येक चैनल (लाल, हरा और नीला प्रत्येक चैनल हैं) 8 बिट हैं, इसलिए वे प्रत्येक 256 तक सीमित हैं, इस मामले में 255 चूंकि 0 शामिल है। जैसा कि संदर्भ से पता चलता है, सिस्टम आमतौर पर फ़्लोटिंग पॉइंट मानों का उपयोग करते समय 0-1 के बीच मानों का उपयोग करते हैं।