सामान्यकरण अतिरेक को कम या समाप्त करके डिस्क स्थान के अपव्यय को रोकता है।
तुलना चार्ट
तुलना के लिए आधार | मानकीकरण | असमान्यीकरण |
---|---|---|
बुनियादी | सामान्यकरण गैर-निरर्थक और सुसंगत डेटा को संग्रहीत करने के लिए एक सेट स्कीमा बनाने की प्रक्रिया है। | विमुद्रीकरण डेटा के संयोजन की प्रक्रिया है ताकि इसे तेजी से बुझाया जा सके। |
उद्देश्य | डेटा अतिरेक और असंगति को कम करने के लिए। | अतिरेक पेश करने के माध्यम से प्रश्नों का तेजी से निष्पादन प्राप्त करने के लिए। |
में इस्तेमाल किया | ओएलटीपी प्रणाली, जहां डालने को बनाने, हटाने और तेजी से अद्यतन करने और गुणवत्ता डेटा संग्रहीत करने पर जोर दिया गया है। | OLAP प्रणाली, जहां खोज और विश्लेषण को तेज बनाने पर जोर दिया जाता है। |
डेटा अखंडता | बनाए रखा | बरकरार नहीं रख सकते |
फालतूपन | सफाया | जोड़ा गया |
तालिकाओं की संख्या | बढ़ती है | कम हो जाती है |
डिस्क में जगह | अनुकूलित उपयोग | क्षय |
सामान्यीकरण की परिभाषा
सामान्य रूप से डेटाबेस में डेटा को कुशलता से व्यवस्थित करने की विधि है। इसमें कुछ निश्चित नियमों के अनुसार तालिकाओं का निर्माण करना और उन तालिकाओं के बीच संबंध स्थापित करना शामिल है। अतिरेक और असंगत निर्भरता को इन नियमों का उपयोग करके हटाया जा सकता है ताकि इसे और अधिक लचीला बनाया जा सके।
निरर्थक डेटा डिस्क स्थान को बर्बाद करता है, डेटा असंगति को बढ़ाता है और डीएमएल प्रश्नों को धीमा कर देता है। यदि एक ही डेटा एक से अधिक स्थानों पर मौजूद है और उस डेटा पर कोई अपडेशन किया जाता है, तो परिवर्तन को सभी स्थानों पर परिलक्षित होना चाहिए। असंगत डेटा डेटा खोज कर सकता है और इसके लिए रास्ता खो कर कठिन हो सकता है।
सामान्यीकरण करने के पीछे कई कारण हैं जैसे अतिरेक से बचना, विसंगतियों को अपडेट करना, अनावश्यक कोडिंग, डेटा को ऐसे रूप में रखना जो बदलाव को अधिक आसानी से और सही तरीके से समायोजित कर सकें और डेटा की कमी को लागू कर सकें।
सामान्यीकरण में विशेषताओं के बीच कार्यात्मक निर्भरता का विश्लेषण शामिल है। संरचना के साथ संबंध बनाने के लिए संबंधों (तालिकाओं) को विसंगतियों के साथ विघटित किया जाता है। यह तय करने में मदद करता है कि किन विशेषताओं को एक संबंध में वर्गीकृत किया जाना चाहिए।
सामान्यीकरण मूल रूप से सामान्य रूपों की अवधारणाओं पर आधारित है। एक संबंध तालिका को एक सामान्य रूप में कहा जाता है यदि यह निश्चित बाधाओं को पूरा करती है। 6 परिभाषित सामान्य रूप हैं: 1NF, 2NF, 3NF, BCNF, 4NF और 5NF। सामान्यीकरण को अतिरेक को खत्म करना चाहिए लेकिन अखंडता की कीमत पर नहीं।
निरूपण की परिभाषा
विमुद्रीकरण सामान्यीकरण की व्युत्क्रम प्रक्रिया है, जहां सामान्यीकृत स्कीमा को एक स्कीमा में बदल दिया जाता है जिसमें अनावश्यक जानकारी होती है। अतिरेक का उपयोग करके और निरर्थक डेटा को सुसंगत रखते हुए प्रदर्शन में सुधार किया जाता है। विकृतीकरण करने का कारण एक सामान्यीकृत संरचना द्वारा क्वेरी प्रोसेसर में निर्मित ओवरहेड्स हैं ।
निरूपण को आधार सम्बन्ध के रूप में श्रेष्ठ सामान्य रूप संबंधों के सम्मिलित होने की विधि के रूप में भी परिभाषित किया जा सकता है, जो निम्न सामान्य रूप में है। यह तालिकाओं की संख्या को कम कर देता है, और जटिल तालिका जुड़ जाती है क्योंकि अधिक संख्या में जोड़ प्रक्रिया को धीमा कर सकते हैं। विभिन्न अपभ्रंश तकनीक हैं जैसे: व्युत्पन्न मूल्य, पूर्व में शामिल होने वाली तालिकाओं, हार्ड-कोडित मूल्यों और मास्टर के बारे में विवरण रखने आदि।
यहां पर अपभ्रंश दृष्टिकोण, इस अवधारणा पर जोर देता है कि सभी डेटा को एक स्थान पर रखकर, इस डेटा को इकट्ठा करने के लिए उन कई फाइलों को खोजने की आवश्यकता को समाप्त कर सकता है। मूल रणनीति का उपयोग वनीकरण में किया जाता है, जहां उन संशोधनों की जांच के लिए सबसे अधिक सत्तारूढ़ प्रक्रिया का चयन किया जाता है जो अंततः प्रदर्शन में सुधार करेंगे। और सबसे बुनियादी परिवर्तन यह है कि जुड़ने की संख्या को कम करने के लिए मौजूदा तालिका में कई विशेषताओं को जोड़ना।
सामान्यीकरण और असामान्यता के बीच मुख्य अंतर
- सामान्यीकरण डेटा अतिरेक और असंगति को कम करने और डेटा अखंडता को प्राप्त करने के लिए डेटा को कई तालिकाओं में विभाजित करने की तकनीक है। दूसरी तरफ, डेटा पुनर्प्राप्ति को तेज़ बनाने के लिए, अपसरण एक एकल तालिका में डेटा के संयोजन की तकनीक है।
- ओएलटीपी प्रणाली में सामान्यीकरण का उपयोग किया जाता है, जो डालने, हटाने और विसंगतियों को तेजी से अपडेट करने पर जोर देता है। जैसा कि, ओएलएपी प्रणाली में डीमेंलाइजेशन का उपयोग किया जाता है, जो खोज और विश्लेषण को तेज बनाने पर जोर देता है।
- डेटा की अखंडता को सामान्य बनाने की प्रक्रिया में बनाए रखा जाता है जबकि विकेंद्रीकरण में डेटा अखंडता को बनाए रखना मुश्किल होता है।
- जब सामान्यीकरण किया जाता है तो निरर्थक डेटा समाप्त हो जाता है जबकि निरूपण निरर्थक डेटा को बढ़ाता है।
- सामान्यीकरण से तालिकाओं और जुड़ने की संख्या बढ़ जाती है। इसके विपरीत, अपभ्रंश तालिकाओं की संख्या को कम करता है और जुड़ता है।
- डिस्क स्पेस डिसेंट्रलाइजेशन में बर्बाद हो जाता है क्योंकि एक ही डेटा को अलग-अलग जगहों पर स्टोर किया जाता है। इसके विपरीत, डिस्क स्थान एक सामान्यीकृत तालिका में अनुकूलित है।
निष्कर्ष
स्थिति के अनुसार सामान्यीकरण और विकृतीकरण उपयोगी है। सामान्य सम्मिलन का उपयोग तब किया जाता है जब तेज सम्मिलन, विलोपन और अद्यतन विसंगतियाँ, और डेटा संगति आवश्यक हो। दूसरी ओर, डीनेमलाइज़ेशन का उपयोग तब किया जाता है जब तेज़ खोज अधिक महत्वपूर्ण होती है और रीड प्रदर्शन को अनुकूलित करने के लिए। यह अति-सामान्यीकृत डेटा या जटिल टेबल जॉइन द्वारा बनाए गए ओवरहेड्स को भी कम करता है।