Table of Contents
डेटा वेयरहाउसिंग अर्थ को किसी संगठन या व्यवसाय द्वारा इलेक्ट्रॉनिक रूप से बड़ी मात्रा में डेटा संग्रहीत करने की प्रक्रिया के रूप में परिभाषित किया जा सकता है। डेटा वेयरहाउसिंग बीआई (बिजनेस इंटेलिजेंस) का एक महत्वपूर्ण घटक है जो प्रासंगिक व्यावसायिक डेटा पर उन्नत विश्लेषणात्मक तकनीकों को नियोजित करने के लिए जाना जाता है।
डेटा वेयरहाउसिंग अवधारणा 1988 के दौरान आईबीएम के शोधकर्ताओं द्वारा पेश की गई थी - पॉल मर्फी और बैरी डेवलिन। वेयरहाउसिंग, डेटा का महत्व तब सामने आया जब कंप्यूटर सिस्टम दैनिक डेटा की बढ़ती मात्रा को संभालने के दौरान अधिक जटिल होने लगेआधार.
डेटा वेयरहाउसिंग विभिन्न विषम स्रोतों से समेकित डेटा की तुलना सुनिश्चित करके कंपनी के प्रदर्शन में गहराई से अंतर्दृष्टि प्रदान करने के लिए जाना जाता है। एक विशिष्ट डेटा वेयरहाउस को कई लेनदेन स्रोतों से प्राप्त ऐतिहासिक डेटा पर चल रहे प्रश्नों और उचित विश्लेषण के लिए डिज़ाइन किया गया है।
एक बार जब आप वेयरहाउस में डेटा शामिल कर लेते हैं, तो यह बदलने के लिए नहीं जाना जाता है। इसके अलावा, डेटा को भी बदला नहीं जा सकता है। ऐसा इसलिए है क्योंकि एक डेटा वेयरहाउस पहले से हो चुकी घटनाओं पर विश्लेषण चलाने के लिए जाना जाता है। यह समय के साथ डेटा में संशोधनों पर ध्यान केंद्रित करके हासिल किया जाता है। डेटा जिसे वेयरहाउस किया जाता है, उसे इस तरह से संग्रहीत किए जाने की उम्मीद है जो सुरक्षित, पुनर्प्राप्त करने में आसान, विश्वसनीय और प्रबंधन में आसान हो।
डेटा वेयरहाउस बनाने की दिशा में कई चरण शामिल हैं। पहले चरण को डेटा निष्कर्षण के रूप में जाना जाता है। दिए गए कदम को विभिन्न स्रोत बिंदुओं से भारी मात्रा में डेटा एकत्र करने के लिए जाना जाता है। एक बार डेटा संकलित हो जाने के बाद, यह डेटा सफाई की प्रक्रिया से गुजरने के लिए जाना जाता है। यह त्रुटियों की पहचान करने और पाई जाने वाली किसी भी त्रुटि को बाहर करने या सुधारने के लिए दिए गए डेटा को मिलाने की प्रक्रिया है।
साफ किया गया डेटा तब डेटाबेस प्रारूप से संबंधित वेयरहाउस प्रारूप में परिवर्तित हो जाता है। एक बार इसे वेयरहाउस में स्टोर करने के बाद, डेटा को सॉर्टिंग, सारांशीकरण, समेकन, और बहुत कुछ की प्रक्रिया से गुजरने के लिए जाना जाता है। यह सुनिश्चित करने के लिए भी किया जाता है कि मौजूदा डेटा समन्वित और उपयोग में आसान हो। समय के साथ, दिए गए वेयरहाउस में अधिक डेटा जुड़ जाता है क्योंकि कई डेटा स्रोत अपडेट हो जाते हैं।
अधिकांश डेटाबेस प्रबंधन के साथ डेटा वेयरहाउसिंग को भ्रमित करते हैं। हालाँकि, यह समझना महत्वपूर्ण है कि डेटा वेयरहाउसिंग डेटाबेस को बनाए रखने की अवधारणा के समान नहीं है। एक डेटाबेस नवीनतम डेटा तक पहुंच प्रदान करने के लिए रीयल-टाइम डेटा की निगरानी और अद्यतन करने के लिए एक लेनदेन प्रणाली के रूप में कार्य करता है। दूसरी ओर, एक डेटा वेयरहाउस एक विस्तारित अवधि में संरचित डेटा को एकत्रित करने के लिए प्रोग्राम किया जाता है।
Talk to our investment specialist
उदाहरण के लिए, एक डेटाबेस में केवल कुछ उपभोक्ता का सबसे हाल का पता हो सकता है। दूसरी ओर, डेटा वेयरहाउस उन सभी पतों को प्रदर्शित करने के लिए जाना जाता है, जिन पर उपभोक्ता पिछले कई वर्षों से रहा होगा।