Data Mart چیست؟
بخشي از اطلاعات موجود در DWH در Data Martنگهداري مي شود. اين اطلاعات بر حسب نياز گروههايي که در بخشIT سازمان فعاليت مي کنند انتخاب و استخراج مي شوند. در حالت کلي، اطلاعات مذکور از منابع اطلاعاتي مختلف موجود در سطح سازمان قابل تهيه هستند. معمولا اطلاعات موجود درData Mart از يک DWHاستخراج مي شود. در مجموع ميتوان گفت در يک Data Mart ايجاد شده براي يک گروه knowledge worker، اطلاعاتي وجود دارد که گروه مذکور، از لحاظ تحليلي و محتوايي به آن نياز دارند و اين اطلاعات را ميتوان به فرمت مناسب براي گروه مذکور نمايش داد.Data mart ها به سه صورت وابسته، منطقي و Operational Data Store (ODS)وجود دارند.
Data Mart وابسته: يک پايگاه داده فيزيکي است که ممکن است سخت افزار آن از سخت افزار DWH مجزا باشد و شامل زيرمجموعه هاي کوچکي از اطلاعات مي شود.
ODS: يک پايگاه داده يکپارچه از داده هاي عملياتي سازمان هستند که معمولا اطلاعات باارزش يک دوره 30 يا 60 روزه را در بر دارند و براي گزارش گيري هاي مربوط به زمان حال که قابل دستيابي از DWH نيستند، مورد استفاده قرار مي گيرند.
Data mart منطقي: به صورت فيزيکي وجود ندارد بلکه يک view فيلتر شده از DWHاست. اين نوعData Martنيازي به حافظه اضافي ندارد و داده ها هميشه بروز هستند. البته در اين نوع Data Mart زمان پاسخ دهي سيستم بيشتر خواهد بود.
لازم به ذکر است از Data Martها به صورت جداول ايندکس هم استفاده ميشود به اين صورت که به جاي آنکه اطلاعات سيستم در يک پايگاه اطلاعاتي مرکزي تکرار شود، اطلاعات سازمان تنها در منابع اطلاعاتي اوليه ذخيره مي شوند و ايندکس هايي از اطلاعات ايجاد مي شوند. در اين ايندکس ها (که همان Data Martها هستند)، مشخص شده است که هر منبع اطلاعاتي شامل چه اطلاعاتي است و چگونه مي توان اطلاعات مورد نظر را از آن استخراج کرد. به اين روش، روش quick and dirty گفته مي شود. زيرا در اين روش Data Mart ها را ميتوان به سرعت ايجاد کرد و از طرفي اطلاعات مانند روش قبل پاکسازي نمي شوند.
يک Data warehouse براي جمع آوري تمامي اطلاعات در مورد موضوعات (subjects) مختلف مانند مشتري ها، محصولات، فروش، منابع، پرسونل و… ايجاد مي شود. اين اطلاعات در حوزه کل سازمان قرار دارد. وليData Martها اطلاعات زير مجموعه هاي سازماني را که روي يک موضوع خاص متمرکز است، در بر دارند.
براي ايجاد بستر داده اي براي BIبه دو روش مي توان عمل کرد:
1- بالا به پايين (top-down): گه در اين روش يک DWH يکپارچه و يا يک ODS براي کل يک سازمان ايجاد مي شود. اين پايگاه داده بزرگ تمامي اطلاعات و داده هاي عملياتي سازمان را در بر دارد. ايجاد، پياده سازي و استفاده از اين نوع پايگاه داده بسيار گران، هزينه بر و سخت است.
2- پايين به بالا (down-top): در اين روش داده هاي مرتبط با هم در يک data mart قرار مي گيرند و چندين data mart در نقاط مختلف سازمان ايجاد شده و در راستاي همديگر يک DWH براي سازمان ايجاد مي کنند.
براي ايجاد بستر داده اي يک سازمان روش اول بسيار سخت و هزينه بر است و در بسياري از کاربرد ها غير ممکن به نظر مي رسد.
با توجه به اينکه بسياري از سازمان ها از قبل داراي منابع داده اي جدا هستند، استفاده از Data mart ها بسيار به صرفه به نظرمي آيد و عملا نيز بسياري از سازمان ها از اين روش در BI استفاده مي کنند. يکي از نقاط ضعف اين روش اين است که داده ها و اطلاعات مربوط به يک فعاليت در سازمان ممکن است در چندين data mart نگه داري شود که باعث ايجاد افزونگي در اطلاعات سازمان مي شود.
Data mart ها بنا به کاربرد و انتظاراتی که از لحاظ کارآیی از آنها دارند، طراحی و پیاه سازی می شوند. در کاربردهایی که نیاز است آخرین تغییرات داده های سازمان در Data mart وجود داشته باشد نمی توان از Data mart های وابسته استفاده کرد و بهتر است در صورت کوچک بودن حجم پردازش مربوط به query از Data mart منطقی استفاده شود. در صورتی که حجم پردازش بالا باشد و نتوان آن را در زمان مناسبی از DWH استخراج کرد بهتر است بنا به مقدار هزینه ای که برای استقرار در نظر گرفته شده است، از Data mart های وابسته و یا ODS ها استفاده شود.
با توجه به تقسیم بندی application های هوش تجاری در سطوح مختلف سازمانی (استراتژیک، تاکتیکی و عملیاتی) میتوان گفت data mart هایی که خاص منظور هستند، بیشتر ما بین سطوح عملیاتی و تاکتیکی کاربرد دارند. این data mart های اطلاعات ورودی خود را از سیستم های عملیاتی گرفته و با استفاده از ابزارهای هوشمند در سطوح میانی مدیریت که مربوط به مدیریت تاکتیکی می شود کاربرد دارند.
برای استفاده در سطوح استراتژیک که در سطوح بالای مدیریتی انجام می شود و در دفعات کم معمولا با انبوه اطلاعات enterprise wide سر و کار دارد، می توان از خود DWH و یا data mart های خاص استفاده کرد.
همچنین می توان از ترکیبی از روش های فوق برای پیاده سازی data mart های خاص استفاده کرد. برای مثال می توان از قسمتی از داده های یک Data mart وابسته را با استفاده از تکنیک data mart منطقی از بخش دیگری از یک Data mart دیگر تهیه کرد.