بُعد تطبیق داده (Conformed Dimension)
در انبار داده یک Conformed Dimension برای هر fact ای که به آن مربوط است تنها یک معنی دارد. Conformed Dimension ها این امکان را فراهم می کنند که fact ها و Measure ها را به یک شکل در چندین fact یا حتی data mart دسته بندی و توصیف کنیم تا سیستم گزارش گیری یکدست و سازگاری را داشته باشیم.
یک Conformed Dimension می تواند به دو صورت وجود داشته باشد:
- یک جدول بعد که به چند fact table در یک انبار داده ارتباط دارد
- جدول بُعدهای یکسان در دیتامارتهای مجزا
برای این که دو جدول بُعد به صورت Conformed Dimension در نظر گرفته شود باید یکسان باشند یا یکی زیرمجموعه دیگری باشد. در این صورت نباید هیچ نوع تفاوت دیگری بین دو جدول باشد. برای مثال دو جدول بعد که به جز کلید اصلی دقیقا مانند هم هستند به عنوان Conformed Dimension در نظر گرفته نمی شوند
اهمیت Conformed Dimension در انبار داده چیست؟
علت اهمیت Conformed Dimension به تعریف انبار داده و یکپارچه بودن انبار داده آن برمی گردد. به این معنی که حتی اگر یک موجودیت خاص معنا و صفتهای (attribute) متفاوت در سیستم های عملیاتی (منبع) دارند وقتی که داده ها به انبار داده می رسند باید فقط یک ورژن از این موجودیت در انبار داده وجود داشته باشد.
بُعد زمان یک Conformed Dimension رایج در انبار داده یک سازمان است به این دلیل که صفتهای خاصه آن (attribute) یعنی روز، هفته، ماه، فصل و سال در پیوند با هر fact table فقط و فقط یک معنا دارند. معمولا تنها قواعدی که درباره بُعد زمان باید در نظر گرفته شود این است که علاوه بر سال تقویمی، سال مالی جداگانه برای سازمان در نظر گرفته می شود و تعریف هفته به چه شکلی انجام می شود. خوشبختانه راه حل در نظر گرفتن این قواعد بسیاز ساده است. در مورد سال مالی یک راه این است که تنها از یک سال مالی یا تقویمی استفاده کنیم یا دو Conformed Dimension مجزا در نظر بگیریم.
تعریف هفته در سازمانهای بزرگ معمولا متفاوت است، مثلا واحد مالی هفته را از شنبه تا جمعه در نظر می گیرد ولی واحد بازاریابی، یکشنبه تا شنبه را هفته در نظر می گیرد. در این مورد باید روی یک مورد توافق کنیم و از آن استفاده کنیم. حسن بعد زمان این است که وقتی این قواعد تعیین شد مقادیر در جدول بُعد هرگز تغییر نخواهند کرد برای مثال ۱۶ مهر هرگز به ۱۵ مهر تبدیل نمی شود.
ولی همه Conformed Dimension ها در انبار داده ، مانند بُعد زمان به راحتی ایجاد نمی شوند. یک مثال از این سناریو، بُعد مشتری است. در یک سازمان سابقه دار، به احتمال زیاد پایگاه های داده متفاوتی در بخش های مختلف سازمان وجود دارد. برای دستیابی Conformed Dimension باید این اطلاعات پراکنده با یکدیگر مقایسه شده، قواعد تعیین و داده ها پاکسازی شوند. علاوه براین در بارگذاری های بعدی باید از همین قواعد استفاده کنیم تا مطمئن باشیم که مشتریان جدید را مطابق با تعریف مشتریان قبلی اضافه کرده ایم.
ایجاد Conformed Dimension بخشی از فرآیند Master Data Management است. در MDM یا مدیریت داده های مرجع نه تنها باید مطمئن باشیم که بُعدهای داده های مرجع در انبار داده به صورت Conformed Dimension هستند بلکه این تطابق باید با سیستمهای عملیاتی هم وجود داشته باشد.