طراحی و مدلسازی داده
مدلسازی دادهها فرآیندی برای تشخیص، کشف، تجزیه و تحلیل و اندازهگیری الزامات داده، و سپس بازنمایی و برقراری ارتباط این نیازهای دادهای به شکلی دقیق به نام مدل داده است. مدلسازی دادهها را میتوان یکی از مؤلفههای مهم مدیریت داده دانست. در فرایند مدلسازی لازم است تا سازمانها چگونگی قرار گرفتن دادههایشان را مشخص، کشف و مستند کنند.
مدلسازی دادهها را میتوان یکی از مؤلفههای مهم مدیریت داده دانست.
داده را میتوان از طریق شماهای مختلفی نمایش داد. به همین منظور میتوان از شش طرح متداول رابطهای، چند بعدی، شیگرا، مبتنی بر واقعیت، مبتنی بر زمان و NoSQL استفاده کرد. مدل هر یک از طرحهای اشاره شده را میتوان با در نظر گرفتن سطح جزئیات به صورت زیر تعریف کرد:
- مفهومی: یک مدل دادهای مفهومی، نیازهای سطح بالای داده را به عنوان مجموعهای از مفاهیم مرتبط ضبط میکند و شامل مواردی نظیر موجودیتهای مهم به همراه روابط بین آنها میباشد. در مدل داده مفهومی ویژگیها و کلید اصلی مشخص نمیگردند.
- منطقی: جزئیات نیازمندی داده را در محدوده مدل مفهومی فراهم میکند. در این مدل سعی میگردد تا حد امکان داده با جزئیات بیشتر و بدون توجه به شیوه پیادهسازی فیزیکی در بانک اطلاعاتی تعریف گردد. تحلیل نیازمندیهای اطلاعاتی که شامل سازماندهی، مستندسازی، تایید و کنترل تغییرات نیازمندیهای کسب و کار میباشد، در این مرحله انجام میگردد.
- فیزیکی: مدل منطقی داده برای اینکه بتواند اجرا شود به مدل فیزیکی نیاز دارد. یک مدل داده فیزیکی نشاندهنده یک راهحل دقیق فنی است. در این مدل، نحوه ایجاد مدل در بانک اطلاعاتی رابطهای و یا غیر رابطهای تعریف میشود. ساختار تمامی جداول که شامل اسامی ستونها، نوع داده هر ستون، محدودیتهای ستونها، رکورد و جدول و ارتباط بین جداول است، در این مرحله تعیین میگردد.
هر مدل شامل مجموعهای از مؤلفهها نظیر موارد زیر است:
- موجودیتها: خارج از مدلسازی دادهها، یک موجودیت چیزی است که یک سازمان در خصوص آن اطلاعاتی را جمعآوری میکند. موجودیتها میتوانند در پاسخ به سوالاتی نظیر چه کسی، چه چیزی، کجا، چه زمانی، چرا، چگونه و یا ترکیبی از پرسشهای فوق شناسایی شوند.
- روابط: بیانگر انواع ارتباط بین موجودیتها است.
- ویژگیها: هر نوع موجودیت دارای مجموعهای از صفات مشخصی است که یک موجودیت را شناسایی، اندازهگیری و توصیف مینماید.
- دامنهها: مشخص کننده مجموعهای از مقادیر ممکن است که بتوان به یک ویژگی نسبت داد.
پس از ایجاد مدل، بررسی نهایی و تایید، میتوان درگیر پیادهسازی و مسائل مربوط به نگهداری شد.
فرایندها و روشها
فرایند مدلسازی داده، شامل مراحل طراحی، ساخت مدلهای مفهومی، منطقی، فیزیکی و همچنین بررسی و نگهداری مدلهای داده است.
طراحی:
طراحی مدلسازی داده شامل وظایفی مانند ارزیابی نیازهای سازمانی، ایجاد استانداردها و تعیین ذخیرهسازی مدل داده است. محصولات قابل ارائه فرایند مدلسازی دادهها شامل موارد زیر است:
- نمودار: یک مدل داده شامل یک یا چندین نمودار است. نمودار، تصویری از نیازها را به صورت دقیق ثبت میکند که یک سطح از جزئیات (به عنوان مثال، مفهومی، منطقی یا فیزیکی)، یک طرح (رابطهای، ابعادی، شیگرا، مبتنی بر واقعیت، زمان محور یا NoSQL) و یک علامت گذاری در آن طرح را نشان میدهد (به عنوان مثال، اطلاعات مهندسی، زبان مدلسازی یکپارچه، مدلسازی object-oriented).
- تعاریف: تعاریف موجودیتها، ویژگیها و روابط برای حفظ دقت در یک مدل داده ضروری است.
- مسائل و سوالات برجسته: غالبا فرایند مدلسازی داده، سوالات و مسائلی را به وجود میآورد که ممکن است در هر مرحله به آنها پرداخته نشود. بعلاوه، غالباً افراد یا گروههایی که مسئول حل این مسائل یا پاسخگویی به این سوالات هستند، در خارج از گروه سازنده مدل داده مستقر هستند؛ بنابراین، اغلب سندی تحویل داده میشود که شامل مجموعه موضوعات فعلی و سوالات برجسته است.
- Lineage: برای مدلهای فیزیکی و گاهاً منطقی، شناخت داده و منبع تولید آن حائز اهمیت است چرا که مدلساز داده از طریق آن، درک بسیار خوبی از نیازهای داده به دست میآورد. بنابراین مدلساز داده به کمک Lineage در بهترین موقعیت برای تعیین ویژگیهای منبع قرار میگیرد. تعیین دقیق ویژگیهای منبع به کمک Lineage میتواند ابزاری مؤثر برای تأیید صحت آن باشد. به کمک Lineage میتوان مؤلفه مدلسازی داده را از مفهومی تا منطقی به فیزیکی ردیابی کرد.
ساخت مدل:
مدلسازان برای ساخت مدل مورد نظر خود اغلب به تجزیه و تحلیل و کار مدلساز قبلی اعتماد میکنند و ممکن است مدلها و پایگاههای داده موجود را مطالعه و به استانداردهای منتشر شده مراجعه کنند و هر گونه نیاز به داده را در آن بگنجانند. پس از مطالعه این ورودیها، آنها شروع به ساخت مدل میکنند. مدلسازی یک فرایند بسیار تکراری است. مدلسازان این مدل را تهیه میکنند و سپس برای شفافسازی شرایط و قوانین کسب و کار به متخصصان تجارت و تحلیلگران تجارت باز میگردند. سپس آنها مدل را بهروز میکنند و سوالات بیشتری میپرسند.
ساخت مدل داده به دو صورت مهندسی رو به جلو و مهندسی معکوس انجام میگردد.
در مهندسی رو به جلو، ابتدا مدل دادهای مفهومی برای درک دامنه کار، اصطلاحات اصلی در این حوزه و تصمیمگیری در ارتباط با استفاده از شش طرح متداول (مدل رابطهای، ابعادی، NoSQL و…) تکمیل میگردد. سپس مدل دادهای منطقی برای مستند کردن راهحل کسب و کار و به دنبال آن مدل دادهای فیزیکی برای مستند کردن و درک راهحلهای فنی تکمیل میشود.
در مهندسی معکوس، مستندسازی یک پایگاه داده موجود است. ابتدا مدل دادهای فیزیکی برای درک طراحی فنی یک سیستم موجود تکمیل میشود، سپس یک مدل دادهای منطقی برای مستند کردن راهحل تجاری سیستم موجود و به دنبال آن مدل دادهای مفهومی برای مستند کردن دامنه و اصطلاحات کلیدی در سیستم موجود تکمیل میشود.
نقشها
طراح مدل داده
طراح مدل داده مسئول طراحی مدلهای دادهای در سطوح مختلف با توجه به معماری داده و سایر دستورالعملها است و قواعد مدیریت داده را به عهده دارد.
کارشناس مدل داده
این نقش وظیفه ذخیرهسازی، کنترل، نگهداری و مدیریت مدلهای داده را در سطوح مختلف به عهده دارد.
فناوری
انواع مختلفی از ابزارها وجود دارند که به مدلسازان داده برای انجام کار خود کمک میکنند. نمونهای از این ابزارها شامل موارد زیر است:
- ابزارهای مدلسازی داده: نرمافزارهایی هستند که بسیاری از کارهایی را که مدلساز داده انجام میدهد را خودکار میکنند.
- ابزار Lineage: نرمافزاری است که امکان ضبط و نگهداری ساختارهای منبع را برای هر ویژگی در مدل داده فراهم میکند.
- ابزار نمایهساز داده: میتواند به کشف محتوای داده، تأیید اعتبار آن در برابر فراداده موجود و شناسایی شکافها و کمبودهای کیفیت داده کمک کند.
- مخزن فراداده: ابزاری نرمافزاری است که اطلاعات توصیفی مربوط به مدل داده از جمله نمودار و متن همراه آن مانند تعاریف را به همراه فراداده وارد شده از ابزارها و فرایندهای دیگر، ذخیره میکند.
- الگوهای مدل داده: ساختارهای مدلسازی قابل استفاده مجدد هستند که میتوانند در دسته وسیعی از موقعیتها به کار روند. این الگوها شامل الگوهای ابتدایی، مونتاژ و یکپارچهسازی داده است.
- مدلهای داده صنعتی: مدلهای دادهای هستند که برای کل یک صنعت از قبل ساخته شدهاند.