در سالهای اخیر، دادهها به عنوان یکی از باارزشترین داراییهای سازمانها و افراد فعال در حوزه کسب و کار در نظر گرفته میشوند و حوزههای مختلفی نظیر دیتا ساینس، مهندسی داده، تحلیل داده و هوش تجاری به منظور استخراج اطلاعات ارزشمند از دادهها شکل گرفتهاند. با گسترش اینترنت و تولید روزانه حجم عظیمی از دادهها در فضای مجازی، مدیریت دادهها و نگهداری و پردازش آنها چالشبرانگیز است و باید از فناوریها و روشهای جدیدی برای کار با دادهها استفاده کرد. «انبار داده» (Data Warehouse) یک سیستم مدیریت داده است که از آن برای نگهداری دادههای قدیمی و جدید استفاده میشود و با ابزارها و امکاناتی که ارائه میدهد، کاربران میتوانند بهراحتی از آن برای مدیریت دسترسی به داده و انجام عملیات مختلف استفاده کنند. در این مطلب از مجله فرادرس، به این موضوع میپردازیم که انبار داده چیست و چگونه میتوان از آن استفاده کرد.

در ابتدای این مطلب به مفهوم انبار داده میپردازیم و تاریخچه آن را شرح میدهیم. سپس، به تفاوت انبار داده با مفاهیم مرتبط آن نظیر «دریاچه داده» (Data Lake) و «پایگاه داده» (Database) اشاره خواهیم کرد. همچنین، ویژگیها، کاربردها و مزایا و معایب انبار داده را توضیح میدهیم و به اجزای تشکیل دهنده انبار داده و انواع معماریهای آن میپردازیم.
انبار داده چیست ؟
انبار داده، سیستم مدیریت داده است که از آن برای ذخیرهسازی اطلاعات فعلی و قدیمی سازمان استفاده میشود. دادههای انبار داده از منابع مختلفی نظیر جداول اکسل، فایلهای متنی مثل ورد یا txt، پایگاه دادههای رابطهای و مواردی از این قبیل به دست میآیند.
از دادههای موجود در انبار داده برای فعالیتهای هوش تجاری استفاده میشود. به عبارتی، از این سیستم مدیریت داده میتوان به منظور تجزیه و تحلیل دادهها و تهیه گزارش از آنها استفاده کرد تا مدیران با بررسی نتایج حاصل شده بتوانند در راستای پیشرفت سازمان تصمیم بگیرند.
تاریخچه انبار داده
بعد از ظهور کامپیوترها، به منظور استفاده مجدد از یک سری دادهها، ایده ذخیرهسازی آنها در ذهن انسان شکل گرفت و بدین منظور برای نخستین بار «کارتهای پانچ» (Punch Cards) در دهه ۱۹۵۰ طراحی شدند که میتوانستند دادههای کامپیوتری را نگهداری کنند. از این کارتها در سازمانهای دولتی و کسب و کارها استفاده میشدند و نقطه ضعف اصلی آنها این بود که با تا شدن یا مخدوش شدن، کلیه اطلاعاتشان از بین میرفت. از کارتهای پانج تا اواسط دهه ۱۹۸۰ بهطور رایج استفاده میشد و هنوز هم این کارتها برای ثبت آرا و نتایج آزمون کاربرد دارند.

در دهه ۱۹۶۰ ابزارهای مغناطیسی نظیر هارد درایو و فلاپی به عنوان جایگزینی برای کارتهای پانج طراحی شدند و در سال ۱۹۶۴ استفاده از آنها در بین مردم رایج شد. بلافاصله پس از ارائه ابزارهای مغناطیسی، در سال ۱۹۶۶ نرمافزارهایی با نام «سیستمهای مدیریت پایگاه داده» (Database Management Systems | DBMS) طراحی شدند که از آنها برای مدیریت اطلاعات ذخیره شده بر روی دیسک نظیر حذف دادهها، پیدا کردن موقعیت ذخیرهسازی دادهها، جستجوی دادهها، درج داده جدید و تغییر دادههای ذخیره شده استفاده میشد.
در اواخر دهه ۱۹۶۰ و اوایل دهه ۱۹۷۰، استفاده از برنامههای آنلاین تجاری رایج شد که میتوانستند پردازشهای آنلاین بر روی دادهها انجام دهند. در این نوع پردازشها نظیر پردازشهای متصدی امور بانکی، پردازشهای رزرو خطوط هوایی، پردازشهای کنترل خطوط تولید و پردازشهای دستگاه خودپرداز بانک، دادهها مستقیماً قابل دسترس بودند. در دهه ۱۹۸۰ استفاده از پایگاه دادههای رابطهای مرسوم شدند و سیستمهای مدیریت پایگاه داده رابطهای از زبان SQL برای انجام پردازشها بر روی دادهها پشتیبانی میکردند. در اواخر دهه ۱۹۸۰ بسیاری از کسب و کارها کامپیوترهای مینفرم را کنار گذاشتند و از کامپیوترهای شخصی و برنامههای آفیس مانند Word ،Excel و Access برای پیشبرد کارهای خود استفاده کردند.
در سال ۲۰۰۰ بسیاری از کسب و کارها به این نتیجه رسیدند که با توسعه پایگاه دادهها، سیستمهای کاربردی و افزایش میزان دادهها برنامهها، دادههای ناسازگار در بانکهای اطلاعاتی ثبت میشوند. به همین دلیل، مفهوم انبار داده در این دوران شکل گرفت تا سازمانها بتوانند دادههای خود را از منابع اطلاعاتی مختلف در یک محیط به صورت یکپارچه ذخیره کنند. در بخش بعدی این مطلب، قصد داریم به تفاوت انبار داده و پایگاه داده و دریاچه داده بپردازیم اما پیش از آن باید دو مفهوم OLAP و OLTP را شرح دهیم تا به درک تفاوتهای انبار داده با دیگر منابع ذخیره داده کمک کند.
OLAP و OLTP
در مباحث مرتبط با پایگاه داده و انبار داده از دو مفهوم «پردازش تحلیلی آنلاین» (Online Analytical Processing | OLAP) و «پردازش تراکنشی آنلاین» (Online Transaction Processing | OLTP) استفاده میشوند که هر یک از آنها هدفی مجزا دارند.
از سیستم OLAP برای تحلیل دادههای حجیم با ابعاد بالا در زمان کم استفاده میشود. در انبار داده از OLAP میتوان برای تحلیل و درک دادهها، پیشبینی مقادیر، دادهکاوی، محاسبات تحلیلی پیچیده و تحلیلهای مالی بهره گرفت. به عنوان مثال، یک سازمان میتواند با استفاده از سیستم پردازش OLAP انبار داده میزان فروش محصولات خود را در دو بازه زمانی در دو شهر با یکدیگر مقایسه کند.
از سیستم پردازشی OLTP برای پردازشهای تراکنشی بلادرنگ توسط چندین کاربر استفاده میشود. سیستم خودپرداز بانک نمونهای از سیستم پردازش OLTP است. فرض کنید یک زن و شوهر حساب بانکی مشترکی دارند و هر دو میخواهند از دو دستگاه خودپرداز بانک به طور همزمان از حساب پول برداشت کنند. OLTP چنین پردازشهای تراکنشی بلادرنگ را پشتیبانی میکند تا تغییرات لحظهای را ثبت کند.
فرق انبار داده با پایگاه داده
با این که انبار داده و پایگاه داده شباهتهایی دارند، اما نباید آنها را یکسان تلقی کرد. در ادامه، به مهمترین تفاوتهای اصلی انبار داده با پایگاه داده میپردازیم:
- پایگاه داده محیطی برای ذخیره کردن دادههای مرتبط به هم درباره یک موجودیت در دنیای واقعی است. انبار داده یک سیستم اطلاعاتی است که دادههای قدیمی و جدید را از منابع مختلف در خود ذخیره میکند.
- هدف پایگاه داده، ذخیره کردن دادهها است اما از انبار داده به منظور تحلیل دادهها استفاده میشود.
- پایگاه داده کاربرد-محور است در حالی که انبار دادهها موضوع-محور هستند.
- پایگاه داده از پردازش OLTP استفاده میکند اما نوع پردازش انبار داده، OLAP است.
تفاوت انبار داده و دریاچه داده
در مفاهیم مرتبط با انبار داده، مفهومی با عنوان «دریاچه داده» (Data Lake) نیز به چشم میخورد و گهگاه این دو اصطلاح به جای یکدیگر به اشتباه به کار برده میشوند. با این که هر دو این مفاهیم برای ذخیرهسازی دادهها کاربرد دارند، محتوای دادههای آنها و اهدافشان با یکدیگر متفاوت است.
دریاچه داده محیطی برای ذخیرهسازی حجم عظیمی از دادههای خام پردازش نشده و غیرساختاریافته است و با الگوریتم های یادگیری ماشین میتوان اطلاعات مهمی از آنها استخراج کرد.
بر خلاف دریاچه داده، انبار داده محیطی برای ذخیره کردن دادههای پردازش شده و ساختاریافته است و کاربران میتوانند با ملاحظه دادهها، به درک خوبی از آنها برسند.
انبار داده چطور کار می کند ؟
در ادامه پاسخ به پرسش انبار داده چیست ، میتوان به نحوه عملکرد آن نیز اشاره کرد. انبار داده به عنوان محل اصلی ذخیرهسازی دادههایی تلقی میشود که از منابع داده مختلف استخراج شدهاند. دادهها میتوانند «ساختاریافته» (Structured Data)، «غیرساختاریافته» (Unstructured Data) و «نیمه ساختاریافته» (Semi Structured Data) باشند.
به عنوان مثال، یک انبار دادهای را برای ذخیره اطلاعات مشتریان یک سازمان در نظر بگیرید که دادههای آن از سیستمهای فروش، لیست ایمیلها و سایت سازمان فراهم میشوند. دادهها باید پس از استخراج از این منابع، یکپارچهسازی شده و در انبار داده ثبت شوند.
به منظور استخراج اطلاعات از منابع مختلف و یکپارچهسازی و ذخیره کردن آنها در انبار داده، از فرآیندهای «استخراج، تبدیل، بارگذاری» (Extract, Transform, Load | ETL) یا «استخراج، بارگذاری، تبدیل» (Extract, Load, Transform | ELT) استفاده میشوند. مهندسان داده معمولاً از روش ETL برای ثبت دادهها در انبار داده استفاده میکنند. در این روش، دادهها پس از استخراج دادهها از منابع مختلف، پاکسازی میشوند و در قالبی متناسب با انبار داده درمیآیند.
انواع طرحواره در انبار داده
طرحواره یا «شِما» (Schema) روشی برای سازماندهی ماهیتهای پایگاه دادهها نظیر «جداول بعد» (Dimension Tables) و «جداول حقایق» (Fact Tables) است. سه نوع طرحواره در انبار داده وجود دارد:
- «شمای ستارهای» (Star Schema)
- «شمای برف ریزه» (Snowflake Schema)
- «شمای صورت فلکی حقایق» (Fact Constellation Schema)
در ادامه، به توضیح هر یک از شماهای انبار داده میپردازیم.
شمای ستاره ای در انبار داده چیست ؟
شمای ستارهای یکی از روشهای مدلسازی داده در انبار داده است که از آن برای نمایش دادههای ساختاریافته استفاده میشود. در شمای ستارهای یک «جدول حقایق» (Fact Table) و چندین «جدول بعد» (Dimension Tables) داریم که جدول حقایق با استفاده از دادههای جداول بعد ساخته میشوند.
هر جدول بعد با جدول حقایق از طریق «کلید خارجی» (Foreign Key) ارتباط دارد. با استفاده از این کلید میتوان با استفاده از مشخصههای (مقادیر ستونهای) جدول بعد در جدول حقایق جستجو کرد.

شمای برف ریزه در Data Warehouse
شمای برف ریزه شکل دیگری از شمای ستارهای است. در این شما یک جدول حقایق وجود دارد که به چندین جدول بعد متصل است. هر یک از این جداول بعد نیز به جداول دیگری متصل هستند که از دادههای آنها در جدول حقایق استفاده میشود. به عبارتی، شمای برف ریزه، یک ساختار سلسلهمراتبی از اتصالات جدول حقایق و جداول بعد ایجاد میکند.

شمای صورت فلکی حقایق در Data Warehouse
شمای صورت فلکی حقایق یا «شمای کهکشانی» (Galaxy Schema) یکی دیگر از روشهای مدلسازی داده است. در این شما، چندین جدول حقایق وجود دارد که به یک سری جدول بعد متصل هستند. برخی از جداول بعد به تمامی جداول حقایق متصل میشوند.

انواع انبار داده
در ادامه پاسخ به پرسش انبار داده چیست ، میتوان به انواع آن نیز اشاره کرد:
- «انبار داده سازمانی» (Enterprise Data Warehouse | EDW)
- «مخزن داده عملیاتی» (Operational Data Store | ODS)
- «بازار داده» (Data Mart)
در ادامه، به توضیح هر یک از موارد ذکر شده در فهرست بالا میپردازیم.
انبار داده سازمانی چیست؟
انبار داده سازمانی ترکیبی از دادههای بخشهای عملیاتی سازمان است و کلیه دادهها از منابع مختلف را در خود به شکل سازماندهی شده نگهداری میکند. به این انبار داده میتوان از هر بخش سازمان دسترسی داشت و عملیات مختلفی نظیر استخراج اطلاعات و تحلیل دادهها را بر روی آن انجام داد. دادهها در این انبار داده بر اساس موضوعات مختلف ذخیره میشوند. هدف از طراحی و ساخت چنین انبار دادهای، فراهم کردن یک دید کلی از هر شی خاص در مدل دادهای است. افراد تیم میتوانند با استفاده از تحلیلهایی که بر روی دادههای این انبار داده انجام میدهند، الگوهایی را شناسایی کنند که در پیشرفت سازمان نقش بهسزایی دارند.
مخزن داده عملیاتی
مخزن داده عملیاتی به شما این امکان را میدهد تا به شکل مستقیم به دادههای پایگاه داده برای پردازشهای تراکنشی دسترسی داشته باشید. دادههای این مخزن داده از چندین منبع مختلف تهیه میشوند.
مخزن داده عملیاتی در عملیات یکپارچهسازی دادهها برای تحلیل آنها و تهیه گزارش از آنها نقش مهمی را ایفا میکند. همچنین، از این مخزن داده برای کوئری نویسی و استخراج اطلاعات استفاده میشود و نقش آن یک حافظه موقت برای ذخیرهسازی اطلاعات اخیر است.
بازار داده چیست؟
بازار داده محلی برای ذخیره بخشی از دادههای انبار داده است. با استفاده از بازار داده، زمان تحلیل داده و گزارشگیری کاهش پیدا میکند زیرا دادههای ذخیره شده در آن، شامل بخشی از دادههای انبار داده بزرگ هستند. پیادهسازی بازار داده به لحاظ هزینه مقرون به صرفه است و میتواند شامل تنها یک موضوع باشد.
اجزای انبار داده
انبار داده از ۴ بخش اصلی تشکیل شده است که در ادامه به آنها میپردازیم:
- «مدیر بارگذاری» (Load Manager): این بخش از انبار داده مسئول استخراج دادهها و بارگذاری آنها درون انبار داده است.
- «مدیر انبار داده» (Warehouse Manager): این بخش مدیریت دادههای ذخیره شده در انبار داده را بر عهده دارد. با استفاده از این بخش میتوان عملیاتی نظیر تحلیل داده، ساخت «شاخصها» (Indexes) و «نماها» (Views)، تغییرات دادهها و ادغام دادههای منابع مختلف و تهیه پشتیبان از دادهها را انجام داد.
- «مدیر کوئری» (Query Manager): این بخش مسئول اجرای تمام عملیات مربوط به کوئری کاربر است.
- «ابزارهای دسترسی کاربر نهایی» (End-user Access Tools): این بخش، ابزارهای مختلفی را شامل میشود که کاربر نهایی میتواند از آنها برای انجام کارهای مختلف استفاده کند. این ابزارها عبارتاند از:
- ابزارهای گزارشگیری از دادهها
- ابزارهای کوئری نویسی
- ابزارهای توسعه برنامه
- ابزارهای EIS
- ابزارهای OLAP
- ابزارهای دادهکاوی

انواع معماری انبار داده
معماری انبار داده بر اساس نیاز سازمان تعیین میشود. سه نوع معماری اصلی برای انبار داده وجود دارد که عبارتاند از:
- معماری ساده انبار داده
- معماری انبار داده با «ناحیه عملیاتی» (Staging Area)
- معماری انبار داده با ناحیه عملیاتی و بازار داده
در ادامه، به توضیح هر یک از انواع معماری انبار داده میپردازیم.
معماری ساده انبار داده چیست ؟
در معماری ساده انبار داده، یک محیط مرکزی برای ذخیره دادههای خام، اطلاعات خلاصه شده از دادهها و «فراداده» (Metadata) نظیر نام درج کننده داده، تغییرات داده، اندازه فایل و مواردی از این قبیل وجود دارد. دادهها از سیستمهای عملیاتی یا فایلها و منابع دادهای دیگر در انبار داده ذخیره میشوند. کاربر نهایی نیز میتواند از ابزارهای دسترسی متنوعی برای ساخت گزارش، نوشتن کوئری، دادهکاوی و تحلیل دادهها استفاده کند.

معماری انبار داده با ناحیه عملیاتی
پیش از آن که دادههای خود را در انبار داده ذخیره کنید، باید آنها را پاکسازی و یکپارچهسازی کنید. کار پیش پردازش داده را میتوانید به هر طریقی انجام دهید. به عنوان مثال در این راستا میتوانید از زبانهای برنامه نویسی مختلفی استفاده کنید. همچنین، میتوانید از معماری انبار داده با ناحیه عملیاتی بهره بگیرید که محیطی را برای پیش پردازش داده در اختیار شما قرار میدهد.

معماری Data Warehouse با ناحیه عملیاتی و بازار داده
در معماری انبار داده با ناحیه عملیاتی، میتوان بازار داده نیز استفاده کرد تا کاربران نهایی بتوانند به راحتی درباره موضوعات مختلف نظیر فروش سازمان، خرید محصولات، اطلاعات محصولات گزارشگیری کنند. بازار داده عمل جستجو را راحتتر و سریعتر میکند زیرا حجم دادههای انبار داده زیاد هستند و جستجو اطلاعات در انبار داده زمانبر است. بازار دادهها بخشی از دادههای انبار داده را بر اساس موضوعات خاصی نظیر اطلاعات فروش، اطلاعات محصولات و اطلاعات مشتریان شامل میشوند و در زمان بسیار کمتری میتوان دادهها را تحلیل و از آنها گزارش تهیه کرد.

ویژگی های انبار داده
در پاسخ به پرسش انبار داده چیست باید به این نکته اشاره کرد که انبار دادهها دارای ۴ ویژگی مهم هستند که در هنگام طراحی باید آنها را مد نظر قرار دهیم. این ویژگیها عبارتاند از:
- ویژگی «موضوعگرا» (Subject-Oriented)
- ویژگی «یکپارچه بودن» (Integrated)
- ویژگی «متغیر با زمان» (Time-Variant)
- ویژگی «غیر فرار» (None-volatile)
در ادامه، به توضیح هر یک از ویژگیهای انبار داده میپردازیم.
ویژگی موضوع گرای انبار داده چیست ؟
انبار دادهها بر اساس موضوعات مختلف نظیر فروش، فهرست اموال و ترفیع کارمندان طراحی میشوند. به عنوان مثال، اگر قصد دارید دادههای فروش سازمان را تحلیل کنید، باید انبار دادهای را برای دادههای مرتبط با فروش محصولات ایجاد کنید. با استفاده از این انبار داده میتوانید به پرسشهای مهمی درباره فروش محصولات پاسخ دهید که در راستای سوددهی بیشتر و تصمیمات آتی سازمان به شما کمک خواهند کرد. به عنوان نمونه، میتوانید با اطلاعات انبار داده فروش مشخص کنید بهترین مشتری شما در سال گذشته چه کسی بوده است یا کدام مشتری بیشترین خرید را در سال آینده از شما خواهد کرد؟
ویژگی یکپارچه بودن Data Warehouse
انبار داده محیطی برای ذخیره کردن دادههای استخراج شده از منابع مختلف است اما پیش از ذخیره کردن دادهها در انبار داده، باید آنها را یکپارچه کرد تا در قالبی همسان در انبار داده ثبت شوند.
ویژگی متغیر زمان Data Warehouse
یکی از ویژگیهای مهم انبار داده، ویژگی زمان است. از آنجا که انبار داده به عنوان محلی برای ثبت دادههای قدیمی و جدید تلقی میشود، باید دادهها را با در نظر گرفتن ویژگی زمان در آن ذخیره کنیم. به عنوان مثال میتوان برای ذخیره کردن دادهها از یک ستون به عنوان «کلید اصلی» (Primary Key) استفاده کرد که مقدار آن، اطلاعات زمان (روز، ماه، سال یا روز، هفته، ماه) را نشان میدهد.
ویژگی غیرفرار بودن انبار داده چیست ؟
دادههایی که در انبار داده ذخیره میشوند، قابل تغییر نیستند و صرفاً میتوان آنها را بازخوانی کرد. همچنین، دادههای قبلی با درج دادههای جدید حذف نمیشوند. بنابراین، میتوان به طور خلاصه گفت دادههای انبار داده را نه میتوان تغییر داد و نه میتوان حذف کرد. این ویژگی به تحلیلگر داده کمک میکند تا دادهها را در گذر زمان با یکدیگر مقایسه کند.
چه کسانی از Data Warehouse استفاده می کنند؟
از انبار داده میتوان برای اهداف مختلف استفاده کرد. در ادامه به نیاز افرادی اشاره میکنیم که از انبار داده در پیشبرد کسب و کار خود استفاده میکنند:
- مدیران سازمانها و افراد فعال در حوزه کسب و کار با استفاده از اطلاعات ارزشمندی که تحلیل دادههای انبار داده به دست میآوردند، میتوانند در راستای پیشبرد اهداف خود از آن استفاده کنند.
- افرادی که با چندین پایگاه داده و منابع دادهای مختلف دیگر کار میکنند، میتوانند اطلاعات آنها را به صورت یکپارچهسازی شده در انبار داده ذخیره کنند و بر اساس دادههای آن، کارهای خود را پیش ببرند.
- از انبار داده میتوان به عنوان یک تکنولوژی ساده برای دسترسی به دادهها و مدیریت آنها استفاده کرد.
- افرادی که قصد دارند بر روی حجم عظیمی از داده پردازشهای مختلفی انجام دهند و گزارشات مختلفی از آنها تهیه کنند، میتوانند از انبار داده به خوبی بهره بگیرند.
- چنانچه قصد دارید الگوهای پنهان دادههای حجیم خود را استخراج کنید، استفاده از انبار داده میتواند اولین قدم برای شما باشد.
کاربردهای انبار داده چیست ؟
از انبار داده میتوان در حوزههای مختلف با اهداف متفاوت استفاده کرد. در ادامه، به برخی از کاربردهای انبار داده میپردازیم:
- خطوط هوایی: در سیستمهای خطوط هوایی از انبار داده به منظور بررسی ماموریتهای کارکنان، تحلیل مسیرهای هوایی و مواردی از این قبیل استفاده میشود.
- بانکداری: از انبار داده در امور بانکداری به منظور مدیریت دادهها و انجام تحلیلهای مختلف بر روی دادههای مالی و اطلاعات مشتریان استفاده میشود.
- مراکز پزشکی: از انبار داده در بیمارستانها و مراکز درمان به منظور گزارشگیری از روند درمان بیماران، به اشتراک گذاشتن اطلاعات بیماران با مراکز بیمه، اطلاعات مالی بیماران و مواردی از این قبیل استفاده میشود.
- بخش سرمایهگذاری و بازاریابی سازمانها: تجزیه و تحلیل دادههای انبار داده و استخراج الگوهای پنهان دادهها به سازمانها در حوزه بازاریابی و رسیدن به سوددهی بیشتر کمک بهسزایی میکند.
- زنجیره تامین: از انبار داده میتوان برای تحلیل فروش محصولات و حوزه بازاریابی استفاده کرد. شناسایی الگوی خرید مشتریان از روی دادههای ذخیره شده در انبار دادهها، کمک شایانی در فروش سازمانها و قیمتگذاری کالاها خواهد داشت.

مزایای انبار داده
در این بخش از مطلب حاضر از مجله فرادرس، به مهمترین مزایای استفاده از انبار داده در پیشبرد پروژههای سازمانی میپردازیم:
- از انبار داده برای ذخیرهسازی و مدیریت حجم عظیمی از داده استفاده میشود و با کمک آن میتوان کوئریهای سادهای را برای تحلیل داده و گزارشگیری نوشت.
- با یکپارچهسازی دادههای منابع مختلف داده و ذخیره کردن آنها در انبار داده میتوان به دادههای باکیفیتی دست یافت و گزارشهای دقیقتری از آنها تهیه کرد.
- از آنجا که دادههای انبار داده یکپارچهسازی شدهاند، با استفاده از کوئری نویسی میتوان اطلاعات مورد نظر را از آنها بهسادگی استخراج کرد.
- با نگهداری دادههای موجود در پایگاه دادههای مختلف درون انبار دادهها میتوان عملیات تحلیل و بررسی دادهها و گزارشگیری از آنها را بهراحتی انجام داد.
معایب Data Warehouse
علاوه بر نکات مثبتی که برای انبار داده در بخش قبل ارائه دادیم، در این قسمت به مهمترین معایب آن میپردازیم:
- به دلیل پیچیدگی ساختار انبار داده، ممکن است برخی مشکلات مربوط به آن بهسادگی رفع نشود و برای پیدا کردن دلیل رخداد مشکل، زمان زیادی لازم باشد.
- روال کار ETL برای ذخیرهسازی دادهها در انبار داده زمانبر است.
- به ظاهر ممکن است ساختار انبار داده ساده به نظر بیاید اما کار با آن برای کاربران پیچیده و دشوار است و باید به کاربران نهایی آن آموزش داده شود.
- ساختار انبار دادهها پیچیده هستند و نیاز به دانش تخصصی و اطلاعات عمیق از کسب و کار دارند.
- پس از ساخت انبار داده، اضافه کردن یک منبع داده جدید به آن بسیار دشوار است.
- انبار داده از دادههای غیرساختاریافته نظیر تصویر و دادههای اینترنت اشیا و دادههایی با فرمت JSON و XML پشتیبانی نمیکند.
- انبار داده صرفاً از زبان SQL پشتیبانی میکند.
جمعبندی
انبار داده سیستمی برای ذخیرهسازی دادهها با حجم بسیار بالا است و با کمک آن میتوان به اطلاعات ارزشمندی از دادهها دست یافت. سازمانها با استفاده از امکانات و ابزارهای انبار داده میتوانند به تجزیه و تحلیل دادهها بپردازند و از آنها گزارشاتی مهم تهیه کنند که در راستای تصمیمگیری مدیران، پیشرفت و موفقیت سازمان نقش بهسزایی دارند. در این مطلب از مجله فرادرس، به این پرسش پاسخ دادیم که انبار داده چیست و چه ویژگیها و کاربردهایی دارد. همچنین، به انواع انبار داده و طرحوارهها و معماریهای آن پرداختیم تا خواننده با مفهوم کلی آن آشنا شود.
source