این محصول در قالب ورد و قابل ویرایش در 103 صفحه می باشد.
فهرست مطالب
مطالعات نظری ۷
فصل اول ۸
۱٫ سیستم پایگاهی توزیع شده ۹
تعاریف ۹
۲٫ مزایا و معایب سیستم پایگاهی توزیع شده ۱۳
۲٫۱٫ مزایا: ۱۴
۲٫۲٫ معایب: ۱۴
۳٫ چند سیستم نمونه ۱۴
۴٫ یک اصل بنیادی ۱۵
۵٫ دوازده قاعده فرعی ۱۷
۵٫۱٫ خود مختاری محلی ۱۷
۵٫۲٫ عدم وابستگی به یک مانه مرکزی ۱۸
۵٫۳٫ استمرار عملیات ۱۸
۵٫۴٫ استقلال از مکان ذخیره سازی ۱۹
۵٫۵٫ استقلال از چگونگی پارسازی داده ها ۱۹
۵٫۶٫ استقلال ازچگونگی نسخه سازی داده ها ۲۲
۵٫۷٫ پردازش در خواست های توزیع شده ۲۴
۵٫۸٫ مدیریت تراکنش های توزیع شده ۲۴
۵٫۹٫ استقلال از سخت افزار ۲۵
۵٫۱۰٫ استقلال از سیستم عامل ۲۵
۵٫۱۱٫ استقلال از شبکه ۲۵
۵٫۱۲٫ استقلال از DBMS. 26
6. پایگاه داده های توزیع شده همگن و ناهمگن ۲۶
۷٫ مشکلات سیستم های توزیع شده ۲۶
۷٫۱٫ پردازش در خواست ۲۷
۷٫۲٫ مدیریت کاتالوگ ۳۰
۷٫۳٫ انتشار بهنگام سازی ۳۳
۷٫۴٫ کنترل ترمیم ۳۴
۷٫۵٫ کنترل همروندی ۳۶
۸٫ گدار ۳۸
۹٫ مقایسه سیستم های مشتری/خدمتگزار با سیستم های توزیع شده ۴۰
۱۰٫ خلاصه ۴۱
۱۱٫ نتیجه گیری ۴۲
فصل دوم ۴۳
۱٫ سیستم های پایگاه داده های توزیع شده و موازی ۴۴
۲٫ توازی بین درخواست ها ۴۶
۳٫ نگاهی دقیقتر به تکنولوژی پایگاه داده های توزیع شده وموازی ۵۱
۳٫۱٫ سطح و نوع توزیع شدگی داده ها ومسئولیت ها در DDBMSهای مختلف ۵۲
۳٫۲٫ پردازش و بهینه سازی درخواست ۵۵
۳٫۳٫ کنترل همروندی (Concurency control) 63
3.4. پروتکل های قابلیت اطمینان ۶۷
۴٫ خلاصه ۷۷
۵٫ نتیجه گیری ۷۸
فصل سوم ۷۹
۱٫ تاریخچه ۸۰
۲٫ جنبه هایاوراکل برای سیستم های توزیع شده ۸۲
۳٫ خطوط اتصال پایگاه داده ها ۸۲
۳٫۱٫ رده بندی database link بر اساس نحوه برقراری ارتباط ۸۳
ضرورت استفاده از database link ها ۸۳
۳٫۲٫ بکارگیری اسامی سراسری پایگاه داده هادر database link ها ۸۴
۳٫۳٫ نامگذاری database link ها ۸۵
۳٫۴٫ گونه های مختلف database link 85
3.5. مقایسه کاربران ِ گونه های مختلف database link ها ۸۶
۳٫۶٫ مثال هایی از تعریف database link در سیستم های توزیع شده پایگاه داده ها ۸۷
۴٫ عملیات روی داده های ذخیره شده در پایگاه داده های توزیع شده اوراکل ۸۸
فصل چهارم ۸۹
۱٫ توزیع داده ها ۹۰
۱٫۱٫ استراتژی های توزیع داده ها ۹۰
۱٫۲٫ تخصیص داده ها ۹۱
۱٫۳٫ طرح توزیع و تخصیص مناسب برای DDB خوابگاه دانشگاه شهید بهشتی ۹۱
۱٫۴٫ انتخاب طرح توزیع DDB خوابگاه دانشگاه شهید بهشتی ۹۱
پیشگفتار
پیشرفت تکنولوژی سیستم های مدیریت پایگاه داده ها ، با توسعه تکنولوژی های محاسبات توزیع شده وپردازش های موازی همگام شده است. نتیجه این همگامی ، سیستم های مدیریت پایگاه داده های توزیع شده و موازی است .سیستم های پایگاهی توزیع شده ، مجموعه ای از چندین پایگاه داده های منطقاً مرتبط است که دریک شبکه کامپیوتری گسترده شده اند .
اینگونه از سیستم های پایگاهی در عین دارا بودن مزایایی همچون :
ü سازگاری و هماهنگی با ماهیت سازمان های نوین
ü کارایی بیشتر در پردازش داده ها به ویژه در پایگاه داده های بزرگ
ü دستیابی بهتر به داده ها
ü اشتراک داده ها
ü افزایش پردازش موازی
ü کاهش هزینه ارتباطات
ü تسهیل گسترش سیستم
ü استفاده از پایگاه داده های از قبل موجود.
دارای معایبی نیز می باشد. از جمله معایب آن می توان به موارد ذیل اشاره نمود :
ü پیچیدگی طراحی سیستم
ü پیچیدگی پیاده سازی
ü کاهش کارایی در برخی موارد
ü هزینه بیشتر
ü مصرف حافظه بیشتر
معماری توزیع شده برای پایگاه داده ها ، با وجود اینکه مزایای سیستم های پایگاهی را با مزایای سیستم های توزیع شده یکجا می کند ، ولی مسائل و مشکلات خاص خود را دارد. آنچه قابل یادآوری است این که ، انتخاب نوع معماری برای ایجاد نرم افزار کاربردی ،باید کاملاً حساب شده باشد. این انتخاب باید بهترین حالت ممکن برای پاسخگویی به نیاز های کاربران را داشته و در عین حال از نظر کارایی در حد مطلوبی قرار داشته باشد.
سیستم پایگاهی توزیع شده[۱]
تعاریف
پایگاه داده: مجموعه ای است از داده های ذخیره شده و پایا، بصورت مجتمع (یکپارچه) (نه لزوماً همیشه بطور فیزیکی، بلکه حداقل بطورمنطقی)، بهم مرتبط، حتی الامکان با کمترین افزونگی، (دارای یک ساختار منطقی مبتنی بر یک مدل داده ای و توصیف شده بویژه در محیط انتزاعی یعنی در چارچوب همان مدل داده ای )، تحت مدیریت یک سیستم کنترل متمرکز، مورد استفاده یک یا چند کاربر از یک(یا بیش از یک)«سیستم کاربردی»،بطور همزمان و اشتراکی.]روحا۸۳[
شبکه کامپیوتری: مجموعه ای از کامپیوتر ها، مسیر یاب ها، ماهواره ها،اتصالات ارتباطی، که از طریق آن می توان به اطلاعات موجود در کامپیوترهای مختلف عضو این سیستم دسترسی پیدا کرد.
به زبان ساده سیستم پایگاه داده توزیع شده ، مزایای تکنولوژی پایگاه داده و تکنولوژی شبکه را در خود جمع کرده است.البته این یکپارچه سازی[۲] ، با تمرکز[۳] تفاوت دارد.شکل زیر گویای این مطلب است:
شکل ۱- معماری توزیع شده پایگاهی،ترکیبی از تکنولوژی های شبکه و پایگاه داده ها[TAMER99]
تعریف اول:
یک سیستم توزیع شده پایگاهی، شامل مجموعه ای از مانه هاست[۴] که از طریق برخی المانهای اتصال، بهم متصل می باشد بطوریکه :
۱- هر مانه خود یک سیستم پایگاه داده ها به معنای کامل می باشد.
۲- مانه ها به نحوی بهم متصل هستند که کاربر هر مانه می تواند به داده های هر مانه دیگر طوری دسترسی یابد که منطقاً با حالتی که تمام داده ها در مانه کاربر مربوطه قرار دارند، فرقی نداشته باشد.
با تعریف ارائه شده فوق از سیستم های پایگاه داده های توزیع شده ،می توان فهمید که سیستم پایگاه داده های توزیع شده، در واقع نوعی شیء مجازی[۵] می باشد که مولفه[۶]های آن بطور فیزیکی در تعدادی پایگاه داده های واقعی[۷] مختلف در تعدادی مانه مجزا قرار دارد . ( در اصل DDB[8] ، اجتماع منطقی این چند پایگاه داده واقعی می باشد ).] [DATE2000
تعریف دوم:
سیستم توزیع شده پایگاهی، مجموعه ای از داده های ذخیره شده ( با ویژگی های بر شمرده در تعریف پایگاه داده ها)، که منطقاً به یک سیستم تعلق دارند ، ولی در مانه ها ی مختلف یک یا بیش از یک شبکه توزیع شده اند. به عبارتی دیگر، می توان گفت که تعدادی پایگاه داده های ذخیره شده روی کامپیوتر های مختلف داریم که از نظر کابران، پایگاه واحدی هستند. به بیان دیگر، مجموعه ای است از چند پایگاه داده منطقاً یکپارچه(مجتمع)،ولی بطور فیزیکی توزیع شده روی یک شبکه کامپیوتری.]روحا۸۳[
شکل ۲- یک سیستم پایگاه داده های توزیع شده
تعریف سوم:
یک سیستم پایگاهی توزیع شده(DDB) ،مجموعه ای است از چندین پایگاه داده های منطقاً بهم مرتبط از طریق یک شبکه کامپیوتری. سیستم مدیریت پایگاه داده های توزیع شده(DDBMS)،نرم افزاری که مدیریت پایگاه داده های توزیع شده را فراهم می آورد و«توزیع شدگی» را از دید کاربران پنهان می
سازد.[TAMER99]
طبق تعریف فوق، سیستم پایگاه داده های توزیع شده، از مجموعه ای مانه در خواست کننده[۹] ( با صفر یا بیشتر عضو فعال ) و یک مجموعه ناتهی از مانه داده[۱۰] ها تشکیل شده است.
مانه های داده ای، قابلیت نگهداری فیزیکی داده های سیستم را دارند در حالیکه مانه های درخواست کننده فاقد این امکان هستند. در مانه های درخواست کننده تنها واسط[۱۱] هایی وجود دارد که با اجرای آنها، داده های ذخیره شده در مانه های داده ها بهتر و راحتتر بدست می آیند.
شکل۳- محیط[۱۲] سیستم پایگاه داده توزیع شده[TAMER99]
همانطور که از شکل بالا مشخص است، بجز مانه۱ که از نوع مانه درخواست کننده است، بقیه از نوع داده هستند.
اما حالت فوق، تنها حالت ممکن برای پایگاه داده های توزیع شده نیست. در نوع دیگری از معماری توزیع شده پایگاه داده ها، فرض می شود هر مانه(مانه های «درخواست کننده» و «داده ها») بطور منطقی حاوی ]حداقل[یک ماشین مستقل است. بنابراین هر کدام از مانه ها دارای مخزن ذخیره سازی اولیه و ثانویه مستقل خود می باشند. مانه ها، سیستم عامل های مستقل خود را (که می توانند همگن یا ناهمگن باشند)دارند و هر یک قادر خواهند بود برنامه های کاربردی خود را بطور محلی احرا نمایند. مانه ها بوسیله یک شبکه کامپیوتری بهم متصل شده اند. تاکید می شود که اتصال بین مانه ها در این نوع سیستم های توزیع شده، از نوع «اتصال ضعیف»[۱۳] بین پردازنده ها است. منظور از اتصال ضعیف بین پردازنده آن است که هر پردازنده کلاک اختصاصی ، حافظه اولیه و ثانویه و سیستم عامل خود را دارد. در مقابل این نوع اتصال، «اتصال قوی» بین پردازنده ها وجود دارد که در آن پردازنده ها از یک حافظه مشترک[۱۴] و یک کلاک همگام استفاده می کنند. سیستم عامل واحدی پردازنده ها و حافظه را مدیریت می کند. اتصال بین پردازنده از نوع مستقیم است نه از طریق یک شبکه ارتباطی.
گونه دیگری از سیستم های پایگاه داده ها وجود دارد که از جهاتی شبیه سیستم های پایگاه داده های موازی است. این نوع DBMS ها DBMS های موازی کاملاً مستقل[۱۵] نامیده می شوند. در از DBMS های موازی، با بکارگیری معماری چند پردازنده ای، کارایی بالاتر و دسترس پذیری بیشتر را همراه با هزینه کمتر در مقایسه با ابر کامپیوترها خواهیم داشت.
معماری سیستم های پایگاه داده های موازی، جزئیات خاص خود را دارد که در محدوده این نوشتار نمی گنجد.
تعریف چهارم:
یک سیستم محاسبات توزیع شده[۱۶]،شامل تعدادی عناصر پردازشگر- نه لزوماً همگن- است که از طریق یک شبکه کامپیوتری با هم در ارتباطند. یک سیستم توزیع شده پایگاه داده را می توان منطقاً مجموعه ای چندگانه از پایگاه داده ها دانست که روی یک شبکه کامپیوتری توزیع شده اند و DDBMS نرم افزار مدیریت این پایگاه داده توزیع شده است به نحوی که توزیع شدگی سیستم را از دید کاربر پنهان می سازد.[CONN2002]
تعریف پنجم:
برخلاف سیستم های پایگاهی موازی[۱۷] که در آنها پردازشگرها کاملاً بهم متصل شده و یک پایگاه داده واحد را تحت کنترل دارند، سیستم های پایگاهی توزیع شده از اتصال نسبتاً ضعیف مانه هایی که هرکدام بطور انحصاری میتوانند عمل کنند تشکیل شده است.
هر مانه ممکن است در پردازش یک تراکنشی که داده مورد نیاز خود را از مانه(های) دیگر دریافت می کند، شرکت کند.
تفاوت اصلی معماری سیستم پایگاهی متمرکز با معماری سیستم پایگاهی توزیع شده در محل استقرار داده ها است. در معماری متمرکز، داده ها بطور فیزیکی در یک رسانه ذخیره سازی قرار دارند در حالیکه داده های معماری توزیع شده در مانه های مختلف توزیع شده اند. همین توزیع داده ها در مانه های مختلف ، باعث تفاوت های زیادی در پردازش تراکنش ها و درخواست ها با معماری متمرکز ایجاد نموده است.[SILB2002]
منظور از اینکه هر مانه دارای سیستم پایگاه داده کامل و مستقلی است این است که : هر مانه پایگاه- داده های واقعیِ محلی[۱۸] خود، کاربران، DBMS و نرم افزارها ی مدیریت تراکنش ها[۱۹] و مدیریت ارتباط داده های[۲۰] خود را دارد. خصوصاً، یک کاربر می تواند عملیات روی داده های مانه خود را مانند حالتی که مانه آن اصلاً عضو یک شبکه توزیع شده پایگاه داده ها نباشد، به همان شکل محلی و متمرکز انجام دهد. ( حداقل مطلوب این است. )] DATE2000 [ .
مولفه نرم افزاری [۲۱] جدید در هر مانه (بطور منطقی)،گسترده ای از همان DBMS محلی و سیستم جدید که ترکیبی از مولفه های نرم افزاری و DBMS موجود است،همان سیستم مدیریت پایگاه داده توزیع شده به حساب می آید] DATE2000 [.
درتعریف سیستم پایگاه داده های توزیع شده،فرض می شود که مانه های سازنده سیستم، بطور فیزیکی از هم مجزا هستند، گرچه در اساس، مجزا بودن از نظر منطقی نیز کافی است(معمولا ًدر دنیای واقع چنین است که مانه ها از نظر جغرافیایی از هم جدا هستند).
مثلاً ممکن است دو مانه، کنار هم بر روی یک ماشین فیزیکی[۲۲] قرار گرفته باشند.
در بیشتر تحقیقات اولیه فرض بر توزیع جغرافیایی مانه ها بود، درحالی که بیشتر سازمانهای تجاری اخیر در راستای توزیع محلی[۲۳] فعالیت می کنند که در آن تعدادی مانه همگی در یک ساختمان و از طریق شبکه محلی بهم متصل شده اند.
مزایا و معایب سیستم پایگاهی توزیع شده
پیشرفت تکنولوژی سیستم های مدیریت پایگاه داده ها، با توسعه تکنولوژی محاسبات توزیع شده و پردازش های موازی همگام شده است. نتیجه نهایی این دو سیستم های مدیریت پایگاه داده های توزیع شده و موازی است. سازمانها بطور معمول، دارای ماهیت توزیع شده[۲۴] هستند. این توزیع بطور منطقی و بصورت زیر بخش ها، دپارتمان ها[۲۵] و گروه های کاری[۲۶] و در اکثر مواقع بطور فیزیکی می باشد. در نتیجه سیستم توزیع شده ، ما را قادر می سازد تا ساختار پایگاه داده های مورد نیاز سازمانها را شبیه ساختار واقعی آنها ایجاد کنیم. بدین صورت که، داده محلی را می توان همانطور محلی نگه داری کرد در حالیکه در صورت نیاز امکان دسترسی به داده های دور[۲۷] بطور همزمان نیز وجود داشته باشد .
بعنوان مثال، فرض کنید تنها دو مانه داریم: یکی در شهر A ودیگری در شهر B. فرض کنید هدف طراحی و پیاده سازی پایگاه داده اطلاعاتی برای حساب افراد در بانک باشد . این سیستم افزایش کارایی پردازش[۲۸] را ازطریق نگه داری داده مورد نیاز هر مانه در نزدیک ترین محل به آن، و افزایش دسترس پذیری[۲۹] را بوسیله دسترسی به داده های غیر محلی از دیگر مانه ها، بهمراه دارد. سیستم پایگاه داده های توزیع شده، با وجود داشتن مزایا خالی از عیب نیست ]حداقل[ از دیدگاه تکنیکی عیب آنها این است که سیستم های توزیع شده پیچیدگی[۳۰]خاص خود را دارند.
در حالت ایده آل(حداقل از نظر تئوری)، این پیچیدگی فقط مسئله ای برای پیاده ساز پایگاه داده است نه کاربرپایگاهی[۳۱]. البته در عمل تمام پیچیدگی ها و مشکلات سیستم های پایگاه داده های توزیع شده را نمی توان از کاربر پایانی پنهان ساخت.
پروژه طراحی و پیادهسازی پایگاه دادههای توزیع شده همگن