رفتن به مطلب

پايگاه داده چيست؟


Mohammad Aref

ارسال های توصیه شده

دادِگان (پايگاه داده‌ها يا بانک اطلاعاتي) به مجموعه‌اي از اطلاعات با ساختار منظم و سامانمند گفته مي‌شود. اين پايگاه‌هاي اطلاعاتي معمولاً در قالبي که براي دستگاه‌ها و رايانه‌ها قابل خواندن و قابل دسترسي باشند ذخيره مي‌شوند. البته چنين شيوه ذخيره‌سازي اطلاعات تنها روش موجود نيست و شيوه‌هاي ديگري مانند ذخيره‌سازي ساده در پرونده‌ها نيز استفاده مي‌گردد. مسئله‌اي که ذخيره‌سازي داده‌ها در دادگان را موثر مي‌سازد وجود يک ساختار مفهومي است براي ذخيره‌سازي و روابط بين داده‌ها است.

پايگاه داده در اصل مجموعه‌اي سازمان يافته از اطلاعات است.اين واژه از دانش رايانه سرچشمه مي‌‌گيرد ،اما کاربر وسيع و عمومي نيز دارد، اين وسعت به اندازه‌اي است که مرکز اروپايي پايگاه داده (که تعاريف خردمندانه‌اي براي پايگاه داده ايجاد مي‌‌کند) شامل تعاريف غير الکترونيکي براي پايگاه داده مي‌‌باشد. در اين نوشتار به کاربرد هاي تکنيکي براي اين اصطلاح محدود مي‌‌شود.

يک تعريف ممکن اين است که: پايگاه داده مجموعه‌اي از رکورد هاي ذخيره شده در رايانه با يک روش سيستماتيک (اصولي) مثل يک برنامه رايانه‌اي است که مي‌‌تواند به سوالات کاربر پاسخ دهد. براي ذخيره و بازيابي بهتر، هر رکورد معمولا به صورت مجموعه‌اي از اجزاي داده‌اي يا رويداد ها سازماندهي مي‌‌گردد. بخش هاي بازيابي شده در هر پرسش به اطلاعاتي تبديل مي‌‌شود که براي اتخاذ يک تصميم کاربرد دارد. برنامه رايانه‌اي که براي مديريت و پرسش و پاسخ بين پايگاه‌هاي داده‌اي استفاده مي‌‌شود را مدير سيستم پايگاه داده‌اي يا به اختصار (DBMS) مي‌‌ناميم. خصوصيات و طراحي سيستم هاي پايگاه داده‌اي در علم اطلاعات مطالعه مي‌‌شود.

مفهوم اصلي پايگاه داده اين است که پايگاه داده مجموعه‌اي از رکورد ها يا تکه هايي از يک شناخت است.نوعا در يک پايگاه داده توصيف ساخت يافته‌اي براي موجوديت هاي نگه داري شده در پايگاه داده وجود دارد: اين توصيف با يک الگو يا مدل شناخته مي‌‌شود. مدل توصيفي، اشيا پايگاه‌هاي داده و ارتباط بين آنها را نشان مي‌‌دهد. روش هاي متفاوتي براي سازماندهي اين مدل ها وجود دارد که به آنها مدل هاي پايگاه داده گوييم. پرکاربرد‌ترين مدلي که امروزه بسيار استفاده مي‌‌شود، مدل رابطه‌اي است که به طور عام به صورت زير تعريف مي‌‌شود: نمايش تمام اطلاعاتي که به فرم جداول مرتبط که هريک از سطر ها و ستونها تشکيل شده است(تعريف حقيقي آن در علم رياضيات برسي مي‌‌شود). در اين مدل وابستگي ها به کمک مقادير مشترک در بيش از يک جدول نشان داده مي‌‌شود. مدل هاي ديگري مثل مدل سلسله مراتب و مدل شبکه‌اي به طور صريح تري ارتباط ها را نشان مي‌‌دهند.

در مباحث تخصصي تر اصتلاح دادگان يا پايگاه داده به صورت مجموعه‌اي از رکورد هاي مرتبط با هم تعريف مي‌‌شود. بسياري از حرفه‌اي ها مجموعه‌اي از داده هايي با خصوصيات يکسان به منظور ايجاد يک پايگاه داده‌اي يکتا استفاده مي‌‌کنند.

 

معمولا DBMS ها بر اساس مدل هايي که استفاده مي‌‌کنند تقسيم بندي مي‌‌شوند: ارتباطي،شي گرا، شبکه‌اي و امثال آن. مدل هاي داده‌اي به تعيين زبانهاي دسترسي به پايگاه‌هاي داده علاقه مند هستند. بخش قابل توجهي از مهندسي DBMS مستقل از مدل هاي مي‌‌باشد و به فاکتور هايي همچون اجرا، همزماني،جامعيت و بازيافت از خطاهاي سخت افزاري وابسطه است.در اين سطح تفاوت هاي بسياري بين محصولات وجود دارد.

موارد زير به صورت خلاصه شرح داده مي شود:

•۱ تاريخچه پايگاه داده

•۲ انواع دادگان ها

•۳ مدل هاي پايگاه داده

۳.۱ مدل تخت

۳.۲ مدل شبکه اي(Network)

۳.۳ مدل رابطه اي

۳.۴ پايگاه داده‌هاي چند بعدي

۳.۵ پايگاه داده‌هاي شيء

•۴ ويژگي‌هاي سيستم مديريت پايگاه داده‌ها

•۵ فهرست سيستم‌هاي متداول مديريت دادگان

 

1- تاريخچه پايگاه داده

اولين کاربردهاي اصطلاح پايگاه داده به June 1963 باز مي‌گردد، يعني زماني که شرکت System Development Corporation مسئوليت اجرايي يک طرح به نام "توسعه و مديريت محاسباتي يک پايگاه داده‌اي مرکزي" را بر عهده گرفت. پايگاه داده به عنوان يک واژه واحد در اوايل دهه 70 در اروپا و در اواخر دهه 70 در خبر نامه‌هاي معتبر آمريکايي به کار رفت.(بانک داده‌اي يا Databank در اوايل سال 1966 در روزنامه واشنگتن کار رفت)

تصوير:اولين سيستم مديريت پايگاه داده در دهه 60 گسترش يافت. از پيشگامان اين شاخه چارلز باخمن مي‌‌باشد. مقالات باخمن اين را نشان داد که فرضيات او کاربرد بسيار موثرتري براي دسترسي به وسايل ذخيره سازي را محيا مي‌‌کند. در آن زمانها پردازش داده بر پايه کارت هاي منگنه و نوار هاي مغناطيسي بود که پردازش سري اطلاعات را مهيا مي‌‌کند. دو نوع مدل داده‌اي در آن زمانها ايجاد شد:CODASYL موجب توسعه مدل شبکه‌اي شدکه ريشه در نظريات باخمن داشت و مدل سلسله مراتبي که توسط North American Rockwell ايجاد شد و بعدا با اقباس از آن شرکت IBM محصولIMS را توليد نمود.

مدل رابطه‌اي توسط E. F. Codd در سال 1970 ارائه شد.او مدل هاي موجود را مورد انتقاد قرار مي‌‌داد. براي مدتي نسبتا طولاني اين مدل در مجامع علمي مورد تاييد بود. اولين محصول موفق براي ميکرو کامپيوتر ها dBASE بودکه براي سيستم عامل هايCP/M و PC-DOS/MS-DOS ساخته شد. در جريان سال 1980 پژوهش بر روي مدل توزيع شده (distributed database) و ماشين هاي دادگاني (database machines) متمرکز شد، اما تاثير کمي بر بازار گذاشت. در سال 1990 توجهات به طرف مدل شي گرا(object-oriented databases) جلب شد. اين مدل جهت کنترل داده‌هاي مرکب لازم بود و به سادگي بر روي پايگاه داده‌هاي خاص، مهندسي داده(شامل مهندسي نرم افزار منابع) و داده‌هاي چند رسانه‌اي کار مي‌‌کرد.

 

در سال 2000 نوآوري تازه‌اي رخ داد و دادگان اکس‌ام‌ال (XML) به وجود آمد. هدف اين مدل از بين بردن تفاوت بين مستندات و داده ها است و کمک مي‌‌کند که منابع اطلاعاتي چه ساخت يافته باشند يا نه در کنار هم قرار گيرند.

 

2- انواع دادگان ها

دادگان‌ها از نظر ساختار مفهومي و شيوه‌اي رفتار با داده‌ها بر دو نوع هستند :

1.دادگان رابطه‌اي

2.دادگان شي‌گرا

 

3- مدل هاي پايگاه داده

شگرد هاي مختلفي براي مدل هاي داده‌اي وجود دارد. بيشتر سيستم هاي پايگاه داده‌اي هر چند که طور معمول بيشتر از يک مدل را مورد حمايت قرار مي‌‌دهند، حول يک مدل مشخص ايجاد شده اند. براي هر يک از الگوهاي هاي منطقي (logical model) اجراهاي فيزيکي مختلفي قابل پياده شدن است و سطوح کنترل مختلفي در انطباق فيزيکي براي کاربران محيا مي‌‌کند. يک انتخاب مناسب تاثير موثري بر اجرا دارد. مثالي از موارد الگوي رابطه‌اي (relational model) است: همه رويدادهاي مهم در مدل رابطه‌اي امکان ايجاد نمايه‌هايي که دسترسي سريع به سطرها در جدول را مي‌‌دهد،فراهم مي‌‌شود.

يک مدل داده‌اي تنها شيوه ساختمان بندي داده ها نيست بلکه معمولا به صورت مجموعه‌اي از عمليات ها که مي‌‌تواند روي داده ها اجرا شود تعريف مي‌‌شوند. براي مثال در مدل رابطه‌اي عملياتي همچون گزينش (selection)، طرح ريزي (projection) و اتصال (join) تعريف مي‌‌گردد.

 

3-1- مدل تخت

مدل تخت يا جدولي (flat (or table) model ) تشکيل شده است از يک آرايه دو بعدي با عناصر داده‌اي که همه اجزاي يک ستون به صورت داده‌هاي مشابه فرض مي‌‌شود و همه عناصر يک سطر با هم در ارتباط هستند. براي نمونه در ستون هايي که براي نام کاربري و رمز عبور در جزئي از سيستم هاي پايگاه داده‌اي امنيتي مورد استفاده قرار مي‌‌گيرد هر سطر شامل رمز عبوري است که مخصوص يک کاربر خاص است. ستون هاي جدول که با آن در ارتباط هستند به صورت داده کاراکتري، اطلاعات زماني، عدد صحيح يا اعداد مميز شناور تعريف مي‌‌شوند. اين مدل پايه برنامه‌هاي محاسباتي(spreadsheet) است.

 

پايگاه داده ها با فايل هاي تخت به سادگي توسط فايل هاي متني تعريف مي‌‌شوند. هر رکورد يک خط است و فيلد ها به کمک جدا کننده هايي از هم مجزا مي‌‌شوند. فرضا به مثال زير دقت کنيد:

id name team

1 Amy Blues

2 Bob Reds

3 Chuck Blues

4 Dick Blues

5 Ethel Reds

6 Fred Blues

7 Gilly Blues

8 Hank Reds

داده‌هاي هر ستون مشابه هم است ما به اين ستونها فيلد ها (fields) گوييم. و هر خط را غير از خط اول يک رکورد(record) مي‌‌ناميم. خط اول را که برخي پايگاه‌هاي داده‌اي آنرا ندارند رکورد برچسب(field labels) گوييم. هر مقدار داده‌اي اندازه خاص خود را دارد که اگر به آن اندازه نرسد مي‌‌توان از کاراکنر فاصله براي اين منظور استفاده کرد اما اين مسئله مخصوصا زماني که بخواهيم اطلاعات را بر روي کارت هاي منگنه قرار دهيم مشکل ساز خواهد شد. امروزه معمولا از نويسه TAB براي جداسازي فيلد ها و کاراکتر خط بعد براي رکورد بعدي استفاده مي‌‌کنيم. البته شيوه‌هاي ديگري هم وجود دارد مثلا به مثال زير دقت کنيد:

"1","Amy","Blues"

"2","Bob","Reds"

"3","Chuck","Blues"

"4","Dick","Blues"

"5","Ethel","Reds"

"6","Fred","Blues"

"7","Gilly","Blues"

"8","Hank","Reds"

اين مثال از جدا کننده کاما استفاده مي‌‌کند.در اين نوع مدل تنها قابليت حذف،اضافه،ديدن و ويرايش وجود دارد که ممکن است کافي نباشد.Microsoft Excel اين مدل را پياده سازي مي‌کند.

 

3-2- مدل شبکه اي(Network)

در سال 1969 و در کنفرانس زبانهاي سيستم هاي داده‌اي (CODASYL) توسطCharles Bachman ارائه شد. در سال 1971 مجددا مطرح شد و اساس کار پايگاه داده‌اي قرار گرفت و در اوايل دهه 80 با ثبت آن درسازمان بين المللي استانداردهاي جهاني يا ISO به اوج رسيد.

 

مدل شبکه‌اي (database model) بر پايه دو سازه مهم يعني مجموعه ها و رکورد ها ساخته مي‌‌شود و برخلاف روش سلسله مراتبي که از درخت استفاده مي‌‌کند، گراف را به کار مي‌‌گيرد. مزيت اين روش بر سلسله مراتبي اين است که مدل هاي ارتباطي طبيعي بيشتري را بين موجوديت ها فراهم مي‌‌کند. الي رغم اين مزيت ها به دو دليل اساسي اين مدل با شکست مواجه شد: اول اينکه شرکت IBM با توليد محصولات IMS و DL/I که بر پايه مدل سلسله مراتبي است اين مدل را ناديده گرفت. دوم اينکه سرانجام مدل رابطه‌اي (relational model) جاي آن را گرفت چون سطح بالاتر و واضح تر بود. تا اوايل دهه 80 به علت کارايي رابط هاي سطح پايين مدل سلسله مراتبي و شبکه‌اي پيشنهاد مي‌‌شد که بسياري از نياز هاي آن زمان را برطرف مي‌‌کرد. اما با سريعتر شدن سخت افزار به علت قابليت انعطاف و سودمندي بيشتر سيستم هاي رابطه‌اي به پيروزي رسيدند.

 

رکورد ها در اين مدل شامل فيلد هايي است( ممکن است همچون زبان کوبول (COBOL) به صورت سلسله مراتب اولويتي باشد). مجموعه ها با ارتباط يک به چند بين رکورد ها تعريف مي‌‌شود: يک مالک و چند عضو. عمليات هاي مدل شبکه‌اي از نوع هدايت کننده است: يک برنامه در موقعيت جاري خود باقي مي‌‌ماند و از يک رکورد به رکورد ديگر مي‌‌رود هر گاه که ارتباطي بين آنها وجود داشته باشد. معمولا از اشاره‌گرها(pointers) براي آدرس دهي مستقيم به يک رکورد در ديسک استفاده مي‌‌شود. با اين تکنيک کارايي بازيابي اضافه مي‌‌شود هر چند در نمايش ظاهري اين مدل ضروري نيست .

 

3-3- مدل رابطه اي

مدل رابطه اي (relational model) در يک مقاله تحصيلي توسط E. F. Codd در سال 1970 ارائه گشت. اين مدل يک مدل رياضياتي است که با مفاهيمي چون مستندات منطقي (predicate logic) و تئوري مجموعه ها (set theory) در ارتباط است. محصولاتي همچون اينگرس،اراکل، DB2 وسرور اس‌کيوال (SQL Server) بر اين پايه ايجاد شده است. ساختار داده ها در اين محصولات به صورت جدول است با اين تفاوت که مي‌‌تواند چند سطر داشته باشد. به عبارت ديگر داراي جداول چند گانه است که به طور صريح ارتباطات بين آنها بيان نمي‌شود و در عوض کليد هايي به منظور تطبيق سطر ها در جداول مختلف استفاده مي‌‌شود. به عنوان مثال جدول کارمندان ممکن است ستوني به نام "موقعيت" داشته باشد که کليد جدول موقعيت را با هم تطبيق مي‌‌دهد.

 

3-4- پايگاه داده‌هاي چند بعدي

پايگاه داده‌هاي رابطه‌اي توانست به سرعت بازار را تسخير کند، هرچند کارهايي نيز وجود داشت که اين پايگاه داده‌ها نمي‌توانست به خوبي انجام دهد. به ويژه به کارگيري کليدها در چند رکورد مرتبط به هم و در چند پايگاه داده مشترک، کندي سيستم را موجب مي‌شد. براي نمونه براي يافتن نشاني کاربري با نام ديويد، سيستم رابطه‌اي بايد نام وي را در جدول کاربر جستجو کند و کليد اصلي (primary key ) را بيابد و سپس در جدول نشاني‌ها، دنبال آن کليد بگردد. اگر چه اين وضعيت از نظر کاربر، فقط يک عمليات محسوب، اما به جستجو درجداول نيازمند است که اين کار پيچيده و زمان بر خواهد بود. راه کار اين مشکل اين است که پايگاه داده‌ها اطلاعات صريح درباره ارتباط بين داده‌ها را ذخيره نمايد. مي‌توان به جاي يافتن نشاني ديويد با جستجو ي کليد در جدول نشاني، اشاره‌گر به داده‌ها را ذخيره نمود. در واقع، اگر رکورد اصلي، مالک داده باشد، در همان مکان فيزيکي ذخيره خواهد شد و از سوي ديگر سرعت دسترسي افزايش خواهد يافت.

چنين سيستمي را پايگاه داده‌هاي چند بعدي مي‌نامند. اين سيستم در هنگامي که از مجموعه داده‌هاي بزرگ استفاده مي‌شود، بسيار سودمند خواهد بود. از آنجاييکه اين سيستم براي مجموعه داده‌هاي بزرگ به کار مي‌رود، هيچگاه در بازار به طور مستقيم عموميت نخواهد يافت.

 

3-5- پايگاه داده‌هاي شيء

اگر چه سيستم‌هاي چند بعدي نتوانستند بازار را تسخير نمايند، اما به توسعه سيستم‌هاي شيء منجر شدند. اين سيستم‌ها که مبتني بر ساختار و مفاهيم سيستم‌هاي چند بعدي هستند، به کاربر امکان مي‌دهند تا اشياء را به طور مستقيم در پايگاه داده‌ها ذخيره نمايد. بدين ترتيب ساختار برنامه نويسي شيء گرا (object oriented ) را مي‌توان به طور مستقيم و بدون تبديل نمودن به ساير فرمت‌ها، در پايگاه داده‌ها مورد استفاده قرار داد. اين وضعيت به دليل مفاهيم مالکيت (ownership) در سيستم چند بعدي، رخ مي‌دهد. در برنامه شيء گرا (OO)، يک شيء خاص "مالک " ساير اشياء در حافظه است، مثلا ديويد مالک نشاني خود مي‌باشد. در صورتي که مفهوم مالکيت در پايگاه داده‌هاي رابطه‌اي وجود ندارد.

 

4- ويژگي‌هاي سيستم مديريت پايگاه داده‌ها

پس از اين مقدمه به توصيف سيستم مديريت پايگاه داده‌ها مي‌پردازيم. سيستم مديريت پايگاه داده‌ها، مجموعه‌اي پيچيده از برنامه‌هاي نرم‌افزاري است که ذخيره سازي و بازيابي داده‌هاي (فيلدها، رکوردها و فايل‌ها) سازمان را در پايگاه داده‌ها، کنترل مي‌کند. اين سيستم، کنترل امنيت و صحت پايگاه داده‌ها را نيز بر عهده دارد. سيستم مديريت پايگاه داده‌ها، درخواست‌هاي داده را از برنامه مي‌پذيرد و به سيستم عامل دستور مي‌دهد تا داده‌ها ي مناسب را انتقال دهد. هنگامي که چنين سيستمي مورد استفاده قرار مي‌گيرد، اگر نيازمنديهاي اطلاعاتي سازماني تغيير يابد، سيستم‌هاي اطلاعاتي نيز آسانتر تغيير خواهند يافت. سيستم مذکور از صحت پايگاه داده‌ها پشتيباني مي‌کند. بدين ترتيب که اجازه نمي‌دهد بيش از يک کاربر در هر لحظه، يک رکورد را به روز رساني کند. اين سيستم رکوردهاي تکراري را در خارج پايگاه داده‌ها نگاه مي‌دارد. براي مثال، هيچ دو مشترک با يک شماره مشتري، نمي‌توانند در پايگاه داده‌ها وارد شوند. اين سيستم روشي براي ورود و به روز رساني تعاملي پايگاه داده‌ها فراهم مي‌آورد. يک سيستم اطلاعات کسب و کار از موضوعاتي نظير (مشتريان، کارمندان، فروشندگان و غيره) و فعاليت‌هايي چون (سفارشات، پرداخت‌ها، خريدها و غيره) تشکيل شده است. طراحي پايگاه داده‌ها، فرايند تصميم گيري درباره نحوه سازماندهي اين داده‌ها در انواع رکوردها و برقراري ارتباط بين رکوردهاست.سيستم مديريت پايگاه داده‌ها مي‌تواند ساختار داده‌ها و ارتباط آنها را در سازمان به طور اثر بخش نشان دهد. سه نوع مدل متداول سازماني عبارتند از: سلسله مراتبي، شبکه‌اي و رابطه‌اي. يک سيستم مديريت پايگاه داده‌ها ممکن است يک، دو يا هر سه روش را فراهم آورد. سرورهاي پايگاه داده‌ها، کامپيوترهايي هستند که پايگاه داده‌هاي واقعي را نگاه مي‌دارند و فقط سيستم مديريت پايگاه داده‌ها و نرم‌افزار مربوطه را اجرا مي‌کنند. معمولا اين سرورها رايانه‌هاي چند پردازنده‌اي با آرايه‌هاي ديسک RAID براي ذخيره سازي مي‌باشند.

 

5- فهرست سيستم‌هاي متداول مديريت دادگان

معروف‌ترين اين نرم‌افزارهاي مديريت دادگان‌ها مي‌توان به چند نمونه زير اشاره کرد:

1.Oracle

2.Microsoft SQL Server

3.MySQL

4.PostregSQL

5.DB2

6.Microsoft Access

واژه دادگان از برابرنهاده‌هاي فرهنگستان زبان فارسي مي‌باشد.

 

منبع از:

برای مشاهده این محتوا لطفاً ثبت نام کنید یا وارد شوید.

لینک به دیدگاه
×
×
  • اضافه کردن...