مفهوم پایگاه داده رابطه ای مفاهیم اساسی تئوری سیستم های پایگاه داده رابطه ای

کلیدهای ممکن، زیرا هر یک از آنها را می توان به عنوان یک کلید ترکیبی انتخاب کرد.

به عنوان مثال، اجازه دهید یک رابطه وجود داشته باشد

R (شهر، آدرس، کد پستی).

بدیهی است، ویژگی های شهر آدرس کد پستی. در همان زمان، Zip_code City (اگرچه آدرس نیست). هر دو مجموعه می توانند کلیدهای ممکن باشند.

گام 2.هر انتخابی را در درخت تا حد امکان پایین ببرید - قوانین I.4، IY.1، IY.3، IY.5.

مرحله 3.هر گونه برآمدگی را به پایین درخت منتقل کنید - قوانین I.2، IY.5، IY.6.

مرحله 4.هر آبشاری از انتخاب‌ها (پیش‌بینی‌ها) را در یک انتخاب واحد (پیش‌بینی) I.1، I.2، I.5 یا انتخابی که به دنبال آن یک طرح ریزی انجام می‌شود، ترکیب کنید.

مرحله 5.گره های داخلی درخت را به گروه ها تقسیم کنید: عملیات باینری را با عملیات S و P قبل یا بعد از گره ترکیب کنید.

مرحله 6.به یک سطح سلسله مراتب بالاتر بروید.

مثال بهینه سازیاجازه دهید پایگاه داده کتابخانه داده شود:

PUBLISHER[ATELIERS](نام_ناشر، مکان، آدرس_ناشر)،

READER[ATELI](نام خانوادگی، آدرس، شهر، N_form[ular])،

EXP[ACHI](N_form[ular]، N_bk، تاریخ)، که در آن bk کاتالوگ کتابخانه است، و ما از اختصارات برای تعیین جداول و فیلدها (بدون حروف در پرانتز) استفاده می‌کنیم.

پرس و جو: پیدا کنید چه کسانی کتاب های صادر شده قبل از 01/01/1997.D

مطابق با یک درخواست در زبان ALPHA است (شکل 4.8، a)

p NAME s DATE J 1.1.1997 p S (S F (OUT، CHIT، KN))،

که در آن F = READ.N_form = OUT.N_formKN.N_bk = OUT.N_bk،

در شکل 4.8، و در شرایط F دو انتخاب از هم جدا شده و تا حد امکان در درخت جابه جا می شوند. انتخاب

s DATE≤1.1.1997 (4.2)

زیر طرح و دو انتخاب طبق قوانین I.1، I.5.

انتخاب (4.2) برای محصول (OUT × CIT) × KN اعمال می شود. تاریخ تنها ویژگی رابطه OUT است زیرا

s DATE≤1.1.1997 ((OUT×CHIT)×KN)

(s DATE≤1.1.1997 (ISSUE×CHIT))×KN

((s DATE≤1.1.1997 (ISSUE))×CHIT)×KN.

انتخاب را می توان به پایین درخت منتقل کرد. انتخابی با شرط KN.N_bk = OUT.N_bk را نمی توان به زیر هر محصول دکارتی منتقل کرد، زیرا دارای ویژگی های رابطه KN و سایر روابط است.

s READ.N_FORM = s OUT.N_FORM را می توان به زیر منتقل کرد و روی محصول اعمال کرد

s DATE≤1.1.1997 ((OUT)×CHIT).

OUT.N_form نام ویژگی رابطه است که در s DATE≤1.1.1997 (OUT) دریافت شده است، زیرا این ویژگی یک رابطه OUT است.

طبق قانون I.2، دو پیش بینی در یک pNAME ترکیب می شوند و نتیجه در شکل 1 منعکس می شود. 4.8، ب.

طبق قانون I.4، p NAME و s book.N_bk=out.N_bk با یک آبشار جایگزین می شود.

p NAME,

s book.N_bk=out.N_bk،

ص عنوان کتاب.N_bk، شماره.N_bk. (4.3)

طبق قانون IY.6، عبارت (4.3) با p، نام کتاب جایگزین می شود.N_bk به رابطه KN اعمال می شود، و

p ext.N_bq، (4.4)

به اپراتور محصول دکارتی سمت چپ سطح بالاتر اعمال می شود (شکل 4.8، ب).

آخرین طرح (4.4) با انتخاب پایین تر مطابق قانون I.4 تعامل دارد و یک آبشار به دست می آید:

p ex.N_bk،

s read.N_forms=out.N_forms،

p vyd.N_bk، read.N_forms، vyd.N_forms. (4.5)

پروجکشن (4.5) از طریق محصول دکارتی طبق قانون IY.6 و تا حدی از طریق s DATE≤1.1.1997 (OUT) طبق قانون I.4 "الک" می شود. علاوه بر این، طرح ریزی p ext.N_bk، ext.N_forms، date اضافی است (اینها همه ویژگی های EXP هستند) و مستثنی هستند. سپس نتیجه نهایی به شکل شکل. 4.9،
که در آن گروهی از عملگرها با خطوط نقطه چین مشخص می شوند. هر یک از محصولات دکارتی در واقع یک معادل است که با انتخابی بالاتر از درخت ترکیب شود. به عبارت دیگر، انتخاب برای EXP و طرح ریزی برای CHIT را می توان در گروه های I و II ترکیب کرد که ابتدا عملیات گروه I و سپس عملیات گروه II انجام می شود.

نتیجه به‌دست‌آمده ممکن است نابهینه باشد، زیرا هیچ معیار بهینه‌سازی وجود ندارد.

اگر حداقل اتصالات و محصولات دکارتی را ملاک قرار دهیم [ص. 204]، سپس برای کلاس پرس و جوهای به اصطلاح پیوندی می توان بهینه سازی بدون ابهام را انجام داد.

همگام سازی فرآیندهای دسترسی

همگام سازی در هر دو حالت تک کاربره و چند کاربره انجام می شود.

در اینجا مفاهیم "قابلیت اطمینان"، "عنصر منطقی کار یا معامله"، "شیء (رکورد، ستون، جدول، فایل)"، "کنترل همزمان"، "بازیابی پایگاه داده" بوجود می آیند.

بیایید ابتدا در مورد حالت تک کاربره صحبت کنیم.

معامله یعنی:

    1) یک پیام ورودی که به سیستم منتقل می شود و برخی از رویدادهای واقعی را در رایانه (DB) منعکس می کند.

    2) فرآیند تغییر در پایگاه داده ناشی از ارسال یک پیام ورودی.

الزامات اساسی زیر برای معامله اعمال می شود:

    1) به طور کامل یا اصلاً انجام نشده است.

    2) تراکنش باید قابلیت بازگشت داشته باشد، با بازگشت مستقل به حالت اولیه تا زمانی که وضعیت همه اشیا تغییر کند.

    3) تراکنش باید قابل تکرار باشد: هنگام بازتولید، مسدود کردن باید تا زمانی که همه اشیا مشاهده شوند انجام شود.

طرح تراکنش دو فاز و سه فاز امکان پذیر است. دومی پیچیده تر است و به میزان محدودی استفاده می شود (مثلاً در سیستم مدیریت پایگاه داده توزیع شده SDD-1) و بعداً مورد بحث قرار خواهد گرفت. اکنون بیایید در مورد طرح تراکنش دو فازی پرکاربرد صحبت کنیم.

بازگشت (بازیابی) می تواند سریع، میان مدت یا طولانی مدت باشد. برای دو مورد اول، حالت قبلی (نقاط ثابت) تنظیم شده است، برای آخرین - نقاط کنترل. نقاط بازرسی برای روند بازیابی پایگاه داده پس از یک شکست جدی در نظر گرفته شده است و به صورت دوره ای تنظیم می شوند (به عنوان مثال، در فواصل زمانی 2 تا 3 ثانیه). فاصله زمانی تعیین می شود که پایگاه داده یا رایانه تنظیم شود.

بیایید به حالت چند کاربره برویم (شکل 4.11).
در اینجا، وظیفه همگام سازی فرآیندها با تعامل چندین کاربر پیچیده می شود.

برای هر تراکنش TP، دو گروه از اقدامات ممکن است:

    1) تغییر حالت (رکورد) - R؛

    2) حالت خواندن (خواندن) - W.

برای دو تراکنش متقابل TP 1 و TP 2 موارد زیر امکان پذیر است.

    تغییر همزمان TP 1 و TP 2، با احتمال همپوشانی داده ها (از دست دادن به روز رسانی) یا خطا در اولین تراکنش (وابستگی به بازیابی).

    تغییر R 1 و خواندن W 2 با دو پیامد احتمالی:

    الف) تغییر با استفاده از TP 1 مقدار خوانده شده توسط TP 2 (بازتولیدپذیری خواندن).

    ب) قبل از پایان TP 1 به عقب برگردید (چون هیچ تغییری در TP 2 وجود ندارد) و TP 1 را به حالت قبلی خود برگردانید.

    TP 1 را بخوانید و TP 2 را تغییر دهید (بدون تضمین تکرارپذیری).

برای از بین بردن این پدیده های نامطلوب، روش های کنترلی زیر امکان پذیر است.

    مسدود کردن انحصاری یا توافقی است.

    تغییرات معوق

    صحافی توسط مهرهای زمانی عملیات کامپیوتر (زمان صحافی) و طرح تراکنش سه فاز.

روش دوم به ندرت مورد استفاده قرار می گیرد. روش سوم را هنگام مطالعه پایگاه های داده توزیع شده در نظر خواهیم گرفت، اما در اینجا به روش اول می پردازیم.

قفل کردن فقط روی یک تراکنش و یک شی انجام می شود.

هنگام اجرای تراکنش ها به صورت متوالی (در طول زمان)، هیچ گونه نقض یکپارچگی وجود ندارد، اما چنین اجرایی مستلزم زمان زیادی است. در این راستا از حالت به اصطلاح موازی (موازی) استفاده می شود. مفهوم "تراکنش به درستی اجرا شده" معرفی شده است.

    قبل از پردازش یک شی، باید قفل شود.

    پس از پردازش، شی باید قفل آن باز شود.

    قفل قبل از باز کردن قفل نباید دوباره قفل شود.

    یک شی باز شده نباید آزاد شود.

برای اجرای موازی

برای غلبه بر بن بست ها با قفل انحصاری، خروجی های زیر امکان پذیر است:

هنگام استفاده از قفل های مذاکره می توانید:

    1) هشدار مسدود کردن برای کل منطقه؛

    2) مسدود کردن بخشی از منطقه مرتبط با این معامله.

چرخه حیات سیستم های اطلاعاتی

تجزیه و تحلیل وضعیت (پیچیدگی توسعه IS، استفاده ناکارآمد از IS) انجام شده توسط دانشمندان نشان داد که این وضعیت ناشی از این واقعیت است که الزامات بسیار مهم در طول توسعه نرم افزار برآورده نشده است:

· عدم مشخصات کامل کلیه الزامات.

· فقدان روش شناسی قابل قبول (سیستم روش ها) برای توسعه IS.

· عدم تقسیم پروژه کلی جهانی به اجزای جداگانه ای که بتوان به طور موثر کنترل و مدیریت کرد.

چرخه حیات (LC) سیستم های اطلاعاتی یک رویکرد ساختاریافته برای توسعه نرم افزار است.

(برخی نمودار) برای 09.26.12

1. برنامه ریزی برای توسعه IS. اقدامات مقدماتی که به شما امکان می دهد مراحل چرخه حیات IS را با حداکثر کارایی پیاده سازی کنید. سه مؤلفه اصلی: برآورد دامنه کار. ارزیابی منابع مورد نیاز؛ برآورد هزینه کل پروژه

2. تعیین نیازهای سیستم. محدوده و مرزهای برنامه پایگاه داده، عملکردهای آن، کاربران و حوزه های کاربردی آن را تعیین کنید.

3. جمع آوری و تجزیه و تحلیل نیازهای کاربر. جمع آوری و تجزیه و تحلیل اطلاعات مربوط به آن بخش از سازمان که کار آن توسط IS ایجاد شده پشتیبانی می شود و نیازهای کاربر برای سیستم را تعیین می کند. منابع: نظرسنجی و پرسشنامه مشاهده؛ مطالعه اسناد؛ تجربه قبلی.

4. طراحی پایگاه داده. ایجاد پروژه پایگاه داده دو رویکرد اصلی برای طراحی سیستم های پایگاه داده: نزولی"و" صعودی».

5. انتخاب DBMS هدف. انتخاب نوع مناسب DBMS برای پشتیبانی از برنامه پایگاه داده در حال ایجاد.

6. توسعه برنامه. طراحی رابط کاربری و برنامه های کاربردی طراحی شده برای کار با پایگاه داده.

7. ایجاد یک نمونه اولیه. ایجاد یک مدل کاری از یک برنامه پایگاه داده

8. اجرا. پیاده سازی فیزیکی پایگاه داده و برنامه های کاربردی توسعه یافته.

9. تبدیل و بارگذاری داده ها. انتقال داده های موجود به یک پایگاه داده جدید، بارگیری و اصلاح برنامه های کاربردی موجود به منظور سازماندهی همکاری با پایگاه داده جدید.



10. آزمایش. فرآیند اجرای برنامه های کاربردی برای یافتن خطاها. استراتژی های تست: تست از بالا به پایین. تست از پایین به بالا؛ تست جریان؛ تست فشرده

11. بهره برداری و نگهداری. نظارت بر سیستم و پشتیبانی از عملکرد عادی آن: نظارت بر عملکرد. نگهداری و نوسازی برنامه های کاربردی

نظریه پایگاه داده رابطه ای

واژه شناسی

در سال 1970، مدل رابطه ای برای اولین بار توسط E.F. کاد.

در یک DBMS رابطه ای، فرض بر این است که کاربر پایگاه داده را به عنوان مجموعه ای از جداول (و نه در غیر این صورت) درک می کند.

روابط ریاضی

تئوری پایگاه های داده رابطه ای مبتنی بر نظریه ریاضی روابط است.

اجازه دهید D1، D2، ... Dn چند مجموعه باشند.

محصول دکارتی D1 D2 … Dn = ((X1,X2,…,Xn) | X1 D1, X2 D2, … Xn Dn)

رابطه – زیر مجموعه R D1*D2*…*Dn

به عنوان مثال، n=2، D1=(2،4) و D2=(1،3،5)، D1 * D2 = ((2،1)، (2،3)، (2،5)، (4) ، 1)، (4،3)، (4،5))، R=((2،1)، (4،1))

زیر مجموعه m.b. با یک شرط مشخص می شود، برای مثال:

R=((x1,x2) |x1 D1, x2 D2, X2=1, A1, A2, … An – نام صفات با دامنه های D1, D2, … VTB سپس رابطه را به شکل زیر می نویسیم:

R(A1:D1،A2:D2،…An:Dn)

خواص روابط:

· رابطه یک نام منحصر به فرد دارد.

· هر ویژگی یک نام منحصر به فرد (در رابطه) دارد.

· هر سلول رابطه فقط حاوی یک مقدار اتمی است و هیچ گروه تکراری وجود ندارد (رابطه نرمال شده است).

D1 - دانش آموزان
D2 – رشته ها: ریاضیات، علوم کامپیوتر

· ترتیب صفات مهم نیست.

· ترتیب تاپل ها دلخواه است.

· هر تاپل منحصر به فرد است.

کلیدهای رابطه ای

کلیدهای رابطه ای برای شناسایی منحصر به فرد یک تاپلی که ارتباط بین روابط را توصیف می کند، خدمت می کنند.

یکپارچگی رابطه.

جبر رابطه ای

نتیجه یک عملیات می تواند به عنوان یک عملوند برای عملیات دیگری استفاده شود که به شما امکان می دهد عبارات تودرتو ایجاد کنید (بستن PA).

جبر رابطه ای زبانی است که در آن تمامی تاپل ها با یک فرمان پردازش می شوند.

پنج عملیات اساسی:

· نمونه برداری،

· فرافکنی،

· ضرب دکارتی،

· یک انجمن،

· تفاوت.

بر اساس این عملیات، موارد دیگری را می توان به دست آورد:

· اتصالات،

· تقاطع ها،

· تقسیمات.

گزاره می تواند از علائم عملگر منطقی ^(And)، v(Or)، ~(not) استفاده کند.

مثال. لیستی از همه کارمندان با حقوق بالای 300 دریافت کنید.

فرافکنی.

رابطه‌ای را تعریف می‌کند که ویژگی‌های آن attr1، ...، atrn هستند و فقط شامل تاپل‌های منحصربه‌فرد هستند.

ضرب دکارتی

محصول دکارتی به ندرت مورد استفاده قرار می گیرد، نمونه برداری بر روی نتیجه اعمال می شود.

یک انجمن

تفاوت

عملیات اتصال

اتصال تتا

اتصال طبیعی

پیوستن بیرونی

سپس با یک اتصال بیرونی سمت چپ، تمام اطلاعات اصلی از رابطه R حفظ می شود.به طور مشابه، می توانید یک اتصال بیرونی راست نیز تعریف کنید.

نیمه پیوستن

عملیات نیمه اتصال را می توان با استفاده از عملگرهای طرح ریزی و پیوستن تعریف کرد.

تقاطع

نمایندگی

هدف از نمایندگی:

· یک مکانیسم انعطاف پذیر برای محافظت از پایگاه داده با پنهان کردن برخی از بخش های آن از کاربران خاص ارائه می دهد.

· به شما امکان می دهد دسترسی کاربر به داده ها را به راحت ترین روش برای آنها سازماندهی کنید.

· به شما امکان می دهد عملیات پیچیده را با روابط اولیه ساده کنید.

قوانینی که باید رعایت شود
DBMS رابطه ای

برای تعیین اینکه آیا یک SBA رابطه ای است یا خیر، کاد (1985) 13 قانون را پیشنهاد کرد که آنها باید رعایت کنند.

قانون
قانون اساسی. یک DBMS رابطه‌ای باید بتواند پایگاه‌های داده را تنها با استفاده از توابع رابطه‌ای خود مدیریت کند
ارائه اطلاعات. تمام اطلاعات در یک پایگاه داده رابطه ای به صراحت در سطح منطقی تنها به یک روش ارائه می شود - در قالب مقادیر در جداول. از جمله متادیتا.
دسترسی تضمینی هر مورد داده در یک پایگاه داده رابطه ای باید تضمین شود که دسترسی منطقی بر اساس ترکیب نام جدول، مقدار کلید اولیه و نام ستون داشته باشد.
پشتیبانی پوچ DBMS از مقادیر null پشتیبانی می کند.
دایرکتوری سیستم رابطه ای توضیحات پایگاه داده باید در سطح منطقی به روشی مشابه داده های معمولی نمایش داده شود و به کاربران اجازه دهد از همان زبان رابطه ای برای دسترسی به آن استفاده کنند.
زیرزبان داده های جامع. یک DBMS رابطه ای می تواند چندین زبان را پشتیبانی کند. با این حال، باید حداقل یک زبان وجود داشته باشد که اپراتورهای آن اجازه دهند توابع زیر انجام شوند: 1. تعریف داده. 2. تعریف نمایندگی ها; 3. دستورات دستکاری داده ها. 4. محدودیت های یکپارچگی; 5. مجوزهای کاربر. 6. سازمان معاملات
عملیات استخراج، درج، حذف، به روز رسانی سطح بالا. توانایی یک DBMS برای انجام عملیات بازیابی اطلاعات دستورات درج، حذف و به روز رسانی به عنوان یک عملیات واحد.
استقلال داده های فیزیکی از روش ذخیره سازی
استقلال داده های منطقی استقلال برنامه ها از تغییرات در جداول پایه.
استقلال محدودیت های یکپارچگی محدودیت های یکپارچگی باید در یک زیرزبان داده رابطه ای تعریف شده و در دایرکتوری سیستم ذخیره شود تا در برنامه های کاربردی.
استقلال از توزیع داده ها
بدون قانون دور زدن اگر DBMS دارای یک زبان سطح پایین (با پردازش متوالی ردیف) باشد، نباید اجازه عبور از قوانین یکپارچگی و محدودیت های توصیف شده در زبان رابطه ای سطح بالا را بدهد.

مدل سازی داده ها بر اساس فرآیند نرمال سازی

هدف از عادی سازی.

فرآیند عادی سازی در سال 1972 توسط E. F. Codd پیشنهاد شد - سه شکل عادی (NF): اول (1NF)، دوم (2NF) و سوم (3NF).

تعریف دقیق تری از NF سوم (R. Boyce and E. F. Codd, 1974) شکل نرمال Boyce-Codd (BCNF) است.

افزونگی داده ها و ناهنجاری های پردازش.

عدم عادی سازی منجر به موارد زیر می شود:

افزونگی داده ها

· ناهنجاری های درج (عدم امکان افزودن سوابق)

· ناهنجاری های حذف (هنگامی که اطلاعات حذف می شوند، سایر اطلاعات از بین می روند)

· به روز رسانی ناهنجاری ها (بسیاری از رکوردها نیاز به به روز رسانی دارند)

· خواص حفظ بدون تلفات و حفظ وابستگی.

وابستگی های عملکردی

برنامه نویسی در محیط دلفی 6

پایگاه داده. یک گزارش با استفاده از Word ایجاد کنید.

مصوب شورای تحریریه و انتشارات

دانشگاه به عنوان کارگاه آزمایشگاهی

ورونژ 2004


UDC 681.3

Vorobyov E.I., Korotkevich D.E.. برنامه نویسی در محیط دلفی 6: کارگاه آزمایشگاهی: قسمت 2: پایگاه های داده. یک گزارش با استفاده از Word ایجاد کنید. جریان ها. ورونژ: ورونژ. حالت فن آوری Univ., 2004. 107 p.

در بخش دوم کارگاه آزمایشگاهی اطلاعات تئوری و عملی برای نوشتن برنامه در محیط دلفی 6 با موضوع: طراحی پایگاه داده، ایجاد گزارش در Word و استفاده از نخ ها هنگام ایجاد برنامه های کاربردی با کارایی بالا، مورد بحث و بررسی قرار می گیرد.

این نشریه الزامات استاندارد آموزشی دولتی آموزش عالی حرفه ای را در جهت 230100 "انفورماتیک و علوم کامپیوتر"، تخصص 230104 "سیستم های طراحی به کمک کامپیوتر"، رشته "برنامه نویسی در زبان های سطح بالا" برآورده می کند.

جدول 3. ایل. 19. کتابشناسی: 7 عنوان.

ویراستار علمی: دکتر تک. علوم، پروفسور بله لوویچ

داوران: گروه علوم کامپیوتر، آکادمی جنگلداری ورونژ (رئیس بخش، دکترای علوم فنی، پروفسور V.E. Mezhov)؛

دکتر فنی. علوم، پروفسور O.Yu.Makarov

© Vorobyov E.I.، Korotkevich D.E.، 2004

© طراحی. ایالت ورونژ

دانشگاه فنی، 1383


معرفی

مفهوم پایگاه داده

پایگاه داده ها مزیت اصلی دلفی محسوب می شوند. حتی زبان های تخصصی برای کار با پایگاه های داده (مانند MS Visual FoxPro) به وضوح از نظر سادگی و قدرت برنامه نویسی برای این نوع برنامه ها پایین تر هستند. دلفی تمام پیچیدگی ها را پنهان می کند و در عین حال بیشترین قدرت را می دهد. هرگز کاری که نتوان آن را در دلفی در مدت زمان کوتاهی اجرا کرد، وجود نداشته است. و نکته اصلی این است که همه اینها بسیار راحت و قابل درک است. در دلفی شما می توانید برنامه های کاربردی ساده، حتی با پایگاه داده های پیچیده، بدون یک خط کد ایجاد کنید. این آموزش وظایف آزمایشگاهی برای تسلط بر تکنیک های کار با پایگاه های داده محلی را پوشش می دهد.

نظریه پایگاه داده رابطه ای

ده سال پیش، برنامه نویسی پایگاه داده کار بسیار دشواری بود. امروزه تصور کردن آن دشوار است، زیرا به لطف دلفی روند نوشتن برنامه ها ساده شده است و تعداد انواع پایگاه داده در حال حاضر ده ها است.

پایگاه‌های داده به دو دسته محلی (نصب شده بر روی رایانه مشتری، جایی که برنامه اجرا می‌شود) و از راه دور (نصب شده روی سرور، رایانه راه دور) تقسیم می‌شوند. پایگاه داده های سرور بر روی یک کامپیوتر راه دور قرار دارند و تحت کنترل نرم افزار سرور اجرا می شوند. از مزایای اصلی آنها می توان به توانایی کار با یک پایگاه داده به طور همزمان توسط چندین کاربر و در عین حال حداقل بار روی شبکه اشاره کرد. همچنین پایگاه های داده شبکه ای وجود دارند که بار زیادی را در شبکه ایجاد می کنند و استفاده از آنها برای برنامه نویس و کاربر نهایی ناخوشایند است. هنگامی که یک برنامه به پایگاه داده شبکه متصل می شود، یک نسخه تقریبا کامل از آن را از سرور دانلود می کند. اگر تغییراتی ایجاد کردید، نسخه شما به طور کامل دانلود می شود. این بسیار ناخوشایند است زیرا به دلیل انتقال بیش از حد داده، بار زیادی در شبکه ایجاد می کند. در فناوری کلاینت-سرور، برنامه کلاینت یک درخواست متنی ساده را برای دریافت مقداری داده به سرور ارسال می کند. سرور آن را پردازش می کند و تنها بخش مورد نیاز از داده ها را برمی گرداند. هنگامی که نیاز به تغییر برخی از داده ها دارید، مجدداً درخواستی برای تغییر آن به سرور ارسال می شود و سرور داده های موجود در پایگاه داده خود را تغییر می دهد. بنابراین، عمدتاً فقط درخواست‌های متنی از طریق شبکه منتقل می‌شوند که معمولاً کمتر از یک کیلوبایت را اشغال می‌کنند. تمام داده ها توسط سرور پردازش می شوند، به این معنی که دستگاه مشتری بسیار کمتر بارگیری می شود و نیازی به منابع ندارد. سرور فقط ضروری ترین داده ها را برای مشتری ارسال می کند، به این معنی که دانلود غیرضروری از یک نسخه از کل پایگاه داده وجود ندارد. با تشکر از همه اینها، پایگاه داده های شبکه قبلا قدیمی شده اند و عملاً استفاده نمی شوند. آنها تقریباً به طور کامل با فناوری مشتری-سرور جایگزین شده اند. اما پایگاه داده های محلی همیشه زنده خواهند بود. قالب ذخیره سازی آنها ممکن است تغییر کند یا برخی از توابع جدید اضافه شوند، اما خود پایگاه داده ها وجود خواهند داشت. برای بررسی بیشتر، ما باید یک مفهوم جدید را تعریف کنیم - جدول. تاکنون فقط اصول کلی مطرح شده است، بنابراین از مفهوم کلی استفاده شده است پایگاه های داده. جدول پایگاه داده مانند یک آرایه دو بعدی است که در آن داده ها در یک ستون مرتب شده اند (نمونه اصلی جدول اکسل است). یک پایگاه داده، به طور کلی، فقط یک فایل است که می تواند از یک تا چندین جدول را ذخیره کند. اکثر پایگاه های داده محلی فقط می توانند یک جدول (dBase، Paradox، XML) را ذخیره کنند. اما نمایندگانی از پایگاه های داده محلی وجود دارند که در آن چندین جدول در یک فایل وجود دارد (به عنوان مثال، Access).

پایگاه های داده محلی

در بین پایگاه های داده محلی، بیایید پایگاه های اطلاعاتی رابطه ای را به عنوان رایج ترین آنها در نظر بگیریم. پایگاه داده رابطه ای چیست؟ این جدولی است که در آن ستون ها نام داده های ذخیره شده در آن هستند و هر ردیف خود داده ها را ذخیره می کند. یک جدول پایگاه داده شبیه به صفحه گسترده اکسل است (به طور دقیق تر، اکسل داده های خود را در قالبی اختصاصی بر اساس فناوری پایگاه داده ذخیره می کند). جداول پایگاه داده محلی را می توان بر روی یک هارد دیسک محلی یا به صورت مرکزی در یک درایو شبکه در یک سرور فایل ذخیره کرد. این فایل ها را می توان با استفاده از ابزارهای استاندارد مانند هر فایل دیگری کپی کرد، زیرا جداول پایگاه داده خود به مکان خاصی گره خورده نیستند. نکته اصلی این است که برنامه بتواند جدول را پیدا کند. هر جدول باید یک فیلد منحصر به فرد داشته باشد که ردیف را به طور منحصر به فرد شناسایی کند. این فیلد را فیلد کلید می نامند. این فیلدها اغلب برای پیوند دادن چندین جدول به یکدیگر استفاده می شوند. اما حتی اگر جدول مرتبط نباشد، همچنان فیلد کلید مورد نیاز است. توصیه می شود از نوع عددی به عنوان کلید استفاده کنید و اگر پایگاه داده اجازه می دهد، بهتر است از نوع "افزایش خودکار" (به طور خودکار افزایش/کاهش عدد یا شمارنده) باشد. نام ستون ها در جدول پایگاه داده نیز باید منحصر به فرد باشد، اما در این مورد لزوما عددی نیست. آنها را می توان هر طور که می خواهید نامید، به شرطی که منحصر به فرد و قابل درک باشد. هر ستون (فیلد پایگاه داده) باید نوع خاصی داشته باشد. تعداد انواع و انواع آنها به نوع پایگاه داده بستگی دارد، به عنوان مثال، فرمت dBASE (فایل هایی با پسوند DBF) تنها از 6 نوع پشتیبانی می کند، و Paradox در حال حاضر تا 15 نوع را پشتیبانی می کند. پایگاه داده را می توان در یک فایل ذخیره کرد (Access) ) یا در چندین (Paradox, dBase). به طور دقیق تر، داده های جدول همیشه در یک فایل ذخیره می شود، اما اطلاعات اضافی را می توان در فایل های جداگانه قرار داد. اطلاعات اضافی ممکن است شامل شاخص‌ها، محدودیت‌ها یا فهرستی از مقادیر پیش‌فرض برای فیلدهای خاص باشد. اگر حداقل یکی از فایل ها خراب شود یا حذف شود، ممکن است داده ها برای ویرایش در دسترس نباشند.

چه اتفاقی افتاده است شاخص ها? اغلب، داده‌های جداول دستخوش تغییراتی می‌شوند، بنابراین قبل از ویرایش هر ردیف، باید آن را پیدا کنید. حتی جداول استاتیکی که به عنوان کتاب مرجع استفاده می شوند نیز قبل از نمایش داده های درخواستی تحت عملیات جستجو قرار می گیرند. جستجو یک عملیات نسبتا وقت گیر است، به خصوص اگر جدول حاوی ردیف های زیادی باشد. شاخص ها با هدف سرعت بخشیدن به این رویه هستند و همچنین می توانند به عنوان نقطه شروع برای مرتب سازی استفاده شوند. در این مرحله کافی است بدانید که فیلد فهرست نشده قابل سفارش نیست.

اگر به جدولی نیاز دارید که توسط فیلد مرتب شود " نام خانوادگی"، سپس این فیلد ابتدا باید ایندکس شود. سپس فقط باید نشان دهید که جدول اکنون باید با فلان شاخص کار کند و به طور خودکار مرتب می شود.

در یک پایگاه داده به خوبی طراحی شده، افزونگی داده ها حذف می شود و احتمال ذخیره داده های ناسازگار به حداقل می رسد. بنابراین، ایجاد پایگاه های داده دو هدف اصلی دارد: کاهش افزونگی داده ها و افزایش قابلیت اطمینان آنها.

چرخه عمر هر محصول نرم افزاری، از جمله سیستم مدیریت پایگاه داده، (عمدتاً) از مراحل طراحی، پیاده سازی و بهره برداری است.

به طور طبیعی، مهم ترین عامل در چرخه عمر یک برنامه پایگاه داده، مرحله طراحی است. عملکرد سیستم و غنای اطلاعاتی آن، و در نتیجه طول عمر آن، به این بستگی دارد که ساختار پایگاه داده با چه دقتی در نظر گرفته شده است و ارتباطات بین عناصر آن چقدر واضح تعریف شده است.

الزامات پایگاه داده

بنابراین، یک پایگاه داده به خوبی طراحی شده است:

1. تمام نیازهای کاربر برای محتوای پایگاه داده را برآورده می کند. قبل از طراحی پایگاه داده، لازم است تحقیقات گسترده ای در مورد نیازهای کاربر برای عملکرد پایگاه داده انجام شود.

2. ثبات و یکپارچگی داده ها را تضمین می کند. هنگام طراحی جداول، باید ویژگی های آن ها و قوانینی را تعریف کنید که امکان وارد کردن مقادیر نادرست توسط کاربر را محدود می کند. برای تأیید داده ها قبل از نوشتن مستقیم آنها در جدول، پایگاه داده باید قوانین مدل داده را فراخوانی کند و در نتیجه اطمینان حاصل شود که یکپارچگی اطلاعات حفظ می شود.

3. ساختار طبیعی و قابل درک اطلاعات را فراهم می کند. ساخت پایگاه داده با کیفیت بالا به شما امکان می دهد پرس و جوهای پایگاه داده را شفاف تر و درک آن آسان تر کنید. در نتیجه، احتمال ورود داده های نادرست کاهش می یابد و کیفیت نگهداری پایگاه داده بهبود می یابد.

4. الزامات عملکرد پایگاه داده کاربران را برآورده می کند. با حجم زیاد اطلاعات، مسائل مربوط به حفظ بهره وری

شروع به ایفای نقش اصلی می کند و بلافاصله تمام کاستی های مرحله طراحی را " برجسته می کند".

نکات زیر بیانگر مراحل اساسی طراحی پایگاه داده است:

1. نیازهای اطلاعاتی پایگاه داده را تعیین کنید.

2. اشیاء دنیای واقعی را که نیاز به مدل سازی در پایگاه داده دارند، تجزیه و تحلیل کنید. از این اشیا، موجودیت‌ها و ویژگی‌های این موجودیت‌ها را تشکیل دهید (مثلاً برای موجودیت «بخش»، ویژگی‌ها می‌تواند «نام»، «رنگ»، «وزن» و غیره باشد) و فهرستی از آنها را تشکیل دهید.

3. موجودیت ها و ویژگی ها - جداول و ستون ها (فیلدها) را در نماد DBMS که انتخاب کرده اید مطابقت دهید (Paradox، dBase، FoxPro، Access، Clipper، InterBase، Sybase، Informix، Oracle، و غیره).

4. ویژگی هایی را که به طور منحصر به فرد هر شی را شناسایی می کنند، تعریف کنید.

5. قوانینی را ایجاد کنید که یکپارچگی داده ها را ایجاد و حفظ کند.

6. ایجاد ارتباط بین اشیا (جدول و ستون)، عادی سازی جداول.

7. برای مسائل مربوط به قابلیت اطمینان داده ها و در صورت لزوم حفظ محرمانه بودن اطلاعات برنامه ریزی کنید.


اطلاعات مربوطه.


پایگاه داده مجموعه ای از داده های مرتبط سازماندهی شده بر اساس قوانین خاصی است که اصول کلی را برای توصیف، ذخیره سازی و دستکاری، مستقل از برنامه های کاربردی ارائه می کند. پایگاه داده رابطه ای پایگاهی است که در آن اطلاعات به صورت جداول دو بعدی ذخیره شده در فایل ها ارائه می شود. یک جدول از ردیف هایی به نام رکورد و رکوردها از ستون هایی به نام فیلد تشکیل شده است.

سیستم مدیریت پایگاه داده (DBMS) مجموعه ای از زبان ها و ابزارهای نرم افزاری است که برای ایجاد، نگهداری و اشتراک گذاری پایگاه داده با بسیاری از کاربران طراحی شده است. کاربران DBMS را می توان به سه گروه بزرگ تقسیم کرد:

  • توسعه دهندگان پایگاه داده مسئول نوشتن برنامه های کاربردی هستند که از پایگاه داده استفاده می کنند.
  • کاربران نهایی یا از طریق برخی از سیستم های اطلاعاتی یا رابط کاربری یک سیستم مدیریت پایگاه داده با پایگاه داده کار می کنند.
  • مدیران پایگاه داده از نگهداری پایگاه داده، ایمنی و امنیت داده ها و پیکربندی پایگاه داده اطمینان حاصل می کنند.

معماری پایه یک DBMS یک مدل سه سطحی است که در آن DBMS به صورت متشکل از یک سطح خارجی، مفهومی و داخلی نمایش داده می شود. در سطح خارجی، محتوای DBMS همانطور که توسط یک کاربر مشاهده می شود، ارائه می شود. در سطح مفهومی، داده های DBMS در یک مدل تعمیم یافته از حوزه موضوعی که سیستم اطلاعاتی برای آن ایجاد شده است، توصیف می شود. سطح داخلی داده های واقعی موجود در فایل ها است. DBMS همچنین یک فرهنگ لغت داده حاوی اطلاعاتی در مورد هر چیزی که در پایگاه داده ذخیره می شود (نام همه جداول و نماها، رویه ها و محرک های ذخیره شده، حساب های کاربری DBMS و غیره) نگهداری می کند. اطلاعاتی از این نوع معمولاً ابرداده نامیده می شوند.

مدل داده های رابطه ای مبتنی بر اصول ریاضی نظریه مجموعه ها و منطق ریاضی است. این اصول اولین بار برای مدل سازی داده ها در دهه 1960 توسط Codd مورد استفاده قرار گرفت. مدل رابطه ای تعریف می کند که چگونه داده ها می توانند نمایش داده شوند (ساختار داده)، چگونه داده ها را می توان از تغییرات نادرست محافظت کرد (یکپارچگی داده)، و چه عملیاتی را می توان روی داده ها انجام داد (عملیات داده). مفاهیم اساسی مدل رابطه ای:

  • تمام داده ها به صورت مفهومی به صورت مجموعه ای مرتب از ردیف ها و ستون ها به نام رابطه نمایش داده می شوند.
  • همه داده ها اسکالر هستند.
  • یک ردیف از داده ها را تاپل، تعداد تاپل ها را عدد اصلی می نامند.
  • هر ستون در یک تاپل یک ویژگی نامیده می شود، تعداد ویژگی ها درجه رابطه نامیده می شود.
  • عدم وجود اطلاعات با مقدار NULL توصیف می شود.
  • یک کلید بالقوه K برای یک رابطه R زیرمجموعه ای از مجموعه ویژگی های R است که همیشه دارای خاصیت منحصر به فرد بودن است (یعنی هیچ دو تاپلی در رابطه R با مقدار K یکسان وجود ندارد) و خاصیت غیر افزونگی (یعنی. ، هیچ زیر مجموعه ای از K خاصیت منحصر به فرد بودن را ندارد). کلید کاندید متشکل از بیش از یک ویژگی را کلید ترکیبی و کلید کاندید متشکل از یک ویژگی را کلید ساده می نامند. کلید اولیه یک کلید کاندید است که توسط آن تاپل های یک رابطه به صورت فیزیکی مرتب می شوند.
  • یک کلید خارجی به صورت زیر تعریف می شود. بگذارید R2 یک رابطه باشد. سپس کلید خارجی FK در رابطه R2 زیرمجموعه ای از مجموعه ویژگی های R2 است به طوری که یک رابطه R1 با یک کلید بالقوه K وجود دارد و مقدار FK در هر تاپلی R2 همیشه با مقدار K برخی از تاپل ها در R1 مطابقت دارد. محدودیتی که مقادیر یک کلید خارجی باید با مقادیر کلید کاندید مربوطه مناسب باشد، محدودیت مرجع نامیده می شود. بر این اساس، یکپارچگی ارجاعی به این شرط اشاره دارد که هیچ گونه نقض محدودیت های ارجاعی در پایگاه داده وجود نداشته باشد.

عملیات زیر روی داده ها در مدل رابطه ای مجاز است:

  • یک انتخاب، رابطه ای را برمی گرداند که شامل تمام تاپل های یک رابطه معین است که شرایط خاصی را برآورده می کنند.
  • پروجکشن رابطه‌ای را برمی‌گرداند که شامل همه چند تاپل از رابطه داده شده پس از حذف برخی از ویژگی‌ها از آن است.
  • محصول یک رابطه حاوی تاپل ها را برمی گرداند که همه ترکیبات ممکن از تاپل ها متعلق به دو رابطه اصلی هستند.
  • یک اتحادیه رابطه ای را برمی گرداند که شامل تمام تاپل های متعلق به دو رابطه اصلی است.
  • join رابطه‌ای را برمی‌گرداند که تاپل‌های آن اتحاد دو تاپل است که به روابط مبدأ تعلق دارند و برای یک یا چند ویژگی از روابط مبدا مقدار مشترکی دارند. در این حالت، مقدار کلی ویژگی ها تنها یک بار در تاپل حاصل می شود.

1.5.1. پایگاه های داده و سیستم های مدیریت پایگاه داده. برای حل مشکلات بازیابی اطلاعات، از دهه 60 تا 70 قرن بیستم، از ارائه ساختاری اطلاعات مربوط به حوزه موضوعی مورد بررسی استفاده شده است. ساختار اطلاعات با استفاده از نوع خاصی از مدل های نمایش داده انجام می شود که ویژگی های اشیاء اطلاعاتی و ارتباطات موجود بین آنها را منعکس می کند.

شرح اشیاء اطلاعاتی و ارتباطات بین آنها در سطح مفهومی بالا با استفاده از نمودارهای ER ساخته شده است (به بخش??? در پیوست مراجعه کنید). این بخش ساخت مدل هایی از خود اشیاء اطلاعاتی را مورد بحث قرار می دهد (از این به بعد فقط مدل های اطلاعاتی) که با سطح منطقی بعدی طراحی IS پس از سطح مفهومی، منطقی مطابقت دارند و مبنایی برای حل مسائل بازیابی اطلاعات، تحلیل اطلاعات و سایر مسائل هستند. .

سه نوع مدل ساختاری یا به قول خودشان نمایش داده وجود دارد: شبکه ای، سلسله مراتبی و رابطه ای. مدل رابطه ای نمایش داده ها در حال حاضر به دلیل سادگی، طبیعی بودن ادراک و همچنین در دسترس بودن ابزارهای ریاضی و نرم افزاری توسعه یافته برای کار با این مدل و جنبه های دیگر رایج ترین است. در آینده، تنها مدل های رابطه ای از اشیاء اطلاعاتی در نظر گرفته خواهد شد.

استفاده از مدل های ساختار یافته کاربر پسند برای ارائه اطلاعات منجر به تقسیم مدل های ذخیره سازی اطلاعات در رایانه به بازی فکریمدل ها و فیزیکیمدل ها. این دلیلی برای ظهور رویکردی اساساً جدید برای سازماندهی ذخیره سازی اطلاعات ساختاریافته به نام مفهوم بود. پایگاه های داده. در حال حاضر، پایگاه داده ها روش اصلی (اگر نه تنها) ذخیره سازی اطلاعات هستند که در عمل مورد استفاده قرار می گیرند.

مدل منطقیمنعکس کننده ساختار منطقی داده های ترکیب شده در یک شی اطلاعاتی واحد است. علاوه بر این، مدل داده های منطقی زیربنای زبان دستکاری داده ها است که با کمک آن کاربر درخواست هایی برای جستجو، به روز رسانی اطلاعات و غیره ایجاد می کند.

مدل فیزیکیمنعکس کننده قرارگیری واقعی اطلاعات در رسانه های فیزیکی (دستگاه های ذخیره سازی خارجی: هارد دیسک، درایو نوری و غیره) است. برای توصیف آنها از مدل های فایل استفاده می شود که زنجیره های خطی ساختار یافته از نمادها هستند.

معیار اثربخشی مدل‌های منطقی، توانایی پیاده‌سازی طیف وسیعی از پرس‌و‌جوها که معانی متفاوتی دارند، بر اساس آن‌ها است. معیار اثربخشی مدل های فیزیکی، استفاده منطقی از حافظه خارجی است.

به لطف تقسیم مدل های ذخیره سازی اطلاعات به منطقی و فیزیکی، می توان به طور جداگانه مشکل انتخاب زبان دستکاری داده ها و مشکل استفاده موثر از حافظه خارجی را در نظر گرفت.

چنین "جداسازی" این وظایف اجازه داد:

    استفاده از زبان های سطح بالا برای تشکیل پرس و جوهای غنی از نظر معنایی در پایگاه های داده؛

    اطمینان از افزایش حجم اطلاعات ذخیره شده در دستگاه های ذخیره سازی خارجی.

در نظر گرفتن جداگانه مدل های منطقی و فیزیکی اطلاعات در پایگاه های داده منجر به این واقعیت شد که کاربر هنگام ساخت مدل های اطلاعاتی حوزه های موضوعی، فقط با مدل های منطقی خود شروع به "کار" کرد. برای قرار دادن اطلاعات بر روی دستگاه های ذخیره سازی خارجی و اجرای عملیات دستکاری داده ها در سطح فیزیکی، ابزارهای نرم افزاری و سخت افزاری خاصی به نام سیستم های مدیریت پایگاه داده (DBMS) ایجاد شد. آنها به عنوان نوعی "واسط" بین مدل داده های منطقی و فیزیکی عمل می کنند. از این نظر، نقش یک DBMS مشابه نقش سیستم عامل ها است.

بنابراین، با کمک پایگاه‌های داده (DBs)، اطلاعات ساختاریافته (با استفاده از مدل داده‌های منطقی) در مورد حوزه موضوعی ذخیره می‌شود و با کمک یک DBMS این اطلاعات مدیریت می‌شود، یا به قول خودشان مدیریت پایگاه داده. این امکان را فراهم می کند:

    یک رابط کاربری مناسب برای ایجاد در اختیار کاربر قرار دهید:

    ساختار داده های منطقی (سطح طراحی منطقی پایگاه داده) با استفاده از زبان بلوک دیاگرام.

    ساختار فیزیکی داده ها (سطح طراحی فیزیکی پایگاه داده) با استفاده از زبان خاصی به نام زبان تعریف داده.

    طراحی به زبان درخواست ها، یا زبان دستکاری داده هادر یک DBMS خاص، درخواست های مختلف کاربر برای جستجو و پردازش اطلاعات به تصویب رسید.

    از ذخیره‌سازی طولانی‌مدت مقادیر زیادی از داده‌ها (اندازه‌گیری شده در گیگابایت یا بیشتر)، محافظت از آنها در برابر آسیب تصادفی یا استفاده غیرمجاز، و در عین حال اطمینان از به‌روزرسانی اطلاعات ذخیره‌شده در پایگاه داده اطمینان حاصل کنید.

    دسترسی توزیع شده به داده ها را برای چندین کاربر فراهم می کند که کارایی ذخیره و پردازش اطلاعات در پایگاه داده را در مقایسه با سیستم های فایل برای ذخیره و پردازش اطلاعات به طور قابل توجهی افزایش می دهد.

نظر 1. توسعه یک ساختار داده در سطح منطقی به شکل قابل درک برای توسعه دهنده انجام می شود (ابزارهای گرافیکی می توانند استفاده شوند) و به سطح فیزیکی اجرای ساختارهای داده مربوط نمی شود. در کنار بازنمایی درونی اشیا، بازنمایی بیرونی آن نیز وجود دارد. کاربران یک شی فقط تعریف خارجی آن را می بینند و به نحوه تعریف و عملکرد آن فکر نمی کنند. یکی از مزایای این رویکرد، یعنی انتزاع داده ها، این است که امکان تغییر تعریف داخلی یک شی بدون هیچ عواقبی برای کاربران آن وجود دارد، مشروط بر اینکه تعریف خارجی شیء بدون تغییر باقی بماند. به همین ترتیب، در رویکرد پایگاه داده، ساختار داده از برنامه های کاربردی جدا شده و در پایگاه داده ذخیره می شود. افزودن ساختارهای داده جدید یا تغییر ساختارهای موجود به هیچ وجه بر برنامه ها تأثیر نمی گذارد، مشروط بر اینکه مستقیماً به اجزای در حال تغییر وابسته نباشند. به عنوان مثال، افزودن یک فیلد جدید به یک رکورد یا ایجاد یک فایل جدید تأثیری بر برنامه های موجود نخواهد داشت. با این حال، حذف یک فیلد از فایلی که توسط یک برنامه استفاده می شود، آن برنامه را تحت تأثیر قرار می دهد و باید بر اساس آن اصلاح شود.

نظر 2. استفاده از زبان دستکاری داده ها بر اساس یک دستگاه مبتنی بر ریاضی، صحت کار با داده ها یا به عبارت دیگر قابل پیش بینی بودن را تضمین می کند.

نظر 3. استفاده از یک DBMS دسترسی کنترل شده به پایگاه داده را به دلیل وجود موارد زیر فراهم می کند:

    سیستم های امنیتی که از دسترسی غیرمجاز کاربران به پایگاه داده جلوگیری می کند.

    سیستم‌های پشتیبانی یکپارچگی داده‌ها که از وضعیت ثابت داده‌های ذخیره‌شده اطمینان می‌دهند.

    یک سیستم بازیابی که به شما امکان می دهد پایگاه داده را به حالت ثابت قبلی که به دلیل نقص سخت افزاری یا نرم افزاری مختل شده است بازیابی کنید.

نظر 4. با استفاده گسترده از شبکه های کامپیوتری، اهمیت و کاربرد DBMS ها بیش از پیش افزایش یافته است، زیرا DBMS ها دارای قابلیت های شبکه هستند. DBMS ها شامل سیستمی برای مدیریت عملیات موازی برنامه ها هستند که فرآیندهای دسترسی مشترک آنها به پایگاه داده را کنترل می کند. علاوه بر این، پیش نیاز اصلی برای توسعه سیستم هایی که از پایگاه های داده استفاده می کنند، تمایل به ترکیب تمام داده های پردازش شده در یک سازمان در یک کل واحد و ایجاد دسترسی کنترل شده به آن است. در حالی که یکپارچه سازی و دسترسی کنترل شده می تواند تمرکز را ارتقا دهد، تمرکز به خودی خود یک هدف نیست.

در عمل، ایجاد شبکه های کامپیوتری منجر به تمرکززدایی در پردازش داده ها می شود. رویکرد غیرمتمرکز اساساً ساختار سازمانی بسیاری از شرکت‌ها را منعکس می‌کند که به طور منطقی متشکل از بخش‌ها، بخش‌ها، تیم‌های پروژه و غیره جداگانه است که به صورت فیزیکی بین دفاتر، بخش‌ها، کارخانه‌ها یا شرکت‌های تابعه مختلف توزیع می‌شوند و هر واحد تولیدی جداگانه با مجموعه‌ای از خود سر و کار دارد. از داده های پردازش شده توسعه پایگاه های داده توزیع شده که ساختارهای سازمانی شرکت ها را منعکس می کند، این امکان را فراهم می کند که داده های نگهداری شده توسط هر یک از بخش های موجود در دسترس عموم قرار گیرد و در عین حال اطمینان حاصل شود که آنها در مکان هایی که اغلب استفاده می شوند ذخیره می شوند. این رویکرد توانایی به اشتراک گذاری اطلاعات را افزایش می دهد و در عین حال کارایی دسترسی به آن را افزایش می دهد.

در فرآیند تحقیقات علمی که دقیقاً به چگونگی ساختار یک DBMS اختصاص داشت، روش‌های پیاده‌سازی مختلفی پیشنهاد شد. قابل اجراترین آنها سیستم سازماندهی پایگاه داده سه سطحی است که توسط کمیته استانداردهای آمریکا ANSI (موسسه استانداردهای ملی آمریکا) پیشنهاد شده است که در شکل 1 نشان داده شده است. 3:

برنج. 3. مدل پایگاه داده سه لایه

سطح مدل خارجی- بالاترین سطح، که در آن هر مدل "دیدگاه" خود را از داده ها دارد. این سطح نمای پایگاه داده برنامه های کاربردی را مشخص می کند. هر برنامه فقط داده هایی را که برای آن برنامه خاص مورد نیاز است می بیند و پردازش می کند. به عنوان مثال، یک سیستم توزیع کار از اطلاعات مربوط به صلاحیت های یک کارمند استفاده می کند، اما علاقه ای به اطلاعات مربوط به حقوق، آدرس منزل و شماره تلفن کارمند ندارد و بالعکس، این اطلاعات است که در زیر سیستم منابع انسانی استفاده می شود.

سطح مفهومی- پیوند مرکزی، در اینجا پایگاه داده به کلی ترین شکل ارائه شده است که داده های استفاده شده توسط همه برنامه های کاربردی که با این پایگاه داده کار می کنند را ترکیب می کند. در واقع، سطح مفهومی منعکس کننده یک مدل تعمیم یافته از حوزه موضوعی (اشیاء دنیای واقعی) است که پایگاه داده برای آن ایجاد شده است. مانند هر مدلی، یک مدل مفهومی تنها ویژگی های مهم اشیاء را از نقطه نظر پردازش در دنیای واقعی منعکس می کند.

لایه فیزیکی- داده های واقعی موجود در فایل های موجود در رسانه های ذخیره سازی خارجی.

این معماری امکان استقلال منطقی (بین لایه های 1 و 2) و فیزیکی (بین لایه های 2 و 3) را هنگام کار با داده ها فراهم می کند. استقلال منطقی به معنای توانایی تغییر یک برنامه بدون تنظیم برنامه های دیگر است که با پایگاه داده مشابه کار می کنند. استقلال فیزیکی به معنای توانایی انتقال اطلاعات ذخیره شده از یک رسانه به رسانه دیگر و در عین حال حفظ عملکرد همه برنامه هایی است که با یک پایگاه داده کار می کنند. این دقیقاً همان چیزی است که هنگام استفاده از سیستم های فایل گم شده بود. شناسایی سطح مفهومی امکان توسعه یک دستگاه مدیریت پایگاه داده متمرکز را فراهم کرد.

1.5.2. مفهوم رابطه، ویژگی ها و ویژگی های اصلی آن. بلوک ساختاری اصلی سازنده و از نظر معنایی کامل (یعنی داشتن محتوای معنایی خاص در رابطه با حوزه موضوعی مورد بررسی) از پایگاه‌های داده رابطه‌ای است. نگرش.