پالایش شمای داده و صورت های نرمال Schema Refinement and Normal Forms
Chapter 19
مشکلات Redundancy
ذخیره تکراری
آنومالی به روز رسانی (Update)
آنومالی درج (Insert)
آنومالی حذف (Delete)
آنومالی در عملیات درج به هریک از سه وضع زیر گفته می شود:
عدم امکان انجام یک عمل (که منطقا باید قابل انجام باشد)
بروز پیامد بد پس از انجام یک عمل
بروز فزونکاری در سیستم در انجام یک عمل
صورتهای نرمال (Normal Form)
صورت نخست نرمال (1NF)
صورت دوم نرمال (2NF)
صورت سوم نرمال (3NF)
صورت نرمال بایس-کاد (BCNF)
صورت چهارم نرمال (4NF)
صورت پنجم نرمال (5NF)
صورت نرمال میدان-کلیدی (DKNF)
صورت نرمال تحدید-اجتماع (RUNF)
وابستگی تابعی
Functional Dependency
تعریف- فرض کنید که R یک متغیر رابطه ای و A و B دو زیرمجموعه دلخواه از عنوان R باشند. می گوییم B با A وابستگی تابعی دارد و چنین نمایش می دهیم:
اگر و فقط اگر در هر میدان ممکن از متغیر رابطه ای R، به هر مقدار A فقط یک مقدار B متناظر باشد.
به ازای یک مقدار خاص از A حتما یک مقدار مشخصی از B خواهیم داشت.
A: دترمینان B: وابسته
وابستگی تابعی بدیهی (نامهم)
Trivial FD
اگر در R(c1,c2,c3,…) داشته باشیم:
A={c1,c2} و B = {c1}
، در این صورت: یک وابستگی تابعی نامهم است. به بیان دیگر اگر B زیرمجموعه ای از A باشد، در این صورت یک وابستگی بدیهی است.
قواعد استنتاج آرمسترانگ
فرض: A، B، C و D زیرمجموعه هایی از صفات رابطه R باشند. قواعد زیر برقرارند:
قاعده انعکاس: اگر آنگاه:
قاعده تعدی(تراگذری): اگر و آنگاه
قاعده افزایش: اگر آنگاه
قاعده تجزیه: اگر آنگاه و
قاعده اجتماع: اگر و آنگاه
قاعده ترکیب: اگر و آنگاه
قاعده شبه تعدی: اگر و آنگاه
قاعده یگانگی عمومی: اگر و آنگاه
Reflexivity (انعکاس)
Transitivity (تعدی یا تراگذری)
Augmentation (افزایش)
Decomposition (تجزیه)
Union (ترکیب)
مجموعه کاهش ناپذیر وابستگی های تابعی
مجموعه ای از وابستگیهای تابعی R، به نام F را کاهش ناپذیر گوییم اگر:
در F وابستگی تابعی افزونه نباشد.
در سمت راست هر FD از F صفت ساده وجود داشته باشد.
هیچ صفتی در سمت چپ FDهای F افزونه نباشد.
وابستگی تابعی تام (کامل)
اگر X و Y دو زیرمجموعه از مجموعه عنوان رابطه R باشند، می گوییم Y با X وابستگی تابعی تام دارد و چنین نشان می دهیم:
اگر و فقط اگر Y با X وابستگی داشته باشد. ولی با هیچ زیرمجموعه ای از X وابستگی تابعی نداشته باشد.
رابطه 1NF
تعریف- رابطه ای 1NF است اگر هر صفت خاصه آن در هر تاپل، تک مقداری باشد، به بیان دیگر، صفت چندمقداری نداشته باشد.
در حالت کلی با مدل منطقی رابطه ای همیشه رابطه ها 1NF هستند.
رابطه 2NF
تعریف- رابطه ای 2NF است اگر اولا 1NF باشد و ثانیا تمام صفات غیرکلید با کلید کاندید وابستگی تابعی تام داشته باشند. به عبارت دیگر هر صفت غیرکلید با کلید کاندید بطور کاهش ناپذیر وابسته باشد.
A(C.K.)
C
B
رابطه 2NF
تعریف بیان شده برای رابطه دارای کلید ترکیبی آمده در حالتی که رابطه ما کلید ترکیبی نداشته باشد حتما 2NF است
تبدیل 1NF به 2NF
رابطه 3NF
تعریف- رابطه ای 3NF است اگر 2NF باشد و هر صفت غیرکلید با کلید کاندید، وابستگی تابعی بی واسطه داشته باشد.
B
C
A(C.K.)
صورت نرمال بایس-کاد Boyce-Codd Normal Form
رابطه“R “ BCNF است اگر برای همه وابستگی های تابعی آن که به صورت زیر بیان می شود:
where R and R
حداقل یکی از دو شرط زیر برقرار باشد:
یک وابستگی بدیهی باشد ( )
یک ابرکلید (super key) برای رابطه R باشد
صورت نرمال بایس-کاد
Boyce-Codd Normal Form
تعریف اول: رابطه ای BCNF است اگر در آن هر دترمینان، کلید کاندید باشد. این تعریف ساده شده و غیر صوری است.
A(C.K.)
C
B
D
رابطه 3NF
رابطه“R “ 3NF است اگر برای همه وابستگی های تابعی آن که به صورت زیر بیان می شود:
where R and R
حداقل یکی از سه شرط زیر برقرار باشد:
یک وابستگی بدیهی باشد ( )
یک ابرکلید (super key) برای رابطه R باشد
صفت های - قسمتی از یک کلید کاندید باشند
تفاوت صورت نرمال بایس-کاد و 3NF
BCNF
3NF
A(C.K.)
C
B
D
A(C.K.)
C
B
D
صورت نرمال بایس-کاد
تعریف چهارم: رابطه ای BCNF است اگر و فقط اگر سمت چپ هر FD مهم (مطرح) و کاهش ناپذیر، کلید کاندید رابطه باشد.
صورت نرمال بایس-کاد Boyce-Codd Normal Form
اگر یک رابطه“R “ BCNF نباشد و وابستگی های تابعی مربوطه که BCNF نبودن را سبب شده است باشد ( R و R) می توان با جداسازی این رابطه به دو رابطه زیر دو رابطه BCNF داشت:
( U )
( R – ( – ) )
*(البته توضیح بیشتر در این مورد خارج از حوزه این درس می باشد)*
وابستگی تابعی چندمقداری
Multi Valued Dependency
تعریف اول- در رابطه R(X,Y,Z) با صفات ساده یا مرکب X، Y و Z می گوییم که Y با X وابستگی تابعی چندمقداری دارد و چنین نمایش می دهیم:
اگر به یک مقدار X، مجموعه ای از مقادیر Y متناظر باشند.
وابستگی تابعی چندمقداری
تعریف دوم- در رابطه R، صفت Y با X وابستگی تابعی چندمقداری دارد اگر و فقط اگر مجموعه مقادیر Y متناظر با یک مقدار از جفت (X,Z) در R فقط به مقدار X بستگی داشته باشد و وابسته به مقدار Z نباشد.
BCNF است ولی 4NF نیست
جداول 4NF معادل اسلاید قبلی
رابطه 4NF
تعریف- رابطه ای 4NF است اگر BCNF باشد و در آن وابستگی تابعی چند مقداری مهم وجود نداشته باشد.
مزایای نرمالترسازی
ارائه یک طراحی بهتر و واضح تر با کمترین اختلاط اطلاعات
کاهش بعضی انواع افزونگی
کاهش بعضی آنومالیها
تسهیل اعمال بعضی قواعد جامعیت
معایب روش نرمالترسازی
1- بروز فزونکاری در سیستم در عمل بازیابی
2- ایجاد نوعی افزونگی از نوع افزونگی در سطح ادراکی
3- زمانگیر بودن فرآیند نرمالترسازی به ویژه اگر محیط عملیاتی بزرگ و تعداد رابطه ها زیاد باشد.
4- تصمیم گیری دشوار در اثر تعدد تجزیه ها
5- امکان وابستگی بین مجموعه صفات یک خردجهان، وابستگیهای به جز وابستگی تابعی و پیوندی باشد و بنابراین سبب مطرح شدن قواعد جامعیت دیگر و نیز ضوابط دیگری برای تجزیه رابطه ها شود و . . .
مرور صورت های نرمال
1NF
2NF
3NF
BCNF
PD
TD
PD2
4NF
5NF
MVD
JD
مشکلات تجزیه
Employee Skill | Language