viernes, 31 de agosto de 2012

Datos de presentación


Viernes 31 Agosto 2012


Alumno: Javier Eduardo Huamaní Portocarrero
Curso: Base de datos
Ciclo: 2012-2
Profesor: Luis Serna Jherry

Normalización desde la 1FN hasta la 4FN.







Cuarta Forma Normal (4FN). Fallas que presenta la 4FN.


La cuarta forma normal (4FN) es una forma normal usada en la normalización de bases de datos. La 4FN se asegura de que las dependencias multivaluadas independientes estén correcta y eficientemente representadas en un diseño de base de datos. La 4FN es el siguiente nivel de normalización después de la forma normal de Boyce-Codd (BCNF).
Una tabla está en 4FN si y solo si esta en Tercera forma normal o en BCNF (Cualquiera de ambas) y no posee dependencias multivaluadas no triviales. La definición de la 4FN confía en la noción de una dependencia multivaluada. Una tabla con una dependencia multivaluada es una donde la existencia de dos o más relaciones independientes muchos a muchos causa redundancia; y es esta redundancia la que es suprimida por la cuarta forma normal.

Fallas
Las Fallas que presenta la Cuarta Forma Normal (4FN) es que no reduce completamente la redundancia en la base de datos relacionales que guardan hechos multivalores. También que cada dependencia de unión no implica necesariamente las claves candidatas, quiere decir, que no siguen los criterios de clave.



Considerando la tabla anterior, cada fila indica que una tienda dado puede entregar una variedad dada de chocolates a un área dada. Note que debido a que la tabla tiene una clave única y ningún atributo no-clave, no viola ninguna forma normal hasta el BCNF. Pero debido a que las variedades de chocolate que una tienda ofrece son independientes de las áreas a las cuales la tienda envía, hay redundancia en la tabla: por ejemplo, nos dicen tres veces que A1 Chocolate ofrece la Corteza rellena, y si A1 Chocolate comienza a producir chocolates de Corteza de vainilla-chocolate entonces necesitaremos agregar múltiples registros, uno para cada una de las Áreas de envío de A1 Chocolate. En términos formales, esto se describe como que Variedad de chocolate está teniendo una dependencia multivalor en la tienda.

Para satisfacer la 4NF, debemos poner los hechos sobre las variedades de chocolates ofrecidas en una tabla diferente de los hechos sobre áreas de envío:



 En contraste, si las variedades de chocolate ofrecidas por una tienda a veces variaran de un área de envío a otra, la tabla original de las tres columnas satisfaría la 4FN.


Ejemplo1

   
Ejemplo2

Ejemplo3

  
Ejemplo4







Tercera Forma Normal (3FN). Fallas que presenta la 3FN


Una relación R esta en 3FN si esta en 2FN y si, y solo si, los atributos no llaves son independientes de cualquier otro atributo no llave primaria.Esto es lo mismo que decir que se deben eliminar las dependencias transitivas de atributos no llaves respecto a la llave primaria, estando ya la relación en 2FN.

Consiste en eliminar la dependencia transitiva que queda en una segunda forma normal, en pocas palabras una relación esta en tercera forma normal si está en segunda forma normal y no existen dependencias transitivas entre los atributos, nos referimos a dependencias transitivas cuando existe más de una forma de llegar a referencias a un atributo de una relación.



Fallas en la 3FN
Las fallas de la 3FN se dan por la posible existencia de un mismo atributo con muchos valores.






Otro ejemplo:  la relación tiene dos claves sobrepuestas (Nivel,Cargo) y (Nivel,Nombre), pero como el determinante de Cargo es Nombre pero este atributo Nombre no es una clave candidata.


 Ejemplo1

 Ejemplo2

Ejemplo3

 Ejemplo4





Segunda Forma Normal (2FN). Fallas que presenta la 2FN.


Una relación R se dice que esta en 2FN si esta en 1FN y si, y solo si, los atributos no llaves (ni primarias ni candidatas) de R, si los hubiese, son funcional y completamente dependientes de la llave primaria de R.
Entonces este segundo paso se aplica solo a relaciones con llaves compuestas, pues no es posible que en una relación cuya llave primaria sea simple (compuesta por un solo atributo) haya atributos que dependan de parte de la llame primaria. Una relación que este en 1FN y que tenga una llave primaria simple, esta en 2FN.

Problemas con la 2FN
Los defectos de almacenamiento de una relación 2FN son causados por la dependencia transitiva (DT) de atributos no-clave con la clave primaria.

Este es un ejemplo donde se muestra fallas en la 2FN, las cuales son acusadas por la DT de atributos dato no clave con la PK




Ejemplo 1
Tenemos los siguientes datos:


Pasamos estos datos a 1FN, enfocándonos en el atributo emails



 Ahora separamos las tablas para cumplir el DFC



 Ejemplo 2

 Ejemplo 3


 Ejemplo 4











Diferencia entre datos Normalizados en 1FN y el universo de datos no normalizados


En primer lugar, empezaremos definiendo a la normalización y su primera forma. La Normalización es la expresión formal del modo de realizar un buen diseño. Provee los medios necesarios para describir la estructura lógica de los datos en un sistema de información.  Las principales ventajas de la Normalización son: evitar anomalías, mejorar la independencia de los datos permitiendo realizar extensiones de la BD, afectando muy poco, o nada, a los programas de aplicación existentes que accesan la base de datos.

La Normalización involucra varias fases que se realizan en orden. La realización de la 2da fase supone que se ha concluido la 1ra y así sucesivamente. Las relaciones en la 1FN son un conjunto del universo de todas las relaciones posibles. Las relaciones 2FN son un subconjunto de las que están en 1FN y así sucesivamente, como se muestra en la figura.





Para que los datos cumplan con la 1FN deben cumplir los siguientes requisitos:



·         Una relación R se encuentra en 1FN si y solo sí por cada renglón columna contiene valores atómicos, es decir un atributo es atomico si los elementos del dominio son indivisibles, mínimos.
·         Las celdas de las tablas poseen valores simples y no se permiten grupos ni arreglos repetidos como valores, es decir, contienen un solo valor por cada celda.
·         Todos los ingresos en cualquier columna (atributo) deben ser del mismo tipo.
·         Cada columna debe tener un nombre único, el orden de las columnas en la tabla no es importante.
·         Dos filas o renglones de una misma tabla no deben ser idénticas, aunque el orden de las filas no es importante.



Teniendo en cuenta esto, la diferencia entre los datos normalizados en la 1FN y los datos del universo no normalizado  es que estos están atomizados, cada atributo no se repite, de esta forma no existen errores lógicos. Así mismo, los datos normalizados siguen normas que hacen el acceso a los datos de forma ordenada y sin errores. Los  datos no normalizados están organizados de una manera en la cual algunos atributos pueden mostrar mas de un dato en un campo o pueden estar algunos duplicados mostrando atributos repetidos, además de no estar agrupados por claves que identifiquen lo que representa la una tabla.

Ejemplo 1:

          Un error en datos no normalizados es por ejemplo en una tabla Persona que tiene como campos:                 
          DNI, Nombre, Direccion, telefono , en el atributo telefono se agregue 2 numeros de telefonos.




La 1FN evita los datos duplicados y nos cerciora que los valores de cualquier columna son del mismo tipo. La siguiente imagen muestra la tabla anterior llevada a la 1FN





Ejemplo 2
En este caso de la biblioteca, la PK es el CodLibro, quién determina a los demás atributos de la tabla.




Ejemplo 3
En este caso la PK es Código de Película  C_Pelicula




Ejemplo 4
En esta Tabla, la PK es el Nro_GI (número de guía) quién determina a los demás atributos de la tabla.