Apuntes Informática Aplicada a la Gestión Pública. Capítulo 6, bases de datos, modelo relacional. Curso 2011/12. Universidad de Murcia. Rafael Barzanallana

6.1 Estructura de las Bases de Datos Relacionales
6.2 Propiedades de las Relaciones
6.3 Claves en el Modelo Relacional
6.4 Lenguajes de Consulta a Bases de Datos Relacionales

IMPORTANTE se recomienda acceder previamente a la siguiente información:

Teoría de conjuntos (Wikipedia)
Teoría elemental de conjuntos (Invitación a las matemáticas)
Álgebra (Wikipedia)
Cálculo (Wikipedia)

6.1.- Estructura de las Bases de Datos Relacionales

Es la estructura más utilizada actualmente. Los datos están estructurados en tablas:

fila

registro

entidad

columna

campo

Esta estructura es similar al concepto matemático de relación, por ello ha tenido tanto auge, ya que todas las teorías y reglas matemáticas sobre relaciones son aplicables, lo que hace que sea fácil de formalizar.

A la tabla se le llama relación, y a cada fila tupla; a cada columna de una tupla se le llama atributo, es en esto en lo que se diferencia del modelo matemático.

Bases de datos relacionales

Fuente de la imagen: adrformación

Convencionalismos

Los nombres de relaciones siempre en minúsculas.
Cada tupla se puede representar por una variable de tupla.
Cada atributo se representa por su nombre.
Cardinalidad = Nº de tuplas de una relación.
Grado = Nº de atributos de la relación.
Cada atributo puede tomar valores dentro de su dominio de atributo (conjunto de valores posibles)
Esquema = Definición global y general de una relación.
El esquema de una relación se representa en letras mayúsculas: r(R) donde r sería el nombre de la relación y R el nombre del esquema.
Formato de un esquema: Nom_esquema=(lista de atributos con sus dominios).

Alumnos = (dni: dom_dni; nombre: dom_nombre; edad: dom_edad).

Instancia de una relación = Información que contiene una relación en un momento determinado.

6.2.- Propiedades de las Relaciones

Miden su grado de bondad/aproximación al modelo real matemático por una serie de "formas normales", según se sube en las formas se dice que la relación está mejor diseñada. Al menos debe estar en la primera forma normal (1NF) y para ello debe cumplir:

No hay duplicación de tuplas.
No hay orden entre las tuplas.
No hay orden entre los atributos (se accede a través de su nombre).
No existen atributos que no sean atómicos (una casilla un dato). Es decir, no existe la posibilidad de tener una tabla como la siguiente:

Alumno	Asignatura
José	Cálculo
	Algebra
	Física

no es correcta, sin embargo si lo es esta otra:

Alumno	Asignatura
José	Cálculo
José	Algebra
José	Física

Por último, decir que existe la posibilidad de tratar relaciones entre sí a través de atributos comunes, esto evita la duplicación de la información. Dividimos un esquema en más de uno.

Ejemplo:

Alumno = (nombre: dom_nombre; nº: entero)
Asignatura = (nº: entero; asignatura:dom_asignatura).

En este caso el campo común entre las relaciones es el campo nº:

Nombre	Núm.
José	15
Antonio	17
Pedro	18

Num.	Asignatura
15	Cálculo
15	Algebra
15	Física

6.3.- Claves en el Modelo Relacional

Debe existir un atributo o conjunto de atributos que identifique de un modo único a una tupla; a ese atributo se le llamaría superclave (puede ser el conjunto formado por todos los atributos), al menos hay uno siempre.

Para una r(M) diremos que un subconjunto de atributos (K) del esquema será clave de la relación si para toda tupla t₁ ≠ t₂ se cumple que t₁[k] ≠ t₂[k] (es decir, dadas dos tuplas diferentes el valor de la clave también lo es).

Dentro de las superclaves, llamaremos claves candidatas a las superclaves más pequeñas (aquellas superclaves que carecen de subconjuntos propios que sean también superclaves). De entre todas las que haya, es el usuario el que decide cual es la primaria, las demás se llaman alternativas.

Reglas de Integridad:

Integridad de Identidad: La clave primaria de una relación no puede contener valores nulos.

Integridad de Referencia: Cuando en una relación hay un atributo que hace referencia a una clave primaria de otra relación, el atributo debe tener un valor coincidente con alguno de la clave primaria o como mucho ser nulo (es decir, no puede tener un valor que no exista entre los valores de la clave primaria en la primera relación).

6.4.- Lenguajes de Consulta a Bases de Datos Relacionales

Los podemos dividir en dos tipos: Lenguajes Formales y Lenguajes Comerciales. Los lenguajes formales están basados en el álgebra relacional o en el cálculo relacional. Solamente se han descrito para consulta a Bases de Datos (existen lenguajes comerciales que además de consulta permiten otras operaciones).

El álgebra relacional tiene procedimientos (procedimental), mientras que los lenguajes basados en el cálculo relacional son aprocedimentales. Dentro del cálculo relacional se distingue entre cálculo relacional orientado a tuplas y cálculo relacional orientado a dominios.

Los lenguajes comerciales, en su mayoría usan enfoques tanto procedimentales como aprocedimentales, o lo que es lo mismo, no son lenguajes puros como los formales. De esta manera hacen su sintaxis más amigable al usuario.

4.1 Lenguajes Formales

Álgebra Relacional

A) Operaciones fundamentales:

1.- Selección

estudiante = (NE, nombre, edad, dccion)

σ _{NE =2249}(estudiante)

σ _{nombre = "Pepe" ∧ edad > 25} (estudiante)

2.- Proyección

_{A1 ,..., An}

₁

Π_nombre (estudiante)

Π_nombre (σ _{NE = 2249}(estudiante))

3.- Producto Cartesiano

₁

₂

₁

₂

₁

₂

Cliente = (nombre_cliente, ciudad, calle)

Sucursal = (nombre_sucursal, activo, ciudad)

Prestamo = (num_prestamo, nombre_sucursal, nombre_cliente, importe)

Deposito = (num_cuenta, nombre_sucursal, nombre_cliente, saldo)

(cliente.nombre_cliente, ciudad, calle, num_prestamo, nombre_sucursal, prestamo.nombre_cliente, importe)

t[cliente.nombre_cliente] ≠ t[prestamo.nombre_cliente]

Π _{prestamo.nombre_cliente, ciudad} (σ_{prestamo.nombre_cliente = cliente.nombre_cliente} (cliente x prestamo))

4.- Unión de Conjuntos

₁

₂

₁

₂

₁

₂

(Π _{nombre_cliente} (cliente)) ∪ (Π_{nombre_cliente} (prestamo))

(Π _{nombre_cliente}(σ_{nombre_sucursal = "2"}(prestamo))) ∪ (Π _{nombre_cliente}(σ_{nombre_sucursal = "2"}(deposito)))

Diferencia de Conjuntos

₁

₂

₁

₂

₁

₂

(Π_{nombre_cliente}(σ_{nombre_sucursal = "Principal"} (prestamo))) - (Π _{nombre_cliente}(σ_{nombre_sucursal = "Principal"}(deposito)))

B) Operaciones Adicionales:

Intersección de Conjuntos

₁

₂

₁

₂

₁

₂

(Π _{nombre_cliente}(σ_{nombre_sucursal = "10"} (prestamo))) ∩ (Π_{nombre_cliente}(σ_{nombre_sucursal ="10"}(deposito)))

Unión Join o Producto Theta

(Π_{nombre_cliente}(σ_{nombre_sucursal = "10"}(prestamo))) Θ _{prestamo.nombre_cliente = deposito.nombre_cliente}(Π_{nombre_cliente}(σ_{nombre_sucursal = "10"} (deposito)))

Π_{prestamo.nombre_cliente}(prestamo Θ_{prestamo.nombre_cliente = deposito.nombre_cliente ∧}deposito) _{prestamo.nombre_sucursal = "10" ∧

deposito.nombre_sucursal = "10"}

r₁ Θ _P r₂ = σ_P (r₁ x r₂)

Producto Natural

₁

₂

El siguiente ejemplo devuelve una relación con los nombres de los clientes que tienen préstamo, depósito o ambas cosas en la sucursal 10.

Π _{nombre_cliente}(σ_{nombre_sucursal = "10"} (prestamoalefsym;deposito))

Dados r₁(R₁) y r₂(R₂) dos relaciones con sus respectivos esquemas, se cumple la siguiente igualdad:

r₁ ℵr₂ = Π_{R1 ∪ R2} (σ_{r1.A1 =r2.A1 ∪ .........∪ r1.An = r2.An} (r₁ x r₂))

Al ser unión de esquemas, como los elementos de los esquemas son los nombres de los atributos, si existe una columna común a R₁ y R₂ sólo aparecerá una vez.

Cálculo Relacional

A. Cálculo Relacional Orientado a Tuplas

]

selección

{t / t∈ prestamo ∧ t[importe] > 1000000}

proyecciones

{t / ∈ s∈ prestamo ∧ s[importe] > 1000000 ∧ t[nombre_cliente] = s[nombre_cliente] }

unión

{ t / ∃ s (s∈ prestamo ∧ t[nombre_cliente] = s[nombre_cliente] ∧ s[nombre_sucursal] = "10" ) ∪ ∃(u∈ deposito ∧ t[nombre_cliente] = u[nombre_cliente] ∧ u[nombre_sucursal] = "10") }

intersección

diferencia

producto cartesiano

{t / ∃ s (s∈ prestamo ∧ t[nombre_cliente] = s[nombre_cliente] ∧ s[nombre_sucursal] = "Principal" ∧ ∃ u (u∈ cliente ∧ u[nombre_cliente] = s[nombre_cliente] ∧ t[ciudad] = u[ciudad] ))}

B Cálculo Relacional Orientado a Dominios

₁

₂

p = num_prestamo; s = nombre_sucursal; c = nombre_cliente; i = importe;

₁

₂

₁

₂

Selección:

{ < p, s, c, i > / < p, s, c, i > ∈ prestamo ∧ i > 1000000 }

Proyección:

{ < c > / ∈ < p, s, c, i > ∈ prestamo ∧ i > 1000000 }