sábado, 19 de julio de 2014

Fragmentación de una Base de Datos


Bases de datos distribuidas

Son un grupo de datos que pertenecen a un sistema repartido entre ordenadores de una misma red, ya sea a nivel local o cada uno en una diferente localización geográfica; Cada sitio en la red es autónomo en sus capacidades de procesamiento y es capaz de realizar operaciones locales y en cada uno de los servidores (ordenadores) debe estar ejecutándose una aplicación a nivel global que permita la consulta de todos los datos como si fueran uno solo.

A continuación la comparativa en te las bases de datos Centralizadas con las Distribuidas.


Para hacer una BDD (Base de Datos Distribuida) deberá cumplirse ciertas condiciones de la Red Computacional.
La red de comunicaciones provee las capacidades para que un proceso ejecutándose en un sitio de la red envíe y reciba mensajes de otro proceso ejecutándose en un sitio distinto; Los parámetros que se deben considerar incluyen lo siguiente:

  1. Retraso en la entrega de mensajes.
  2. Costos de Transmisión de un mensaje.
  3. Confiabilidad de la red. 

ARQUITECTURA DE BASE DE DATOS



  • Global Schema: Define todos los datos que están incluidos en la BDD tal como si la BD no fuera Distribuida, esta consiste en una definición de relaciones globales.

  • Fragmentation Schema: Entre relaciones globales y fragmentos es decir que una relación global puede consistir de varios fragmentos y un fragmento está asociado con sólo una relación global.

  • Allocation Schema: Define el sitio o sitios en el cual un fragmento está localizado.

  • Local Maping Schema: Traduce los fragmentos locales a los objetos que son manejados por el SMBD local.

SEPARACIÓN ENTRE FRAGMENTACIÓN Y LOCALIZACIÓN


  • Transparencia de Fragmentación.
  • Transparencia de Localización.
  • Control explícito de redundancia.
  • Independencia de BD locales.


Ejemplo de una BDD:



VENTAJAS Y DESVENTAJAS DE UNA BDD Y UNA BDC




TIPOS DE ALMACENAMIENTO


Réplica: El sistema conserva varias copias idénticas en una tabla, cada una de estas se almacena en un nodo diferente.


Ventajas



  • Disponibilidad: El sistema sigue funcionando aún en caso de caída de uno de los nodos.
  • Aumento de paralelismo: Varios nodos pueden realizar consultar en paralelo sobre la misma tabla, cuantas más réplicas existan de la tabla, mayor será la posibilidad de que el dato buscado se encuentre en el nodo desde el que se realiza la consulta, minimizando con ello el tráfico de datos entre nodos.

Desventajas


  • Aumento de sobrecarga en las actualizaciones: El sistema debe asegurar que todas las réplicas de la tabla sean consistentes. Cuando se realiza una actualización sobre una de las réplicas, los datos deben propagarse a todas las réplicas de dicha tabla a lo largo del sistema distribuido.



Fragmentación: existen 3 tipos de fragmentación la horizontal, la vertical y la mixta.



  • Fragmentación Horizontal. 
Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se definen a través de una operación de selección y su reconstrucción se realiza con una operación de unión de los fragmentos componentes.

Cada fragmento se sitúa en un nodo. Pueden existir fragmentos no disjuntos: combinación de fragmentos y replicación. Ejemplo una tabla de alumnos:


Tabla de alumnos Fragmentada.




  • Fragmentación Vertical.

Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se definen a través de una operación de proyección.



Cada fragmento debe incluir la clave primaria de la tabla. Su reconstrucción se realizará con una operación de join de los fragmentos componentes, pueden existir fragmentos no disjuntos: combinación de fragmentación y replicación.




  • Fragmentación Mixta.
Como el mismo nombre indica es una combinación de las dos anteriores vistas he aquí un ejemplo a partir de una tabla fragmentada horizontalmente.




Réplica y Fragmentación


Las técnicas de réplica y fragmentación se pueden aplicar sucesivamente a la misma relación de partida. así mismo el fragmentado se puede replicar y a su vez esa réplica ser fragmentada, para luego replicar alguno de esos fragmentos.


Fuentes Bibliográficas.


Toledo V. & Miralles I. (s.f.) Base de Datos Distribuidas. Recuperado de : https://iessanvicente.com/colaboraciones/BBDDdistribuidas.pdf




lunes, 7 de julio de 2014

Calidad en una Base de Datos



 ¿Por qué es importante asegurar la calidad de los datos en una BDR?


Porque es importante la integridad de los datos de la misma como dice el texto:

“Mantener o crear un sistema de base de datos con una calidad de datos deficiente va a repercutir en pérdidas de clientes, de negocios, de ventas o de tiempo, dependiendo del giro de la empresa u organización; además, se pueden efectuar tomas de decisiones erróneas por basarse en datos incorrectos o con calidad deficiente. Una base de datos carente de calidad, en los datos que maneja, puede presentar problemas, como datos inútiles e innecesarios, redundancia de datos fuera de control, y una gran cantidad de datos históricos que han caducado”. (Silberschatz, 2002)

Y también la falta de calidad, en los datos, asociada a la falta de integridad y al mal diseño de la base de datos puede ocasionar:
  • Múltiples fuentes de la misma información producen diferentes valores.
  • Grandes volúmenes de información almacenada hacen difícil el acceso en tiempo razonable.
  • La heterogeneidad, en los sistemas distribuidos, puede producir definiciones, formatos y valores inconsistentes.
  • La información no numérica es difícil de indexar.
  • No se dispone todavía de análisis automático a lo largo de colecciones de datos.
  • Al cambiar las tareas de los consumidores de información y el entorno organizacional, la información que es relevante y útil también cambia.
La facilidad de acceso a la información puede entrar en conflicto con los requisitos de seguridad, privacidad y confidencialidad.(Elmasri, 2007).




Bibliografía:

Elmasri, R. y Navathe, S. (2007). Fundamentos de sistemas de bases de datos (5a ed.). España: Pearson - Addison Wesley.

A. Silberschatz, H. F. Korth y S. Sudarshan. (2002). Fundamentos de Bases de Datos (4ª edición). McGraw Hill.



Normalización de una Base de Datos.(Almacenamiento, Componentes y Restricciones)



Tipos de almacenamiento


Tipo de almacenamiento
Características
Ventajas
Desventajas
Principal o Primario
Incluye los medios de almacenamiento en los que el ordenador (CPU) puede operar, como la memoria principal y las memorias caché.
El almacenamiento principal proporciona acceso rápido a los datos.
Capacidad de almacenamiento limitada.
Secundario
Disco Duro


Estos dispositivos normalmente tienen gran capacidad, bajo precio.
Acceso lento a los datos, el ordenador (CPU) no puede procesar directamente lo datos, primero deben copiarse al almacenamiento principal.
Terciario
Discos Magnéticos y  cintas (Medios removibles)


     Componentes:

De acuerdo con Elmasri los componentes son:
a)    Tupla.- Cada uno de los elementos que contiene una instancia de la relación comúnmente llamadas Filas.
b)    Relación.- Conjunto de n-Tuplas
·         Cada relación vista como una tabla, consta de un conjunto de columnas; cada una de ellas recibe el nombre de atributo
·         A cada atributo de una relación le corresponde un nombre que debe ser el único dentro de la relación y por último
·         Un dominio es un conjunto de valores atómicos.
El conjunto de valores válidos para un atributo, o dicho de otra manera, el conjunto de valores de cada Tupla de la relación puede tomar para ese atributo. (López J. 2012)
            

      Restricciones:

Restricciones inherentes o implícitas: modelo de datos dicen que no existen Tuplas iguales o repetidas obligando a tener una clave primaria, es decir como en las matemáticas los conjuntos por definición no incluyen elementos repetidos.
Estas son las que marcan la diferencia entre una tabla y una relación, ya que una tabla presenta las filas y las columnas en un orden del cual carecen las relaciones. Por otro lado, una tabla podría contener filas repetidas. (Alcande A. 2013)

Restricciones Explícitas: pueden expresarse directamente en los esquemas del modelo de datos por lo general se especifican en el lenguaje de definición de datos.  Estas suelen dividirse pero en este caso solo se mencionaran las 3 principales:
            Restricciones de Dominio: Conjunto de valores atómicos o indivisibles, en  el que se indica el tipo de dato, bajo un nombre que ayude a su interpretación.
            Restricciones de clave: una relación está definida como un conjunto de tuplas.
            Restricciones en valores NULL: restricción en los atributos, en donde se especifica si se permiten o no los valores NULL.

Restricciones Semánticas: no pueden expresarse directamente en los esquemas del modelo de datos, por consiguiente, deben ser expresadas e implementadas por los programas, se basan en las aplicaciones o reglas del negocio.


Figura 1.1 Ejemplo de diseño de la estructura de una base de datos del modelo relacional. 


EMPLEADO
Dni
Nombre
Apellido1
Apellido2
FechaNac
Dirección
Sexo
Sueldo
SuperDni
Dno
DEPARTAMENTO
Número Depto
NombreDepto
DniDirector
Fecha Ingreso Director
LOCALIZACIONES_DEPTO
Número Depto
Ubicación Depto
PROYECTO
NumProy
NombreProyecto
Ubicación Proyecto
Num Depto Proyecto
TRABAJA_EN
DniEmpleado
NumProy
Horas
SUBORDINADO
DniEmpleado
Nombre Subordinado
Sexo
FechaNac
Relación
Figura 2.3 Esquema de la base de datos empleado (Elmasri y Navathe, 2007).


La consulta utilizando algebra relacional
σ sucursal_nombre = “Colon” ∆ importe> 1200 (préstamo)
idprestamo
sucursal_nombre
importe
12
Colon
1,500
13
Colon
1,300






Bibliografía:


·         Date, C. (2004). An introduction to database systems (8a ed.). EE.UU.: Pearson Education Inc.
·          
·         Elmasri, R. y Navathe, S. (2007). Fundamentos de sistemas de bases de datos (5a ed.). España: Pearson - Addison Wesley.

A. Silberschatz, H. F. Korth y S. Sudarshan. (2002). Fundamentos de Bases de Datos (4ª edición). McGraw Hill.
López J. (2012). Base de Datos: El modelo Relacional. Recuperado el 7 de octubre de 2013 de: http://docencia.lbd.udc.es/bdd/teoria/tema2/2.3.1.-ElModeloRelacional.pdf


 Alcalde A. (2013). Diseño de Base de Datos: Restricciones. Recuperado el 7 de octubre de 2013 de: http://elbauldelprogramador.com/programacion/basededatos/diseno-de-bases-de-datos-ii/

Joins Mysql

JOIN

En Mysql permite combinar registros de 2 o más tablas en una base de datos relacional; en este lenguaje existen 3 tipos de JOIN: 


a) Interno 
b) Externo 
c) Cruzado



Hay otros casos en los cuales una tabla puede unirse a sí misma, produciendo una auto-combinación, es decir, SELF-JOIN.





martes, 21 de mayo de 2013

Dispositivos Básicos de interconexión de una red y los 3 niveles del modelo de diseño jerárquico de una red

Dispositivos Básicos de interconexión de una red y los 3 niveles del modelo de diseño jerárquico de una red



Cuando se trata de los elementos básicos de las redes, la comprensión de cómo funciona una red es el primer paso para entender el enrutamiento y la conmutación. La red funciona mediante la conexión de equipos y periféricos a través de dos dispositivos: switches y routers. Los switches y los routers, elementos esenciales de las redes, permiten que los dispositivos que están conectados a la red se comuniquen entre sí y con otras redes. Aunque parecen bastante similares, los routers y los switches realizan funciones muy diferentes en una red. (Cisco, 2012)





















Dispositivos Básicos de interconexión de una red y los 3 niveles del modelo de diseño jerárquico de una red

Capa de distribución: donde se agregan el cableado en racks específicos y se usan los switches para crear separaciones de grupos y redes. Actúa como dispositivos intermedios que enrutan entre VLANs. Aquí es donde se aplica la sumarización de rutas, las políticas de red como pueden ser firewalls, listas de acceso, selección de rutas y/o QoS (calidad de servicio). (Cisco, 2012).

Capa de Core (núcleo o también llamada Backbone): Dispositivos de alta velocidad capaces de intercambiar paquetes tan rápido como sea posible. No se deberían aplicar políticas de ningún tipo para evitar su cometido de intercambio de tráfico lo más rápido posible. (Cisco, 2012).

Capa de acceso: acceso de usuarios y de equipos finales a la red asignándolos a VLAN evitando aplicar políticas de red para evitar complejidad, costes y pudiendo así usar dispositivos de bajo coste. (Cisco, 2012)