Páginas vistas en total

lunes, 5 de septiembre de 2011

Bases de Datos Semánticas

Bases de Datos Semánticas

El modelado semántico resume la complejidad lógica representativa de la Base de Datos, esto permite mayor usabilidad por parte de más usuarios, se extiende el amplio dominio para la redes de comunicaciones donde los usuarios no son conscientes de la estructura lógica de una base de datos remota.

La abstracción de datos y la separación de componente lógicos y conceptuales son propiedades importantes en las Bases de Datos Semántica por tanto permiten la representación de la realidad a modo de espejo.
También trae consigo mayor complejidad lógica y problemas de interpretación de las consultas, debido a su acercamiento al lenguaje natural, produce ambigüedades.

La base de datos Semántica permite la adaptación de datos derivados, no existentes en la base de datos pero que para el usuario es obvio su existencia.
El nuevo estándar trata de minimizar el problema de ambigüedad en la base de datos.


Fig. 4. Arquitectura de una Base de Datos Semántica

En 1970, el Modelo Relacional revolucionó el campo de las Bases de Datos, debido al logro de la separación de la representación lógica del dato de la implementación física, lo que produjo en adelante el desarrollo de lenguajes de consultas.

Los modelos semánticos fueron introducidos como herramientas de diseño de esquemas. El motivo principal de su uso radicaba en la exactitud del modelo de datos, como muchos autores aseveran, el modelado semántico, no es más, que una representación del mundo real, estas propiedades no las tenían las aplicaciones de bases de datos típicas.

Hoy en día se ha tratado de estandarizar ello, con la llegada del estándar SQL3, que no es más que una extensión del modelo relacional.  El modelado semántico y el modelo lógico planteaba un modelo que sugería colocar el nombre de Semantic-SQL, que pueda ser una estándar en lenguajes de consultas semánticas y planteaba una arquitectura del sistema donde el modelo relacional actuaba de forma independiente al modelo semántico, este último actuaba de manera directa con el usuario y traducía la consulta a un modelo lógico entendible por el Sistema de un esquema podía ser diseñado en un alto nivel de modelado semántico y traducido en un medio tradicional para la implementación


Sección del problema la cual motiva el surgimiento e implementación de la Base de Datos Semántica:

II. PROBLEMA: ASIMILAR EL MUNDO REAL
Ejemplifica la iteración con la base de datos, y asevera que ésta es más que una colección de valores, tiene transiciones en cada punto de la línea del tiempo, por ello experimenta cambios en su contenido. En esta ejemplificación cada punto puede verse como una instantánea que representa el estado del sistema de aplicación de la Base de Datos.

Por tanto esto refleja una secuencia de eventos a través del tiempo, ocurrentes en el ambiente de aplicación. Los autores relacionados a este tema definen el Modelado Semántico de una Base de Datos como el Modelo del Sistema del Mundo Real, es decir un espejo de la estructura del sistema que modelo una empresa por ejemplo.

III. MANEJO CONCEPTUAL
Todo esto enfoca la necesidad de establecer una interacción con el usuario de una manera más fácil, tratando de alguna manera brindar la propiedad de transparencia al usuario mediante un modelo conceptual en vez de lógico, ya que le resultaría al usuario más familiar.

Un esquema lógico está expresado de una particular clase de estructura de datos llamado Modelo de Datos. Los modelos de estos datos son de bajo nivel y orientado a la máquina, todo ello requiere que se expresa a nivel de representación lógica que en términos de significancia. En el modelo relacional la información semántica está implícita tanto así que no se podría extraer en casi todos los casos y se pierden en el modelo . Por ello Hamar explica que la semántica debería estar separada, Rishe también lo plantea, y aplicada por el usuario directamente.

El modelo en el nivel conceptual se trata de no perder la significancia de la información que provean las relaciones, entre entidades y brinde la facilidad para hacer consultas sobre ello .

Fig. 1. Interacción directa entre BD Semántica y usuario

IV. VENTAJAS DEL MODELADO SEMÁNTICO

IV-A. Separación de componentes conceptuales y lógicos
Los usuarios cuando realizan una consulta en una Base de Datos Relacional, navegan a través de ella por medio de un esquema con tablas de registros, logran obtener los datos requeridos mediante operaciones asociadas como juntura y proyección que son las más comunes. Acá se presenta un ejemplo extraído de , donde se plante el caso: Mary es un agente de viajes, y se desea conocer la ciudad del empleador de Mary.. Para obtener esto en un lenguaje SQL se tendría que tener explícitamente el conocimiento de las tablas donde se encuentra la información del negocio y lugar donde vive el empleador. La sentencia SQL queda como sigue:

SELECT city
FROM BUSINESS
WHERE BNAME in
SELECT EMPLOYER
FROM BUSTRAV
WHERE PNAME=’Mary’

Es decir obtiene primero el nombre del empleador de Mary por selección y luego la ciudad de donde pertenece el negocio donde trabaja el empleador.

IV-B. Sobrecarga semántica
Una relación es usada normalmente en el Modelo Relacional, muchos tipos diferentes de información, la existencia de entidades implícitas, propiedades, estructura y asociaciones entre ellos. El Modelo Semántico de Datos provee una separación de esta información, mediante la abstracción de datos.

IV-C. Abstracción de datos
Esto permite proveer de datos derivados —Knowledge base—, que están relacionados más a la noción que tiene el usuario acerca de las Bases de Datos. Estos datos no están incorporados al esquema, es decir es un nuevo tipo de dato —puede tomarse como una entidad nueva en una relación ISA por ejemplo—.

V. CONSIDERACIONES DE UN MODELADO SEMÁNTICO
En esta sección explicamos dos consideraciones importantes, la primera es la forma en que será implementada una Base de Datos Semántica y la segunda está relacionada con la integridad semántica y la ambigüedad.

V-A. Implementación y representación física
Hammer  explica que si bien hay beneficio por la facilidad de comprensión y manejo de la Base de Datos, también existen grandes consideraciones de, ¿Cómo será la implementación? y ¿Cómo será la representación física?, esto trae consigo por supuesto una complejidad superior a la de una Base de Datos con el Modelo Relacional. Esto se puede ver en Sistema de arquitectura de la figura en el apéndice.

V-B. Ambigüedad del lenguaje natural e Integridad semántica
Las bases de datos semántica se tratan de expresar como un lenguaje natural —a nivel conceptual— para las consultas realizadas por el usuario. Esto como se menciona en  libera al usuario de una tarea de comprensión de la base de datos —como explicamos en las ventajas—. Pero resalta un nuevo problema, la previsión de capacidades de actualización.

Por el mismo hecho de usarse un lenguaje casi natural, tiende a la ambigüedad, este nuevo problema no se ve en las consultas tradicionales. Esto es, debido a que el usuario está fraseando sus peticiones con respecto a su punto de vista de la Base de Datos, lo cual puede ser una simplificación o una transformación de la estructura actual de la base de datos, entendiéndose que el usuario no está íntimamente ligado con la estructura interna de la base de datos como sería su diseñador.

Las solicitudes de actualización —insertar, eliminar, modificar—, podría resultar en diferentes efectos, no esperados por el usuario. Incluso el usuario podría hacer peticiones que sean imposibles —el problema de devolución null—. El trato que se da a la ambigüedad es seleccionar entre todos los estados posibles, el que involucra menos modificaciones a lo largo de la base de datos, para ello se siguen ciertas consideraciones que se explican en documentos asociados a esta bibliografía . Shin  plantea una clasificación de posibles caminos que puede tomar una consulta y en la bibliografía se plantea el estándar SQL3 que trata el problema. Para Shin toma el siguiente camino:

Los ICA tienen que ver con errores de tipografía, gramaticalmente incorrecta, referencias indefinidas. CI tiene que ver con términos desconocidos o ambiguos, términos vagos o información faltante, parámetros inconsistentes y semánticamente sin sentido; estos son los errores más comunes que puede llevarse a cabo. Los II son errores sintácticamente y semánticamente sin sentido. En la bibliografía  se explica de manera detallada el problema, aquí se presenta la taxonomía dada por Shin.

No hay comentarios:

Publicar un comentario