RECUPERACIÓN Y ORGANIZACIÓN DE LA INFORMACIÓN

MODELOS DE RECUPERACION

 

1- INTRODUCCIÓN A LOS MODELOS DE RECUPERACION.

Según la mayoría de estudios que se han estado realizando en los últimos años la recuperacion y organizacion de la informacion es uno de los aspectos que han cobrado un mayor relevancia. En la actualidad estos estudios resaltan la vital importancia que ha cobrado ese campo. Esto se debe en gran medida a que los buscadores de internet están situados como el primer método utilizado para obtener cualquier tipo de información sea para el uso que sea (académico, lúdico, empresarial).

Debido a esto es de vital importancia conocer cuales son los métodos o modelos de recuperacion utilizados por los grandes buscadores (booleano, probabilístico, vectorial). En los últimos años y debido a los intereses económicos derivados de buenos posicionamientos en los distintos buscadores se está produciendo un boom en todos los campos relacionados con este tema, por tanto es necesario conocer como se estructuran los modelos de recuperación con anterioridad.

La principal clasificación para los modelos de recuperacion de informacion es la siguiente:

Modelos clásicos: Entre los que se encuentran los modelos probabilístico, booleano y vectorial. En los cuales nos hemos centrado en este documento.

Modelos estructurales: Entre los que destacan listas no sobrepuestas y el método de los nodos proximales.

Esta es la clasificación que utilizaremos, ya que es la mas extendida y a nuestro parecer la de mayor utilidad.

 

2.- CLASIFICACIÓN LOS MODELOS DE RECUPERACION.

Para facilitar el seguimiento de los contenidos, esta sección esta estructurada en las siguientes subsecciones:

  • Modelo Booleano:

  • Es un modelo de recuperación simple, basado en la teoría de conjuntos y el álgebra booleana. Dada su inherente simplicidad y su pulcro formalismo ha recibido gran atención y sido  adoptado por muchos de los primeros sistemas bibliográficos comerciales. Su estrategia de recuperación está basada en un criterio de decisión binario (pertinente o no pertinente) sin ninguna noción de escala de medida, sin noción de un emparejamiento parcial en las condiciones de la pregunta.

    Modelo Vectorial:

  • El modelo de recuperación vectorial o de espacio vectorial propone un marco en el que es posible el emparejamiento parcial, asignando pesos no binarios a los términos índice de las preguntas y de los documentos. Estos pesos de los términos se usan para computar el grado de similitud entre cada documento guardado en el sistema y la pregunta del usuario.

    Modelo Probabilistico:

  • El modelo de recuperación probabilistico se basa en la equiparación probabilística, dados un documento y una pregunta, es posible calcular la probabilidad de que ese documento sea relevante para esa pregunta.

Modelos de Recuperacion y organizacion de la informacion: Booleano, Probabilistico, Vectorial, esperamos que el contenido sea de su agrado.