martes, 28 de mayo de 2013

HERRAMIENTAS DE BUSQUEDAD AVANZADA.

BÚSQUEDA EN INTERNET
1. Introducción
2. Herramientas de búsqueda (buscadores)
2.1. Buscadores automáticos (Search engines)
    *  Metabuscadores (Metasearch engines)
2.2. Directorios (Subject guides)
    *  Directorios especializados
2.3. Comparación de buscadores automáticos (Search engines)
    *  Según tamaño
    *  Según cobertura
    *  Principales buscadores
            *  Altavista
            *  Excite
            *  HotBot
            *  Infoseek
            *  Northern Light
3.  Referencias
 Google tiene una herramienta de busquedad avanzada,que se encuentra en la parte derecha de la página principal,como muestra la figura siguiente.
Esta herramienta habre un formulario que permite definir ciertos parámetros necesarios para hacer una busquedad más exacta.

2.1 BUSCADORES AUTOMÁTICOS (SEARCH ENGINES)
Son aquellos que a partir de cierta información entregada en lenguaje natural o en alguna especificación, puede recuperar la información, que uno está buscando desde la base de datos de los buscadores.
Encuentra los documentos que contengan las palabras claves introducidas.  Habitualmente localiza las páginas Web que mejor se adapten a las palabras introducidas.  No todos los buscadores automáticos entregan los mismos resultados, ya que existen diferencias en:
        · Tamaño de la base de datos
        · Frecuencia de actualización
        · Capacidades de búsqueda
¿ Cómo son ?
Están compuestos por tres partes
        · los robots que recorren la red escrutándola.
        · la base de datos (índice) que es construida por los robots.
        · el motor de búsqueda que facilita la consulta a la base.
Robots:
Son programas que buscan continuamente por todos los servidores de WWW (también en los de News , Gopher y FTP), construyendo un índice de lo hallado.  También son conocidos como arañas por su contínuo desplazamiento sobre la red o telaraña.
Cómo decide un robot qué visitar?
Depende del robot, cada uno usa su propia estrategia.  En general comienzan por un listado histórico de URLs, especialmente de documentos que tienen enlaces a muchos Webs, listas de servidores, páginas de novedades y los webs más populares de lnternet.
La mayoría de los servicios de indexación o buscadores te permiten mandar URLs manualmente que entran a formar parte de una cola para que el robot las visite.
Base de datos:
Una vez que tiene constancia de la existencia de un documento, lo indexa y lo añade a su base de datos.
Contiene todos los URL encontrados, y asociados a ellos, la información relativa sobre sus contenidos:
    · su título HTML o los primeros párrafo
    · todas las palabras del código HTML
    · hiperenlaces
    · descriptores (palabras claves) en Metatags u otras etiquetas.
Está actualizada continuamente por los robots que añaden nuevas páginas o referencias, actualizan las que han cambiado y borran las que ya no existen.
Motor de búsqueda:
Programas que buscan en una base de datos de documentos HTML indexados por un robot.
Es la parte que vemos cuando realizamos la búsqueda.  Después de introducirle una petición de búsqueda, el motor de búsqueda la coteja con la base de datos y devuelve una lista ordenada de las coincidencias.  La lista está ordenada según la relevancia de la consulta colocándose primero las más coincidentes.
¿Cómo funcionan?
Al conectar con algún buscador nos encontraremos con una página que contiene un formulario para definir nuestra búsqueda y las opciones de la misma; tras rellenarla, enviarla y esperar unos segundos, el buscador nos devolverá una lista de lugares donde figura nuestra búsqueda.  Así pues tendremos dos áreas según el propósito:
1. Formular la búsqueda y enviarla.
2. Lista de resultados, ordenados según su semejanza con las palabras claves introducidas.
Si no conseguimos los resultados deseados, volvemos al inicio, pero modificando la estrategia de búsqueda según la observación de los resultados.


No hay comentarios:

Publicar un comentario