Buscadores Internos: una aproximación a los criterios de calidad

Autores: Alicia García de León; Jorge Caldera Serrano (Universidad de Extremadura) 

Citación recomendada: Alicia García de León; Jorge Caldera Serrano. Buscadores Internos: una aproximación a los criterios de calidad [en linea]. "Hipertext.net", núm. 5, 2007. <http://www.hipertext.net>

Sumario

  1. Introducción: la recuperación de la información en el espacio Web
  2. Recuperación interna en un sitio Web   
    2.1. El comportamiento del usuario frente a un sitio Web     
      2.1.1. La navegación jerárquica     
      2.1.2. El uso de buscadores internos o locales   
      2.1.3. Navegación jerárquica versus uso de buscadores internos
  3. Buscadores internos
  4. Posibles soluciones para dotar de un buscador interno a un sitio Web
    4.1. Factores a considerar con vistas a la calidad de un buscador interno
    4.2. Factores a considerar para la selección de un motor de búsqueda
    4.3. Factores a considerar en la implementación de un buscador interno
      4.3.1. Presentación y localización
      4.3.2. La interfaz de acceso, interfaz de usuario
      4.3.3. Presentación de resultados
      4.3.4. Ayudas, documentación de apoyo e Información sobre la herramienta
  5. Conclusiones
  6. Bibliografía

 

1. Introducción: la recuperación de la información en el espacio Web

Asistimos cada día al crecimiento del volumen de información presentada en la Web. Existen enormes dificultades para la recuperación de información pertinente contenida en este ámbito, el cual es un fiel reflejo del crecimiento exponencial de la información científica y técnica, y de su carácter acumulativo. En tanto la capacidad humana para la lectura se mantiene constante, los usuarios se enfrentan a la limitación de leer únicamente lo que se ajusta a sus necesidades, ante un volumen informativo que supera con creces sus posibilidades de captación y entendimiento.

Muchas razones coadyuvan a la existencia de esta dificultad, como son las derivadas de la presentación de la información en la Web. Además carece de una normativa de adopción generalizada para su creación; posee un volumen abrumador; mayoritariamente no está estructurada; los sitios Web se desarrollan en ausencia de un organismo rector o centralizador y de mecanismos de arbitraje.

Tanto los creadores como los usuarios de los sitios Web se encuentran ante la falta de masa crítica, algo propio de toda herramienta joven que se ha desarrollado espontáneamente, y crecido vertiginosamente sin construir en paralelo instancias de estudio y reflexión.

Así mismo, las múltiples facilidades de edición y puesta en línea, básicamente una ventaja de la herramienta, conspiran contra su calidad y buena recuperación, en tanto permiten que, documentos de dudoso rigor y mayoritariamente carentes de normalización, sean parte del espacio Web.

Después de un inicial crecimiento vertiginoso y sin pautas, e incluso a pesar de él, se han desarrollado grandes esfuerzos por parte de los distintos agentes involucrados (creadores de los sitios, creadores de las herramientas, profesionales de la información y usuarios) para facilitar la recuperación de contenidos pertinentes en la Web.

Entre esos esfuerzos podemos distinguir la creación de:

  1. herramientas de búsqueda y algoritmos en constante perfeccionamiento;

  2. strategias para optimizar el posicionamiento en las respuestas que devuelven esas herramientas;

  3. directorios generales y especializados para reunir y seleccionar la información de la Web , incluso con valor agregado;

  4. distintas estructuras de metadatos con el fin de añadir información al sitio Web y no hacerlo estrictamente tributario de su texto;

  5. pautas para la normalización de sitios Web ;

  6. listas de criterios de calidad;

  7. políticas de mercadeo;

  8. creciente interés del ámbito institucional, universitario e investigador por una mayor optimización

 

2. Recuperación interna en un sitio Web

Así como se realizan esfuerzos para la buena recuperación de la información en el espacio Web , debe trabajarse en garantizar que, una vez en presencia de una página Web , el relacionamiento con la información sea fluido y eficiente.

¿Qué ocurre cuando el usuario está frente a un sitio Web ? ¿Cómo procura información que necesita?

Un usuario llega a una página Web ya sea porque conoce la dirección (URL); a través de un enlace (link) que le suministra otra fuente; o porque le devuelve esa información un buscador o un directorio. Puede tratarse tanto de una página principal (Home Page) como de una página interior del sitio. Una vez que está allí: ¿Cómo localiza en esa estructura la información que busca?

 

2.1. El comportamiento del usuario frente a un sitio Web

Existen diversas posturas sobre como se comporta un usuario que busca información dentro de un sitio Web.

Algunos investigadores sostienen la predominancia de las conductas de navegación dentro del sitio frente al uso de un buscador interno; otros consideran que, básicamente los usuarios se inclinan a usar un buscador interno.

 

2.1.1. La navegación jerárquica

Investigadores como Jared M. Spool [1], basados en estudios de la conducta de los usuarios, consideran que su comportamiento preponderante es la navegación dentro de la estructura Web , a la que llaman navegación jerárquica.

El rigor metodológico de las investigaciones de Spool es cuestionado por sus pares. Debemos tener presente además, que sus estudios se basan en el comportamiento de un universo de usuarios vinculados a sitios comerciales y que a partir de esa circunstancia no puede inferirse un comportamiento universal. Otros usuarios implican: otras actitudes, demandas, estrategias y comportamientos.

La navegación jerárquica es una conducta que en forma predominante o no, pueden seguir los usuarios cuando recorren un sitio Web en busca de determinada información.

Un sitio Web debe ser una estructura de información. Esa visión ha de acompañar su concepción y creación. Es necesario prever mecanismos de navegación "interna" eficaces con el fin de optimizar el acceso a la información que se ofrece.

La estructuración adecuada de la información es tan importante como su existencia. No basta con que la información exista, debe tener una organización que facilite el acceso y la presente como un todo. La lectura en la Web no es secuencial y se deben suministrar las formas adecuadas para que la navegación sea directa y provechosa.

El concepto de navegación jerárquica presupone que la información presentada en un sitio Web está estructurada y jerarquizada, lo que no es una constante. Herramientas como el Mapa del Sitio muchas veces son imposibles de crear, por la ausencia de una organización que pueda adquirir expresión gráfica.

Dentro de un sitio Web existen distintos recursos que facilitan la navegación interna como el uso de:

  1. Menú del sitio con teclas o enlaces;

  2. Barra de navegación;

  3. Cenefa lateral con enlaces;

  4. Mapa del sitio;

  5. Iconos que orientan dentro del sitio y dentro de cada página.

Quienes sostienen la predominancia de la conducta de navegación, atribuyen, entre otras causas, este comportamiento a la deficitaria calidad de los buscadores internos.

 

2.1.2. El uso de buscadores internos o locales

Jakob Nielsen [2], entre otros investigadores, considera, también a partir de estudios de comportamiento, que más de la mitad de los usuarios que visitan un sitio Web utilizan un buscador interno, un quinto del total recurre a la llamada navegación jerárquica y el resto desarrolla un comportamiento mixto.

Esta visión, sustentada entre otros por Eduardo Manchón [3], considera que " la mayoría de los usuarios reciben las primeras impresiones de los sitios Web que visitan a través de buscadores internos " y que, en consecuencia " los buscadores resultan herramientas cruciales " para que los usuarios encuentren la información que demandan.

Se sostiene también que el usuario recurre predominantemente al uso de una herramienta de búsqueda por el déficit estructural de la mayoría de los sitios Web.

Sin embargo, no podemos desconocer que, la mera existencia de un buscador interno, no garantiza la recuperación eficaz de la información. Los usuarios no siempre encuentran en los buscadores internos herramientas amigables, o ayudas adecuadas, otras veces no utilizan los términos apropiados para efectuar sus búsquedas o no saben elaborar ecuaciones que los aproximen a sus objetivos.

 

2.1.3. Navegación jerárquica versus uso de buscadores internos

Como hemos visto, los investigadores se enfrentan por dirimir cual es la conducta predominante del usuario para la localización de información.

La conducta de navegación jerárquica y el uso de los buscadores internos no son opuestos sino complementarios. Su adopción depende tanto de las características del usuario y su experiencia, como de cada situación de búsqueda y del tipo de contenido que este procurando.

La calidad de un sitio Web se sustenta en el desarrollo de una buena estructura, esta debe existir siempre. Philippe Vanhoolandt [4] en su artículo "Les moteurs de recherche internes" pone de manifiesto esta visión: " En d'autres termes, l'existence d'un moteur interne ne dispense pas le Web mestre d'une analyse approfondie de la structure et de l'arborescence des documents".

Igualmente, la presencia de un buscador interno es un gran aporte para permitir el acceso fácil y rápido a un contenido puntual. Cuando un sistema de navegación está mal estructurado, la lógica de navegación es una quimera. En esas circunstancias, es esencial facilitar la recuperación no mediante lógica de la estructura o el mapa del sitio que la presente, sino a través de un buscador interno.

Así mismo, existe una diferencia clave y esencial para posicionarse en este debate: la navegación jerárquica permite recorrer la estructura y procurar determinada información dentro de las páginas que componen un sitio Web . Mediante un buscador interno se localizan la o las ocurrencias de un término o un conjunto de términos. En consecuencia, cada comportamiento redunda en un producto esencialmente distinto, de diferente naturaleza y orientado hacia un objetivo diferente. Un tipo de comportamiento no sustituye a otro.

 

3. Buscadores internos

Llamamos buscadores a aquellos programas informáticos que, examinando la información existente a dominio público en la Red, proceden a su indización y almacenamiento. Con este material generan bases de datos que permiten su interrogación por palabra/s para la recuperación de información.

Así como existen buscadores que examinan toda la información a dominio público presentada en la Red, los buscadores que están destinados a indizar y almacenar estrictamente la información de un sitio Web son llamados buscadores internos o locales.

El buscador interno de un sitio Web es una herramienta destinada a que los usuarios de ese sitio encuentren rápidamente las páginas que contengan cierta o ciertas palabras en un ámbito restringido.

Algunos autores consideran que, cuando un sitio Web supera las 150 páginas [5] es necesario implementar un buscador interno, otros establecen esa pauta por encima de las 200 páginas [6]. Sostiene Toni Vicens Arasanz [7]: "s u usabilidad condiciona significativamente la usabilidad global del sitio Web , y debe prestársele especial atención ".

La existencia de un buscador interno pone de manifiesto la vocación de calidad de un sitio Web , así como el cuidado y rigor de sus creadores. Tal y como sostiene Vicens ejercen un "impacto emocional" sobre los usuarios que viven su presencia como un factor de profesionalismo, amigabilidad y seguridad.

La calidad de un buscador y no su mera existencia es lo que lo convierte en un factor de éxito. Una solución simple, deficitaria o improvisada, puede también ser la razón de desistir. Así lo expresa Vanhoolandt [4] a partir de los resultados de diversos estudios de comportamiento de búsqueda: " Contrairement à une idée reçue, la présence d'un moteur sur un site ne facilite pas forcément l'accès à l'information... Les raisons ? Principalement les fautes de frappe, la méconnaissance du langage d'interrogation (opérateurs, troncatures, différences entre pluriel et singulier), le peu d'intérêt accordé à l'aide en ligne et l'absence de contexte dans les résultats affichés".

Muchos usuarios juzgan la calidad de los contenidos de todo un sitio Web en base a los resultados que les suministra en respuesta a una o dos ecuaciones de búsqueda. Si el buscador del Web no es la herramienta apropiada, se llevarán una primera impresión negativa del sito y desistirán de su uso.

Un buscador interno puede además contribuir a la evaluación y el mayor conocimiento de la recuperación en el sitio por parte de sus creadores. Y en consecuencia, convertirse en un punto de partida para efectuar modificaciones en los contenidos y el diseño, por medio del análisis transaccional el cual valora las formulas y métodos de interrogación del buscador, registrando dichas consultas para su posterior análisis.

 

4. Posibles soluciones para dotar de un buscador interno a un sitio Web

Para proporcionar un buscador interno a un sitio Web , Vanhoolandt [4] distingue tres posibles opciones:

  1. utilizar una herramienta de búsqueda interna suministrada por quienes brindan hospedaje al sitio Web ;

  2. apelar a los servicios de indización a distancia suministrados por muchas organizaciones, en ese caso todas las actividades se efectúan en forma exterior al sitio, pasando a ser un objeto visitado;

  3. instalar una herramienta en el servidor, esta herramienta será responsabilidad de los administradores del sitio .

La adopción de la primera solución , parte de que el sitio contrata hospedaje Web y de que ese servicio de hospedaje brinda un servicio de calidad y a un costo razonable. Genera una dependencia con respecto a los prestadores y el grado de adecuación y especificidad de la herramienta varia. En caso de no satisfacer estrictamente las expectativas de los creadores del sitio o de los usuarios, puede adoptarse temporalmente.

La segunda solución , significa indización a distancia. En este caso se acuerda la visita periódica al sitio de un buscador externo que opera desde otro servidor.

Se crea en el sitio una interfaz para consultar esa base de datos. La demanda se formula en el propio sitio indizado y se dispara la búsqueda a la base de datos generada y que reside externamente. El usuario recibe la respuesta e interactúa con el buscador siéndole "transparente" que está operando a distancia. Este tipo de servicio es llamado Application Service Provider (ASP).

La opción tiene algunas ventajas:

  1. muchos servicios son gratuitos;

  2. algunos servicios son brindados por empresas y organizaciones de renombre;

  3. puede tratarse de herramientas de calidad;

  4. estas herramientas tienen como respaldo su misma praxis;

  5. existe masa crítica en brindar estas prestaciones;

  6. no hay que efectuar grandes esfuerzos de instalación ni configuración;

  7. la interfaz de acceso puede tener cierta adecuación local;

  8. se economizan recursos humanos y materiales;

  9. se ahorra tiempo de los administradores que transfieren las actividades;

  10. las actualizaciones y el mantenimiento quedan a cargo del sistema prestatario;

  11. no ocupan lugar en el servidor del sitio Web .

Sin embargo esta opción presenta desventajas y dificultades:

  1. se pasa a depender de un servidor externo y quedar asociada a su suerte;

  2. la adecuación de la herramienta puede tener limitaciones;

  3. la adecuación de la interfaz puede tener limitaciones;

  4. las posibilidades de exigencia a los prestatarios son diversas:

  5. las actualizaciones pueden no acompañar la dinámica del sitio.

Algunas organizaciones adoptan más de una forma de indización. Usan estos servicios y, en paralelo, desarrollan un buscador interno residente en el propio.

 

1000020000000198000001327DF1D17C

 

Figura 1. El sitio Web de la de la Organización Meteorológica Mundial (OMM)
donde coexisten dos formas de indización http://www.wmo.ch/index-sp.html

La tercera solución posible se basa en la instalación de un motor dentro del sitio a cargo de sus propios administradores. Implica esfuerzo e involucramiento. Así mismo, permite desarrollar soluciones a medida. En este trabajo, contemplamos básicamente esta última opción.

Sin duda, los factores a considerar que serán enunciados en los ítems siguientes, pueden ser de utilidad también para sustentar decisiones en torno a la elección de la primera y la segunda opción.

 

4.1. Factores a considerar con vistas a la calidad de un buscador interno

Sostiene Hassan Montero [5] " El grado de utilidad y necesidad de complejidad del buscador interno varía enormemente de un sitio Web a otro".

Cada sitio Web es diferente, tiene una misión y una audiencia específicas. Lo que lo hace bueno no es una supuesta infinita potencia o su capacidad ilimitada de almacenamiento, sino que sea el más apropiado para su audiencia. La selección y la implementación de un buscador interno deben considerar en forma prioritaria este aspecto.

Con el fin de sistematizar nuestro trabajo separaremos:

  1. aquellos factores a considerar que hacen a la calidad del programa que sustentará la herramienta y que permiten implementar un buscador interno. Llamaremos a ese programa motor de búsqueda o software especializado.

  2. aquellos factores a considerar en la implementación de ese motor de búsqueda.

Muchos de estos aspectos contemplados pertenecen a ambos grupos, o siendo parte de un grupo se materializan o visualizan en otro.

 

4.2. Factores a considerar para la selección de un motor de búsqueda

Costo : Es uno de los primeros puntos a resolver. Debemos saber si podemos o queremos gastar dinero, conocer las opciones pagas, free o de software libre, y analizar ventajas y desventajas y si es posible efectuar un acuerdo institucional en el marco de algún vínculo corporativo existente o deseable.

Requerimientos técnicos: Es importante conocer los requerimientos técnicos del programa a adoptar, tanto en términos de sistema operativo como de equipos, instalación y mantenimiento. En caso de tratarse de software libre, han de considerarse tantos las ventajas como los compromisos que un desarrollo de esta naturaleza implica.

Respaldo: Debe pesarse si tiene o no respaldo institucional o empresarial que garantice, responsabilidad, nuevas versiones, mantenimiento y actualización. Pasar a depender de una estructura que queda trunca y no puede acompañar la evolución de estas herramientas puede ser un error muy grave.

Soporte: Parte del respaldo de toda herramienta es el soporte. Se debe averiguar si hay un buen servicio de atención al usuario, o herramientas de comunicación con los usuarios y de los usuarios entre si, como una lista de correo electrónico, Web logs o servicios de news. El soporte incluye la existencia de manuales y ayudas, así como su actualización.

Complejidad para su implementación: Es importante evaluar cuanto trabajo significará la adopción del programa a elegir, conocer los insumos, tanto en términos de recursos humanos como de tiempo.

Posibilidades de adecuación: Resultará clave investigar en que medida este programa contempla o puede contemplar los requerimientos de los usuarios del sitio al que está destinado el buscador.

Robustez : Con ese término Serrano Cobos y Quintero Orta [8] denominan a aquella condición de la herramienta que se muestra en la ocurrencia del menor número de errores posibles.

Características por defecto: Debe conocerse su operativa, las características por defecto y las posibles adecuaciones en tono a estos temas, debe atenderse si:

  1. permite la creación de interfaces de acceso para de búsqueda simple y avanzada;

  2. es posible utilizar operadores Booleanos;

  3. es posible utilizar otros operadores;

  4. es posible utilizar operadores de proximidad;

  5. es posible utilizar truncamiento y stemming ;

  6. permite efectuar la eliminación de sinonimias y polisemias;

  7. permite demandar términos compuestos (utilizando comillas o frases literales);

  8. reconoce caracteres de distintos idiomas, las letras ñ o ç ;

  9. maneja conceptos relacionados (clustering);

  10. diferencia para la recuperación las letras mayúsculas y minúsculas;

  11. permite omitir las "palabras vacías", tiene un stopword incorporado y si puede crearse uno o adaptar el existentes;

  12. indiza todo tipo de archivos. txt; doc.; html o.pdf y que tareas hay que efectuar para que sea posible;

  13. permite efectuar búsquedas restringidas por un área del Web (scoped);

  14. permite efectuar búsquedas restringidas por campos;

  15. permite efectuar búsquedas restringidas por fecha del documento.

Debemos conocer también:

  1. El número de páginas que puede indizar, así como el tiempo y frecuencia y complejidad de la actualización.

  2. En base a que algortimo/s indiza y como pondera las ocurrencias de los términos con fines de posicionamiento. Debe tomarse en cuenta, por ejemplo: si ordena los resultados según el número de ocurrencias de él o los términos demandados, o si pondera los términos que ocurren en un lugar determinado del documento.

  3. Si indiza metadatos, y en caso afirmativo, si deben responder a algún estándar en particular.

  4. Si tiene capacidad de indizar imágenes.

  5. Si posee corrector ortográfico pues es muy común que los usuarios tengan errores al escribir sus demandas y puede ser muy útil asistirlo con la sugerencia de otro término.

  6. Si puede incluir opción de visualizar en html los documentos de otros formatos como PDF.

  7. Si en las referencias suministra la opción de visualizar páginas similares.

  8. La velocidad de respuesta.

Es importante tener en cuenta: ¿Cómo presenta los resultados de una búsqueda? ¿Cómo es la página de resultados por defecto? ¿Esa página es adaptable de acuerdo a las demandas del usuario? ¿Cómo es cada referencia que devuelve? ¿Qué información trae? ¿Indica las palabras que han sido parte de la demanda? ¿En base a qué criterios ordena los resultados? ¿Hay distintas posibilidades de posicionamiento?.

Con respecto a la/s interfaces de búsqueda, es deseable que se pueda crear con libertad y que permita incorporar ayudas diversas al usuario, si es posible en su propia lengua, así como la opción de acotar una búsqueda una vez efectuada.

 

4.3. Factores a considerar en la implementación de un buscador interno

La calidad de un buscador interno, no depende exclusivamente del programa o motor de búsqueda seleccionado para su creación.

Las decisiones adoptadas en torno a su implementación son claves para el desarrollo una herramienta exitosa. No necesariamente existe correspondencia entre el uso de un programa de calidad y la creación de un buscador de calidad. Así, un mismo programa puede dar lugar a productos bien distintos.

Ha de realizarse un trabajo de elaboración y una adecuación del programa con los objetivos del sitio y las necesidades de los usuarios.

 

4.3.1. Presentación y localización

Es deseable que el buscador interno aparezca en la página principal o de acceso del sitio Web.

En tanto tiene por misión de orientar al usuario dentro de la estructura, éste necesita saber de su existencia y localizarlo fácilmente. No es deseable que el buscador exista y no se lo vea claramente, o que deba ser buscado.

Dentro de la página, se considera lo ideal, colocar la caja en una zona de jerarquía visual alta como: el ángulo superior derecho o en la parte media superior.

 

1000000000000161000000F773570D3C

 

Figura 2. El buscador interno en la página de acceso al sitio Web de la Universidad de Alicante http://www.ua.es/es/index.html

Es conveniente elegir un sitio estándar para situar el buscador lo que facilitará su localización, permitirá al usuario asociar la herramienta con un lugar físico y reforzará la identidad visual corporativa.

Algunos sitios Web no colocan una "caja de búsqueda" en la página de acceso sino un enlace (link) a otra página que contiene el buscador, como por ejemplo:

 

100000000000008B000000177DE298B1

 

El icono de la lupa, desde la barra de navegación indica el acceso a la página de búsquedas internas en el sitio Web de la Universidad Carlos Tercero de Madrid. http://www.uc3m.es/

 

10000200000000570000001C5CA222B0

 

Icono que permite acceder a la interfaz de búsqueda en la página del IV Congreso Panamericano de Información en Ciencias de la Salud http://www.bireme.br/crics4w/progtx.htm

En tanto, no necesariamente la página principal es el primer encuentro de un usuario con un sitio Web , sería deseable que el buscador interno este disponible en todas las páginas del sitio. Por otra parte, es importante que desde cualquier lugar de la estructura puedan efectuarse una búsqueda interna.

Un ejemplo es el pie normalizado de cada página del Banco Mundial, incluye el acceso a la búsqueda interna.

http://www.bancomundial.org/

 

1000000000000178000000251687EC32

 

 

4.3.2. La interfaz de acceso, interfaz de usuario

Llamamos interfaz de acceso, al sistema de comandos y menús a través del cual el usuario se comunica con el programa. Es la estructura que hace posible la comunicación, nos informa qué acciones son posibles, el estado actual del objeto y los cambios producidos, y nos permite actuar con o sobre la herramienta. Se trata de un límite y a la vez un espacio común entre ambas orillas: el motor de búsqueda y el usuario frente a sus demandas.

Larson [9] la define como " uno de los componentes más importantes de cualquier sistema computacional, pues funciona como el vínculo entre el humano y la máquina. La interfaz de usuario es un conjunto de protocolos y técnicas para el intercambio de información entre una aplicación computacional y el usuario ".

La interfaz de acceso es el primer contacto con el usuario y debe presentar a la herramienta. Si la interfaz no es apropiada, no le hace justicia a la herramienta desarrollada, tanto la potencia del motor de búsqueda, como los otros desarrollos creados (forma de búsqueda avanzada, listado de resultados, mensajes de error, documentación de apoyo) quedan en silencio y el esfuerzo se pierde.

1. Localización, identificación y claridad

No sólo importante es que exista un buscador interno y que se pueda acceder a él localizándolo fácilmente, es esencial que pueda ser identificarlo como tal.

Sostiene Yusef Hassan Montero [5]: " El buscador debe presentare con una forma estándar, para que el usuario, basándose en su propia experiencia como internauta, perciba su función de forma clara... "

Una norma básica de usabilidad es que la herramienta tenga una interfaz simple y clara que los usuarios identifiquen fácilmente. Lo más estándar en materia de buscadores internos es un campo de texto con un botón al lado que diga "Buscar" u otra forma similar.

 

10000200000000D40000001C4F50EEDE

 

No deben adoptarse expresiones no claras como: " go " o " trouver " o " allons-y ", salvo que palabras como buscar o búsqueda aparezca también.

 

100002000000002400000013EF54ED54

 

Tecla con la palabra GO! que dispara la búsqueda interna en el sitio Web de JavaScript Kit http://www.javascriptkit.com/

2. Tamaño de la caja

Es deseable que el tamaño de la caja donde se incorporará el texto de la demanda sea el suficiente como para ver la expresión de búsqueda que se formula o al menos la mayor parte de ella. Esto facilitará al usuario ver los posibles errores ortográficos o de digitación

 

1000020000000044000000364FCC3D80

 

Caja del buscador interno del diario francés Liberátion http://www.liberation.fr/

 

10000200000001A000000138C823DA86

 

Figura 4. Página de búsqueda avanzada de la Universidad de Bologna (Italia) http://www.unibo.it/ , posee una caja amplia.

Un mayor espacio redunda en la posibilidad de verificar la formulación de la demanda y corregirla. Esto incide directamente en la calidad de las respuestas obtenidas y puede disminuir el margen de decepción que muchas veces acompaña estas experiencias.

Las cajas amplias se pueden desarrollar especialmente cuando se accede a la búsqueda avanzada como en el caso de la Universidad de Bologna.

3. Forma simple de búsqueda

Los estudiosos del tema sostienen que el primer contacto del usuario con la herramienta debe ser simple, directo e intuitivo.

La mayoría de los usuarios no utilizan operadores para la formulación de sus búsquedas, ni en una primera instancia, quieren restringirlas a una sección del Web. No pretenden tampoco, en un primer contacto, discriminar los documentos por fecha, idioma o tipo de soporte.

Se considera que esas posibilidades deben ser ofrecidas en la forma de búsqueda avanzada, y que, una presentación compleja de la interfaz en el inicio puede desestimular al usuario y perjudicar el posterior vínculo.

Así, Steve Krug [10] lo señala: " ... ¿porqué no coge el buscador lo que yo introduzca y me presenta lo que encuentre sin pedirme primero que defina lo que estoy buscando, sin tener que especificar lo que estoy buscando...?"

Los usuarios se sienten cómodos con las formas simples, lo que no obsta para que se le permita acceder a formas más complejas y precisas de búsqueda, desde la forma de búsqueda simple.

 

10000200000001F200000175246AB7DA

 

Figura 5. La Universidad de Montreal oferta la búsqueda avanzada desde la forma simple http://www.umontreal.ca/

La búsqueda por secciones llamada " por Scoped" , permiten que los usuarios limiten la ejecución de su demanda a un área específica del sitio. Representa una exigencia al usuario que tal vez no pueda manejar y lo abrume, puede tratarse de un contacto inicial con el sitio Web , donde no hay conocimiento de la estructura de información y sus diferentes secciones o áreas. Por otra parte, es posible que procure conocer la existencia de un contenido más allá de áreas y secciones.

 

10000200000001D30000015F49007500

Figura 6. Pantalla búsqueda de la Universidad Complutense de Madrid, presenta opciones de delimitación por áreas desde la forma simple http://www.ucm.es/info/ucmp/index.php

Igualmente, algunos sitios presentan la búsqueda por áreas desde la forma simple y lo han evaluado como útil y pertinente para sus contenidos y sus usuarios.

Siguiendo esa misma concepción, de presentar una forma simple y despojada se considera inapropiado el acceso a la búsqueda en Internet desde el área de búsqueda del buscador interno.

4. Forma avanzada de búsqueda

Como ya hemos mencionado, no es deseable que la forma de búsqueda avanzada sea presentada como primera forma de acceso a un buscador interno. Por el contrario, es deseable que el primer contacto ha establecer sea con la forma de búsqueda simple.

La forma de búsqueda avanzada debe ser una opción, una oferta desarrollada en una página aparte y a la que se puede acceder tanto desde la interfaz inicial (de presentación), como desde la página que presenta los resultados de la búsqueda simple.

La forma avanzada ha de mostrar al usuario todas las formas posibles de acotar y precisar la demanda. Esto implica: uso de operadores y delimitación por: fecha, sección dentro del Web , idiomas, tipo de archivo, etc.

Esta interfaz debe suministrar con claridad todos los elementos para formular una ecuación de búsqueda compleja y permitir operar con ellos. No es usada por la mayoría de los usuarios, que en forma mayoritaria, no poseen experiencia ni conocimiento de sus posibilidades.

La interfaz de búsqueda avanzada debe ser en si misma una página de ayuda, que oriente al usuario, y por su diseño permita un buen diálogo. Ha de atender especialmente a consideraciones ergonómicas. Si su diseño es inapropiado, toda la riqueza de posibilidades del buscador, la potencia del motor de búsqueda, los esfuerzos desarrollados en la implementación, se pierden.

En tanto el usuario no tiene porque ser experto en formulación de búsquedas booleanas, algunas interfaces utilizan frases que sustituyen a operadores. Así, la expresión " todas las palabras ", sustituye el uso del operador " and ".

La interfaz de búsqueda avanzada esta asociada con la ayuda del buscador. Se puede desarrollar un texto de ayuda a leer en una página aparte, o presentar formas de ayuda asociadas a la forma gráfica en la misma interfaz. En muchos buscadores ambas formas coexisten. Se crea un texto de ayuda y se suministra ayuda puntual asociada a la operación de la interfaz. En ambos casos, los textos deben ser breves, simples, claros y suministrar ejemplos. El acceso a la ayuda debe estar claramente presentado.

Es importante que las páginas de búsqueda avanzada indiquen claramente que existe una forma de búsqueda simple y permita acceder a ella. Recordemos que el usuario puede encontrar inicialmente la interfaz avanzada y debe conocer que no es la única forma prevista.

Se debe tener presente tanto en esta instancia, como en todas las páginas a las que accede el usuario, que deben atenderse consideraciones ergonómicas y especificaciones técnicas sobre los sistemas de diálogo usuario -computadora. Por ejemplo: grado de contraste letra y fondo; adecuación de los tipos de letras; márgenes y claridad de espacios; existencia de una identidad visual corporativa; presentación de una imagen homogénea y constante (utiliza siempre las mismos iconos y en el mismo lugar) facilitando las asociaciones del usuario y favoreciendo la rapidez de carga, al aprovechar el caché que incorporan los navegadores.

 

4.3.3. Presentación de resultados

La página de presentación de resultados de un buscador es tan importante como la interfaz de acceso. Presenta el producto de la herramienta.

1. La respuesta

Es importante que presente el número total de ítems recuperados y la ecuación que generó esta respuesta. Debe ser clara y contener la información necesaria para que el usuario pueda decidir con facilidad si los resultados que se le ofrecen le interesan o no. Ni tan extensa que lo agobie, ni tan breve que no permita sacar conclusiones. En caso de dificultades de recuperación, es deseable que se presenten mensajes como "No se encontraron resultados". Estos mensajes no pueden aparecer solos, sino asociados a la propuesta de formular una nueva demanda.

 

10000200000001B400000147946FD5A6

 

Figura 7. Ejemplo de información desplegada ante resultado: 0 en el sitio Web de Rediris de España http://rediris.es

Aunque exista una respuesta, muchos buscadores ofrecen al usuario acotar la búsqueda y presentan junto al listado de referencias, una nueva caja con la ecuación anterior que puede ser editada, otros incluso, ofrecen sugerencias como el uso de nuevos términos o la revisión de la ortografía.

2. Contenido y presentación de cada referencia

A diferencia de los motores de búsqueda que orientan la recuperación hacia todo el espacio Web , un buscador interno puede ofrecer una mayor claridad tanto en la presentación de los resultados como en su ordenación. La clave es que, en tanto somos responsables de la confección de las páginas que son los insumos del buscador, podemos diseñarlas acorde a la capacidad de lectura y valoración de la herramienta que se está implementando. En contrapartida, se debe procurar que la herramienta que adoptamos contemple las singularidades de los documentos del sitio y no fuerce su estructura.

Es en esta etapa donde se ponen en juego: las decisiones vinculadas a la elección del motor de búsqueda (que abordamos en el ítem 5.1) y queda en evidencia qué se contemplaron los requerimientos de los usuarios en la implementación y diseño del buscador. En tanto es posible el control sobre los documentos, se puede por ejemplo crear " titles " significativos y cuidados o incorporar metadatos con descripciones pertinentes.

Veamos que datos puede presentar cada referencia:

  1. Título (que es generalmente enlace al documento)

  2. Descripción

  3. URL

  4. Tamaño del documento

  5. Fecha de última modificación

  6. Idioma

  7. Tipo de documento

  8. Sección a la que pertenece el documento

  9. Grado de pertinencia que el motor considera con respecto a la demanda

  10. Documento similares, también llamados "páginas Similares" o por la expresión "mas páginas como esta"

La descripción creada a medida desde la Meta Description de los metadatos , significa un enorme aporte a la calidad de cada referencia. Un texto creado a medida no puede ser sustituido por las primeras líneas de una página o líneas tomadas al azar del total del texto.

Muchos buscadores permiten que el usuario seleccione la forma de visualización. Así algunos presentan la opción entre formas completas y abreviadas.

 

100000000000024A000000508F52DE4D

 

Figura 8. Ejemplo de referencia extensa de RAUdo, el buscador de la RAU. (http://www.rau.edu.uy/raudo/buscador.htm), incluye: indicador de pertinencia, "títle", primeras frases de la página, URL, fecha de actualización y tamaño de la página.

MERCOSUR - RAU

Figura 9. Ejemplo de referencia breve de RAUdo, el buscador de la RAU., solo presenta el "títle , implica enlace a la forma extensa.

Resulta muy útil que los términos que componen la ecuación de búsqueda aparezcan resaltados dentro de cada referencia.

 

100000000000025800000092BE0F400A

 

Figura 10. Referencia del buscador interno de la Universidad McGill de Canadá http://www.mcgill.ca/ , donde se resalta el término de la demanda.

3. Criterios de ordenación de los resultados

Los criterios de ordenación hacen a la calidad de la respuesta, pues están directamente relacionados con la pertinencia y la relevancia. Si las primeras referencias que devuelve son poco significativas, el usuario tendrá una visión negativa de la herramienta y al no estar dispuesto a seguir recorriendo resultados, desistir de esa demanda e incluso del uso del buscador. Aquí se ponen en evidencia las decisiones de elección e implementación del motor de búsqueda. Existen distintos criterios para la ordenación:

  1. por ocurrencia de un término;

  2. por ocurrencia de un término con respecto al total de términos de una página;

  3. por ubicación de un término en determinadas áreas del documento;

  4. por fecha de actualización;

  5. por algoritmos que combinan esos y otros aspectos.

Muchos buscadores permiten que el usuario seleccione la forma de ordenación, una vez que efectuó la demanda.

 

4.3.4. Ayudas, documentación de apoyo e Información sobre la herramienta

Ya hemos mencionado el papel de la ayuda. Además ayuda textual y gráfica presente en la interfaz, existen otras formas posibles como los textos introductorios y de asistencia a la búsqueda.

Es importante sean textos breves y claros, de fácil localización y que presenten ejemplos.

 

10000200000001F70000017B39FDE4A7

 

Figura 11. Página de ayuda del buscador interno del Web del Centre Hospitalier Universitaire de R ouen (CHU de Rouen) http://www.chu-rouen.fr/. Se oferta desde la forma simple de búsqueda , en la página principal del sitio.

Otra forma de asistencia está vinculada a los mensajes que se suministran a lo largo de la operación, como los de error, las sugerencias o el texto alternativo en distintas teclas e iconos. Hace a la calidad de la herramienta que un buscador presente información técnica como nombre y versión del programa utilizado, nombres de los responsables, incluso decisiones de diseño. Otros datos asociados al mantenimiento como regularidad en la actualización y fecha de la última puesta al día orientan al usuario en la calidad de la herramienta.

 

5. Conclusiones

Estamos en presencia de una herramienta vital para optimizar la recuperación interna en un sitio Web . Por su indudable impacto, merece el esfuerzo de concebirla como un desarrollo crucial orientado a la calidad. Así como somos responsables de la confección de las páginas de un sitio Web y sus contenidos, somos responsables de diseñar los caminos para que la información que nos proponemos presentar sea accesible.

Se trata de articular el "encuentro páginas Web - motor de búsqueda" y de que los mecanismos que proporcionamos para recorrer nuestros contenidos les hagan justicia.

Este encuentro ha de verse facilitado por dos factores:

  1. Al ser creadores de nuestras páginas, podemos controlarlas, y en cierta medida adecuarlas.

  2. Por otra parte elegimos el motor de búsqueda y su forma de implementación.

Resulta peligroso hacer documentos para que sean leídos por determinado motor, y estar dispuestos incluso a alterar su naturaleza. Es igualmente peligroso utilizar un motor poderoso pero mal implementado, que pudiendo contemplar la singularidad de nuestros documentos este subutilizado. Sin embargo como hemos visto ampliamente, el desarrollo de un buscador interno en un sitio Web es un aporte y no la garantía de su calidad. Un sitio Web debe ser una estructura de información, concebido y creado como tal debe estar orientado a la recuperación. Detrás de todo este esfuerzo, subyace nuestra vocación por atender al usuario, conocerlo y facilitarle el acceso. Una vocación que se desarrolla más allá de los soportes o los algoritmos. Existe un gran camino a recorrer en términos de motores, implementación y generación de documentos y trabajo pendiente de normalización, capacitación y difusión.

 

6. Bibliografía

[1] Spool, Jared M. Are There Users Who Always Search? [en línea] 2001 http://www.useit.com/alertbox/9707b.html Consultado: 18 dic. 2005.

[2] Nielsen, Jakob. Search and You May Find [en línea] 1997 http://www.useit.com/alertbox/9707b.html Consultado: 18 dic. 2005.

[3] Manchón, Eduardo. La conducta de navegación de los usuarios, sus características [en línea] 2005 http://www.wikilearning.com/la_lectura-wkccp-959-1.htm 18 dic. 2005.

[4] Vanhoolandt , Philippe. Les moteurs de recherche internes [en línea] 1999 http://www.vanho.com/articles/1377.htm Consultado: 18 dic. 2005.

[5] Hassan Montero, Yusef. Buscador Interno. [en línea] Diciembre 2002 http://www.nosolousabilidad.com/articulos/buscador_interno.htm Consultado: 18 dic. 2005.

[6] Instone, Keith. Site Usability Heuristics for the Web [en línea] 1997 http://www.webreview.com/1997/10_10/strategists/10_10_97_2.shtml Consultado: 18 dic. 2005.

[7] Vicens Arasanz, Toni. Normas básicas de usabilidad para buscadores internos [en línea] 2002 http://www.evolucy.com/esp/columns/20021024_usabilidad_buscadores.html Consultado: 18 dic. 2005.

[8] Serrano Cobos, Jorge; Quintero Orta, Ana. Elección de un motor de búsqueda: Pasos a seguir. [en línea]. Hipertext.net, nro. 1, 2003. http://www.hipertext.net/web/pag189.htm Consultado: Consultado: 18 dic. 2005.

[9] Larson, James. Interactive software. New Jersey : Yourdon Press 1992.

[10] Krug, Steve. No me hagas pensar. Madrid : Pearson Educación, 2001.



Creative Commons License
Last updated 05-06-2012
© Universitat Pompeu Fabra, Barcelona