Qué es Solrsolr tutorial

Solr es un motor de búsqueda vertical, es decir, realiza la búsqueda sobre un determinado conjunto de documentos, ya sean textos, ya sean bases de datos. Veamos con más detalles su modo de funcionar y sus características:

¿Qué es solr?

Solr es un motor de búsqueda basado en Apache, escrito en el lenguaje de programación Java y basado en la librería de Java Lucene, que permite integrar motores de búsqueda verticales.

Un motor de búsqueda vertical, a diferencia de un "motor de búsqueda general", puede enfocarse en un segmento específico de contenido online.

Por poner un ejemplo, si tuviéramos un blog dedicado al cine, Solr nos permitiría encontrar una película determinada dentro del propio blog introduciendo el título de una película o el nombre de alguno de sus actores. Dicha búsqueda la llevaría a cabo recorriendo los documentos, ya sean de texto ya sean bases de datos, que forman parte de la web.

Así pues, con Solr podremos fácilmente crear un motor de búsqueda para llevar a cabo búsquedas en webs y bases de datos.

Qué significa la palabra SOLR

Las letras de la palabra Solr nos explican sus características y significan:

En definitiva, nos dice que Solr es sistema que nos da los resultados de una búsqueda basado en la librería Lucene, que es una librería muy utilizada para motores de búsqueda.

Cuales son las características de las busquedas con Solr

Las características principales de las búsquedas con Solr son:

Dedicamos esta página a detallar el proceso de búsqueda son Solr analizando más detenidamente sus características.

Cómo funciona Solr

Solr funciona recorriendo los documentos seleccionados e incorporándonos a un índice. Este proceso se llama indexado.

Así pues, el indexado con Solr consiste en añadir las palabras clave de los documentos que hayamos indicado al índice de Solr. Un índice de Solr acepta datos de muchas fuentes, tales como archivos XML, CSV, archivos Word o PDF.

Solr en lugar de buscar en el texto mismo, realiza la búsqueda de la palabra clave buscada en el índice, y a continuación nos indica en qué documentos se encuentra dicha palabra clave

Este tipo de indice se llama indice invertido porque la estructura de los datos se basa en las palabras clave en lugar de basarse en la página.

indexado mediante solr

En la pagina dedicada a como hace el indexado Solr detallamos el proceso de indexación de Solr y el concepto de indice inverso o invertido.

¿Qué grandes webs utilizan Solr?

Varias grandes webs utilizan Solr. Podríamos destacar:

Y otras como Instagram, etc.

¿Cuanto cuesta Solr?

Descargar Solr es gratuito. Para descargar Solr puedes ir a la pagina oficial o seguir nuestro tutorial para descargar e iniciar Solr. Así pues, se puede usar Apache Lucene Solr, modificarlo y compartirlo de forma gratuita.

Ahora bien, Solr tiene unos requerimientos de hardware para realizar las búsquedas que dependerán:

Algunos expertos estiman que para un tamaño del índice de 10GB y un único campo de búsqueda, 2 procesadores de cuatro núcleos de 16GB de memoria RAM podría gestionar el sistema.

En cuanto a la implementación en sí, un ingeniero de software, o una persona con conocimientos de archivos xml, gestión de archivos, etc, debería ser capaz de instalarlo en caso de tratar de instalar Solr con un sistema de búsquedas básico.

Si decidimos aprender e implementar Solr nosotros mismos, en esta web, en un artículo del 2015, el experto en Solr Alexandre Rafalovitch nos da una serie de consejos para dominar Solr con recursos disponibles en la propia web, el primero de los cuales sería seguir el tutorial de la propia página oficial de Solr.

Para saber más...