Indexado con solrsolr tutorial

Mediante el indexado, Apache Solr nos permitirá buscar los términos deseados en las webs, bases de datos y archivos especificados. Veamos como lo hace.

En qué consiste el indexado en solr

El indexado es el proceso mediante el cual Solr incluye los términos de archivos específicados en un índice.

El indexado en Solr sería semejante a crear un índice al final de un libro que incluya las palabras que aparecen en dicho libro y su ubicación, de manera que básicamente llevaríamos un inventario de las palabras que aparecen en el libro y un inventario de las páginas donde aparecen dichas palabras

Es decir, al incluir contenido en el índice, hacemos dicho contenido disponible para su búsqueda por Solr.

Este tipo de índice, denominado índice invertido , es una forma de estructurar la información que va a ser recuperada por un motor de búsqueda.

Qué es un índice invertido

En un índice invertido, el buscador crea los índices, o términos de búsqueda, a partir de una serie de documentos, indicando los documentos concretos que los contienen.

indice de archivo invertido

De esta manera, cuando el usuario teclea un término de búsqueda determinado, el motor de búsqueda creado con Solr le indicará donde aparece dicho término.

En el índice invertido el índice se crea a posteriori, cuando el motor ha analizado los documentos sobre los que se basará la búsqueda.

Ejemplo de creación de un índice invertido con Solr: documentos base

Vamos a crear un índice invertido con Solr a partir de los documentos de las carpetas ejemplo que vienen con Solr.

Partimos de la base de que ya hemos descargado Solr. En el caso de no ser así, recomendamos visitar esta página donde enseñamos a hacerlo.

Si entramos en la carpeta solr > example > exampledocs comprobaremos que existen estos archivos:

Como podemos comprobar, los archivos son de tipos varios: XML, JSON, Excel, ….

Estos son los archivos sobre los que Solr creará el índice invertido.

Creación del índice invertido: carpeta index

En esta página de la web detallamos paso a paso las instrucciones para la creación del índice a partir de los archivos de ejemplo que vienen, en este caso, con la carpeta solr version 8.3.1. Te animamos a seguir el ejemplo que detallamos.

Una vez seguidas las instrucciones indicadas, nos aparecerá la siguiente pantalla:

En ellas observamos que el indexado se ha producido a partir de los documentos contenidos en la carpeta exampledocs:

Además observamos que los documentos indicados se han indexado correctamente.

Dentro de la carpeta solr > techproducts > data comprobamos que se ha creado la carpeta index:

Así pues, los documentos base han sido indexados y ya podemos hacer búsquedas con Solr.

En este tipo de índice, los términos que forman parte del índice no están predeterminados, por el contrario, se han elaborado una vez le hemos proporcionado a Solr los documentos base en los que tendrá lugar la búsqueda. Esta característica diferencia un índice invertido respecto a un índice de una base de datos tipo Access, donde previamente hemos de indicar cuales son campos.

Para acceder al Panel de Administración de Solr, teclearemos, tal como se nos indica:

localhost:8983/solr

Una vez en el Panel, llevaremos a cabo nuestra búsqueda.

Para saber más...