viernes, 31 de enero de 2014

Solucionar problema indexación SORL


Si se observa que los documentos que se suben no se encuentran en Alfresco se realiza lo siguiente:


Validar si se tiene accesos para la interfaz solr mediante SSL, para esto seguir el procedimiento:

Luego verificar si hay problemas con lo indices de alfresco con la siguiente ruta


si se encuentra los siguientes valores:
<long name="Count of transactions in the index but not the DB">1034</long>
En lugar del numero “1034” puede haver otro número esto indica que hay elementos que no estan indexados en Alfresco. Por lo tanto el procedimiento es ejecutar el siguiente comando:

Con esto se compara los indices que estan en la base de datos con los indices en los documentos, el resultado de esta consulta es el tiempo que demora en realizar esta verificación. Para que estos cambios se reflejen se requiere reiniciar el servidor de alfresco con esto los documentos que no esten indexados se proceden a indexar. Prueba de esto es revisar el tamaño de la carpeta.

[root@localhost solr]# cd /opt/alfresco-4.0.2.9-VUR/alf_data/solr
[root@localhost solr]#
[root@localhost solr]# pwd
/opt/alfresco-4.0.2.9-VUR/alf_data/solr



luego ejecutar el comando

[root@localhost solr]# du -sb *
4105628 apache-solr-1.4.1.war
4101544 apache-solr-1.4.1.war.unpatched
302679778       archive
502373  archive-SpacesStore
7105    CreateSSLKeystores.txt
37547   docs
6720    HowToSetUpSolr.txt
26214299        lib
247     solr-tomcat-context.xml
322     solr.xml
495064  templates
642249040       workspace
500326  workspace-SpacesStore

y verificar el tamaño de la carpeta workspace y archive  con esto se verifica que la indexacion de los documentos esta realizando de forma correcta.

Finalmente es importante cargar unos documentos y agregar la metadata y realizar pruebas de busqueda con esto se comprueba que los documentos se indexen de forma normal.

Para verificar que todos los documentos estan indexados se procede a verificar el estado mediante la url https://<IP>:8443/solr/admin/cores?action=REPORT&wt=xml

donde el resultado debe ser de la forma

<long name="Count of duplicated transactions in the index">0</long>
<long name="Count of duplicated acl transactions in the index">0</long>
<long name="Count of transactions in the index but not the DB">0</long>
<long name="Count of acl transactions in the index but not the DB">0</long>
<long name="Count of missing transactions from the Index">0</long>
<long name="Count of missing acl transactions from the Index">0</long>

donde los valores numericos son: “0”, “0”

No hay comentarios:

Publicar un comentario