JaliosXperience
fr en
Link

Module non intégré

Maël Sesboüé - on 5/27/08 at 11:41 AM

Bonjour, Utilisant actuellement la version 5.7.4 de JCMS (avec Apache Tomcat) et la version 2.1 de module d'indexation de fichiers, je rencontre quelques problèmes lors de la recherche de documents. En effet, le module d'indexation de fichier est bien initialisé et j'ai donc accès à son interface dans l'onglet supervision; toutefois, dans l'interface, je n'obtiens un résultat que si je tape un mot compris dans le nom du fichier (pdf, doc, xls...). La recherche ne s'effectue pas du tout à l'intérieur des fichiers. De plus, la recherche de fichiers avec ce module n'est pas du tout activée dans la portlet recherche de mon site. J'ai coché dans les propriétés de la portlet "rechercher à l'interieur des fichiers attachés" mais je n'obtiens aucun résultat, pas même si je tape un mot compris dans le nom du fichier. J'ai n'ai aucun accès aux fichiers avec la portlet recherche. Pourriez-vous me dire d'où ces problèmes viennent ?

Cordialement.

Maël Sesboüé.

Maël Sesboüé - on 5/27/08 at 12:03 PM

J'ai oublié de préciser : j'ai vérifier le fichier d'index avec l'utilitaire "lukeall" et tout est correct, le contenu des fichiers est bien indexé.

Jean-Emmanuel Roux - on 5/27/08 at 2:19 PM

Bonjour,

Si vous recherchez votre mot clef via lukeall, celui-ci vous retourne t'il la bonne ligne dans le fichier des index.

Autres pistes :

  • Le type recherché n'est-il pas exclu de la recherche ? Pour le savoir, regarder dans Administration centrale > Propriétés > Recherche > types recherchés
  • L'utilisateur qui fait la recherche, a t-il des droits de consultation sur ce type ?

Maël Sesboüé - on 5/27/08 at 3:59 PM

Merci pour votre réponse. J'ai activé les documents en type recherchable mais je n'arrive toujours pas à chercher à l'intérieur malgré le fait d'avoir coché "recherché dans les fichiers joint". Je n'ai pas non plus au contenu des fichiers via l'interface d'administration du module du back office. D'autre part, je viens de supprimer les fichiers d'index du répertoire lucene/FilesIndex pour pouvoir les regénérer; toutefois je n'arrive pas à effectuer cette opération, ni en forçant le parcours du module d'indexation des fichiers, ni en réindexant tout via la gestion des index de recherche, ni en redémarrant le site... Les fichiers d'index correspondent bien à des fichiers de type .cfs ?

Benoît Dissert - on 5/27/08 at 4:31 PM

Bonjour,

Pour faire en sorte qu'un fichier soit à nouveau pris en compte par la mécanique du plugin, il faut utiliser l'interface d'administration "Traitement des fichiers", puis cocher tel ou tel fichier pour le soumettre à nouveau.

Si vous voulez faire prendre en compte à nouveau tous les fichiers, il vous faut supprimer le fichier WEB-INF/plugins/FileProcessorPlugin/JCMSUpload/JCMSUpload.txt qui persiste les informations de traitement du plugin.

En ce qui concerne votre question sur l'extension des fichiers d'index, un index Lucene, c'est un répertoire. Lucene créé automatiquement dans ce répertoire un fichier "segment", ou "segment.gen" selon les cas, et un ensemble de fichiers, qui, de fait, ont comme extension ".cfs". Quand on veut effacer l'index, il faut effacer tout le contenu du répertoire (ou rien, sous peine d'inconsistance).

Avez-vous pu, comme mon collègue le demandait, faire une recherche textuelle à l'aide de Lukeall ? Il est des cas où ce que l'on voit en ouvrant un fichier, par exemple un PDF, ne correspond pas forcément au texte extrait. Par exemple (cas rencontré) : si c'est un fichier postscript qui a été transformé en PDF, le texte extrait n'a aucune chance de correspondre à ce que l'on voit (parce que le postscript est un format pour impression).

Il est possible, que vous soyez dans un cas comme celui-ci.

Maël Sesboüé - on 5/27/08 at 4:38 PM

J'ai pu faire une recherche textuelle via lukeall et cela fonctionne. La même recherche ne fonctionne pas dans l'interface du module (onglet "statut des fichiers") : la recherche n'est pas faite à l'intérieur des fichiers.

Benoît Dissert - on 5/27/08 at 4:43 PM

Dans l'interface du module, onglet "statut des fichiers", il ne s'agit que d'un filtre sur le nom du fichier.

Avez-vous essayé une recherche dans l'interface de recherche back-office, en admin, en cochant "rechercher dans les fichier" ? Sur plusieurs fichiers (de différents types si possible) ? Est-ce que ces fichiers correspondent bien à des FileDocument ? Ces FileDocument sont-ils pointés par d'autres contenus ?

Maël Sesboüé - on 5/27/08 at 5:24 PM

J'ai regénéré tous les index et cela fonctionne maintenant. Merci pour votre aide ! Juste une dernière question : est-il à votre connaissance possible d'exclure un certain types de documents des recherche tels que le fichiers images (jpeg..) ?

Benoît Dissert - on 5/27/08 at 5:36 PM

Les images ne sont pas indexées. Pour les exclure complètement des résultats de recherche, il faudrait développer une queryfilter (cf. JCMS 5.7 : Développement de recherches étendues avec l’API des QueryFilter).

Login   Home   fr en
JALIOS SA - SIREN 440 126 035