Désactiver index / convertir Archétypes Plone fichiers doc / pdf
-
21-09-2019 - |
Question
Si je reconstruis mon catalogue dans plone Je reçois beaucoup de ces infos:
2010-02-18T11:26:09 INFO Archetypes Error while trying to convert file contents to 'text/plain' in <Field file(file:rw)>.getIndexable() of <ATFile at /site/test1/test.doc>: Unable to find binary "wvHtml" in /sbin:/usr/sbin:/usr/local/sbin:/usr/local/bin:/usr/bin:/bin:/usr/X11R6/bin:/usr/games:/usr/lib/jvm/jre/bin
Il se trouve que les fichiers .doc et .pdf.
Je ne veux pas convertir documents ou des fichiers PDF. Comment puis-je désactiver complètement?
La solution
Vous pouvez désactiver (supprimer) dans l'outil transforme ZMI / de portal_transforms. Si Plone ne trouve pas de transformer Word en texte ou PDF clair en texte brut, il ne tentera pas d'indexer le contenu du fichier. Aller à ZMI / portal_transforms et de retirer l'article word_to_html.
Autres conseils
Il tente d'indexer vos fichiers doc / pdf en les convertissant en fichiers HTML en premier. Il suffit d'installer wv (articles). Le message disparaîtra et tous vos fichiers DOC et PDF seront indexés et apparaissent dans vos recherches.
Sur Ubuntu / Debian: sudo apt-get install wv
Y at-il une raison que vous ne voulez pas les fichiers PDF d'index ou des documents Word?
Je ne veux pas convertir docs ou pdfs. Comment puis-je désactiver complètement? [Sic]
Eh bien, vous êtes actuellement pas les indexer, donc il n'y a rien à changer.
Le message ci-dessus est un message INFO, ce n'est pas une erreur. Si vous ne voulez pas voir ces derniers dans votre journal des événements, vous pouvez modifier l'événement-log-niveau dans la configuration de votre buildout ou votre zope.conf
de la documentation:
event-log-level
Set the level of the console output for the event log. Level may be any of
CRITICAL, ERROR, WARN, INFO, DEBUG, or ALL. Defaults to INFO.