Recherche textuelle dans des documents

Hello,

Ma recherche fonctionne a peu près (j’ai utilisé pdftotext car je
trouvais que ça me donnait de meilleurs résultats sur des documents
scannés), par contre je me demande comment vous avez géré les accents
(j’ai des caractères bizarres propri�t�) est ce en transcodant avant
l’indexation et avant la recherche? ou y a-t-il un autre moyen?

Merci
Nicolas


Vous avez reçu ce message, car vous êtes abonné au groupe “Railsfrance”
de Google G…
Pour transmettre des messages à ce groupe, envoyez un e-mail à l’adresse
[email protected]
Pour résilier votre abonnement envoyez un e-mail à l’adresse
[email protected]

Subscription settings:
http://groups.google.com/group/railsfrance/subscribe?hl=fr

Je dirais que tu devrais t’assurer de l’encodage de tes documents en
entrée
de ton application. Donc avant l’indexation. Un petit coups de iconv …

Le 18 avril 2010 08:36, Tranquiliste [email protected] a
écrit :

C’est effectivement à iconv que je pensais

Merci


Vous avez reçu ce message, car vous êtes abonné au groupe “Railsfrance” de
Google G…
Pour transmettre des messages à ce groupe, envoyez un e-mail à l’adresse
[email protected]
Pour résilier votre abonnement envoyez un e-mail à l’adresse
[email protected]

Subscription settings:
http://groups.google.com/group/railsfrance/subscribe?hl=fr

Bonjour,

Pour ceux qui ont utilisé Xapian (1.0.16)/Xapit avez vous remarqué que
lorsque que vous utilisez une wildcard et qu’il n’y a aucun résultat,
xapian/xapit retourne l’ensemble de la base?


Vous avez reçu ce message, car vous êtes abonné au groupe “Railsfrance” de
Google G…
Pour transmettre des messages à ce groupe, envoyez un e-mail à l’adresse
[email protected]
Pour résilier votre abonnement envoyez un e-mail à l’adresse
[email protected]

Subscription settings:
http://groups.google.com/group/railsfrance/subscribe?hl=fr