Page 1 sur 1

[RESOLU]Nemo : rechercher un document par son contenu

Posté : mer. 6 avr. 2016 19:24
par Grompf
Bonjour,
J'ai une grosse série de fichiers PDF dans un dossier.
Je cherche une information dans un fichier, mais je ne sais pas lequel. Je voudrais donc chercher un mot clef, contenu dans le texte du document. Avec Windows 7, c'est assez simple.
Mais je n'ai pas trouvé de fonction similaire sur Nemo.
J'ai bien trouvé toute une série de commandes en ligne (que je n'ai pas réussi à utiliser, mais bon, il faudrait peut-être que j'y mette plus de temps).
Bref, y'a-t-il avec Nemo une manière simple de lancer une recherche incluant le contenu des fichiers ?

Re: Nemo : rechercher un document par son contenu

Posté : mer. 6 avr. 2016 19:36
par mpat
find chemin/du/répertoire -name '*.odt' -exec sh -c 'unzip -c "{}" content.xml | grep -qi "motàchercher"' ";" -print
Pour ce qui est des fichiers .pdf, la recherche se fera aussi en ligne de commande de la même façon qu'avec grep mais en installant auparavant pdfgrep


grep.
Recherche une chaîne de caractères dans des fichiers (ou depuis la console si aucun fichier n'est indiqué) ; Souvent utilisé en filtre avec d'autres commandes.
Options les plus fréquentes :

-c : Retourne le nombre de lignes au lieu des lignes elles mêmes
-n : Retourne les lignes préfixées par leur numéro
-i : Insensible à la casse
-r : Recherche récursivement dans tous les sous-répertoires ; On peut utiliser la commande rgrep
-G : Recherche en utilisant une expression rationnelle basique (option par défaut)
-E : Recherche en utilisant une expression rationnelle étendue ; On peut utiliser la commande egrep
-F : Recherche en utilisant une chaîne fixe ; On peut utiliser la commande fgrep

Exemples d'utilisation :

grep -n montexte monfichier
Retourne toutes les lignes ainsi que leur numéro où montexte apparait dans monfichier

Re: Nemo : rechercher un document par son contenu

Posté : mer. 6 avr. 2016 20:35
par Insam
En moins compliqué et tout aussi efficace, tu vas dans synaptic et tu installes Recoll !
(la première indexation peut être très longue)

Re: Nemo : rechercher un document par son contenu

Posté : mer. 6 avr. 2016 20:39
par Grompf
Suis un peu à la peine.
J'ai installé l'utilitaire pdfgrep.
Mettons que j'ouvre un terminal dans le répertoire en question et qu'il n'y ait que des fichiers pdf (ce qui simplifie). Je veux chercher tous les fichiers qui contiennent le texte "montexte" dans le contenu. Que dois-je faire ?


Autre question :
Existe-t-il un utilitaire avec une interface graphique facile à utiliser pour un newbie dans mon genre ?

édit :
Je vois qu'Insam a lu dans mes pensées !
Je vais essayer !

Re: Nemo : rechercher un document par son contenu

Posté : mer. 6 avr. 2016 20:43
par mpat
le log proposé par Insam.

Ce paquet est un moteur de recherche personnel pour du texte uniquement.
Il est basé sur un outil très solide (Xapian) pour lequel il fournit une
interface facile à utiliser et riche en fonctionnalités.

Caractéristiques :
* Interface basée sur Qt
* Prend en charge les types de documents suivants (et leurs versions compressées)
- nativement : texte, html, fichiers OpenOffice, maildir et boîte à lettres
(Mozilla et icedove mail) avec des pièces jointes, fichiers journaux pidgin
- Avec des aides extérieures : pdf (pdftotext), postscript (ghostscript), msword
(antiword), excel, ppt (catdoc), RTF (unrtf)
* Fonctions de requête puissantes, avec expressions booléennes, phrases, filtrage
sur les types de fichiers et arborescence de répertoires
* Prise en charge des jeux de caractères multiples, le traitement et le stockage
interne utilisent Unicode UTF-8
* L'extraction des racines de mots est effectuée au moment de la recherche (permet
de changer de langue après l'indexation)
* Installation facile. Pas de nécessité de démon de base de données, de serveur
web ou de langage exotique

Re: Nemo : rechercher un document par son contenu

Posté : mer. 6 avr. 2016 20:48
par Insam
Mais pour la prise en charge de tout ce que tu énumères il faut installer un tas de trucs en plus (heureusement recoll te dit quoi)
Pour trouver un texte dans les pdf, juste recoll suffit. faut juste qu'ils soient tous dans un dossier pour aller plus vite, et indiquer le chemin du dossier.

Re: Nemo : rechercher un document par son contenu

Posté : mer. 6 avr. 2016 20:50
par mpat
oui j'ai juste fais un copier du descriptif dans synaptic

Re: Nemo : rechercher un document par son contenu

Posté : mer. 6 avr. 2016 20:52
par Grompf
Insam a écrit :En moins compliqué et tout aussi efficace, tu vas dans synaptic et tu installes Recoll !
(la première indexation peut être très longue)
Merci !
ça marche !

Re: Nemo : rechercher un document par son contenu

Posté : mer. 6 avr. 2016 20:54
par Insam
Grompf a écrit :
Insam a écrit :En moins compliqué et tout aussi efficace, tu vas dans synaptic et tu installes Recoll !
(la première indexation peut être très longue)
Merci !
ça marche !
:D n'oublie pas la coche de la victoire Image dans le titre de ton premier post !