Bonjour,
J'ai une grosse série de fichiers PDF dans un dossier.
Je cherche une information dans un fichier, mais je ne sais pas lequel. Je voudrais donc chercher un mot clef, contenu dans le texte du document. Avec Windows 7, c'est assez simple.
Mais je n'ai pas trouvé de fonction similaire sur Nemo.
J'ai bien trouvé toute une série de commandes en ligne (que je n'ai pas réussi à utiliser, mais bon, il faudrait peut-être que j'y mette plus de temps).
Bref, y'a-t-il avec Nemo une manière simple de lancer une recherche incluant le contenu des fichiers ?
[RESOLU]Nemo : rechercher un document par son contenu
- Grompf
- Messages : 606
- Enregistré le : ven. 8 janv. 2016 23:23
- Localisation : Suisse (Canton de Vaud)
[RESOLU]Nemo : rechercher un document par son contenu
Modifié en dernier par Grompf le mer. 6 avr. 2016 20:52, modifié 1 fois.
CONFIGURATION :
1. HP Elitebook 820 G3 - Debian Gnome
2. Lenovo Thinkpad T550 i5 - carte graphique : Intel Corporation (HD Graphics 5500) - Debian Gnome
1. HP Elitebook 820 G3 - Debian Gnome
2. Lenovo Thinkpad T550 i5 - carte graphique : Intel Corporation (HD Graphics 5500) - Debian Gnome
Re: Nemo : rechercher un document par son contenu
find chemin/du/répertoire -name '*.odt' -exec sh -c 'unzip -c "{}" content.xml | grep -qi "motàchercher"' ";" -print
Pour ce qui est des fichiers .pdf, la recherche se fera aussi en ligne de commande de la même façon qu'avec grep mais en installant auparavant pdfgrep
grep.
Recherche une chaîne de caractères dans des fichiers (ou depuis la console si aucun fichier n'est indiqué) ; Souvent utilisé en filtre avec d'autres commandes.
Options les plus fréquentes :
-c : Retourne le nombre de lignes au lieu des lignes elles mêmes
-n : Retourne les lignes préfixées par leur numéro
-i : Insensible à la casse
-r : Recherche récursivement dans tous les sous-répertoires ; On peut utiliser la commande rgrep
-G : Recherche en utilisant une expression rationnelle basique (option par défaut)
-E : Recherche en utilisant une expression rationnelle étendue ; On peut utiliser la commande egrep
-F : Recherche en utilisant une chaîne fixe ; On peut utiliser la commande fgrep
Exemples d'utilisation :
grep -n montexte monfichier
Retourne toutes les lignes ainsi que leur numéro où montexte apparait dans monfichier
Pour ce qui est des fichiers .pdf, la recherche se fera aussi en ligne de commande de la même façon qu'avec grep mais en installant auparavant pdfgrep
grep.
Recherche une chaîne de caractères dans des fichiers (ou depuis la console si aucun fichier n'est indiqué) ; Souvent utilisé en filtre avec d'autres commandes.
Options les plus fréquentes :
-c : Retourne le nombre de lignes au lieu des lignes elles mêmes
-n : Retourne les lignes préfixées par leur numéro
-i : Insensible à la casse
-r : Recherche récursivement dans tous les sous-répertoires ; On peut utiliser la commande rgrep
-G : Recherche en utilisant une expression rationnelle basique (option par défaut)
-E : Recherche en utilisant une expression rationnelle étendue ; On peut utiliser la commande egrep
-F : Recherche en utilisant une chaîne fixe ; On peut utiliser la commande fgrep
Exemples d'utilisation :
grep -n montexte monfichier
Retourne toutes les lignes ainsi que leur numéro où montexte apparait dans monfichier
Clevo P775DM3-G
I7 -7700k (quad-core (8 threads) 4.2-4.5 ghz
ram 64go DDR4
Nvidia gtx 1080 8go GDDR5X
2 x ssd 500go m.2 Samsung + 2 to ssd Samsung
Lmint 18.3 Cinnamon 64bit, kernel 4.13.0-45
I7 -7700k (quad-core (8 threads) 4.2-4.5 ghz
ram 64go DDR4
Nvidia gtx 1080 8go GDDR5X
2 x ssd 500go m.2 Samsung + 2 to ssd Samsung
Lmint 18.3 Cinnamon 64bit, kernel 4.13.0-45
Re: Nemo : rechercher un document par son contenu
En moins compliqué et tout aussi efficace, tu vas dans synaptic et tu installes Recoll !
(la première indexation peut être très longue)
(la première indexation peut être très longue)

- Grompf
- Messages : 606
- Enregistré le : ven. 8 janv. 2016 23:23
- Localisation : Suisse (Canton de Vaud)
Re: Nemo : rechercher un document par son contenu
Suis un peu à la peine.
J'ai installé l'utilitaire pdfgrep.
Mettons que j'ouvre un terminal dans le répertoire en question et qu'il n'y ait que des fichiers pdf (ce qui simplifie). Je veux chercher tous les fichiers qui contiennent le texte "montexte" dans le contenu. Que dois-je faire ?
Autre question :
Existe-t-il un utilitaire avec une interface graphique facile à utiliser pour un newbie dans mon genre ?
édit :
Je vois qu'Insam a lu dans mes pensées !
Je vais essayer !
J'ai installé l'utilitaire pdfgrep.
Mettons que j'ouvre un terminal dans le répertoire en question et qu'il n'y ait que des fichiers pdf (ce qui simplifie). Je veux chercher tous les fichiers qui contiennent le texte "montexte" dans le contenu. Que dois-je faire ?
Autre question :
Existe-t-il un utilitaire avec une interface graphique facile à utiliser pour un newbie dans mon genre ?
édit :
Je vois qu'Insam a lu dans mes pensées !
Je vais essayer !
CONFIGURATION :
1. HP Elitebook 820 G3 - Debian Gnome
2. Lenovo Thinkpad T550 i5 - carte graphique : Intel Corporation (HD Graphics 5500) - Debian Gnome
1. HP Elitebook 820 G3 - Debian Gnome
2. Lenovo Thinkpad T550 i5 - carte graphique : Intel Corporation (HD Graphics 5500) - Debian Gnome
Re: Nemo : rechercher un document par son contenu
le log proposé par Insam.
Ce paquet est un moteur de recherche personnel pour du texte uniquement.
Il est basé sur un outil très solide (Xapian) pour lequel il fournit une
interface facile à utiliser et riche en fonctionnalités.
Caractéristiques :
* Interface basée sur Qt
* Prend en charge les types de documents suivants (et leurs versions compressées)
- nativement : texte, html, fichiers OpenOffice, maildir et boîte à lettres
(Mozilla et icedove mail) avec des pièces jointes, fichiers journaux pidgin
- Avec des aides extérieures : pdf (pdftotext), postscript (ghostscript), msword
(antiword), excel, ppt (catdoc), RTF (unrtf)
* Fonctions de requête puissantes, avec expressions booléennes, phrases, filtrage
sur les types de fichiers et arborescence de répertoires
* Prise en charge des jeux de caractères multiples, le traitement et le stockage
interne utilisent Unicode UTF-8
* L'extraction des racines de mots est effectuée au moment de la recherche (permet
de changer de langue après l'indexation)
* Installation facile. Pas de nécessité de démon de base de données, de serveur
web ou de langage exotique
Ce paquet est un moteur de recherche personnel pour du texte uniquement.
Il est basé sur un outil très solide (Xapian) pour lequel il fournit une
interface facile à utiliser et riche en fonctionnalités.
Caractéristiques :
* Interface basée sur Qt
* Prend en charge les types de documents suivants (et leurs versions compressées)
- nativement : texte, html, fichiers OpenOffice, maildir et boîte à lettres
(Mozilla et icedove mail) avec des pièces jointes, fichiers journaux pidgin
- Avec des aides extérieures : pdf (pdftotext), postscript (ghostscript), msword
(antiword), excel, ppt (catdoc), RTF (unrtf)
* Fonctions de requête puissantes, avec expressions booléennes, phrases, filtrage
sur les types de fichiers et arborescence de répertoires
* Prise en charge des jeux de caractères multiples, le traitement et le stockage
interne utilisent Unicode UTF-8
* L'extraction des racines de mots est effectuée au moment de la recherche (permet
de changer de langue après l'indexation)
* Installation facile. Pas de nécessité de démon de base de données, de serveur
web ou de langage exotique
Clevo P775DM3-G
I7 -7700k (quad-core (8 threads) 4.2-4.5 ghz
ram 64go DDR4
Nvidia gtx 1080 8go GDDR5X
2 x ssd 500go m.2 Samsung + 2 to ssd Samsung
Lmint 18.3 Cinnamon 64bit, kernel 4.13.0-45
I7 -7700k (quad-core (8 threads) 4.2-4.5 ghz
ram 64go DDR4
Nvidia gtx 1080 8go GDDR5X
2 x ssd 500go m.2 Samsung + 2 to ssd Samsung
Lmint 18.3 Cinnamon 64bit, kernel 4.13.0-45
Re: Nemo : rechercher un document par son contenu
Mais pour la prise en charge de tout ce que tu énumères il faut installer un tas de trucs en plus (heureusement recoll te dit quoi)
Pour trouver un texte dans les pdf, juste recoll suffit. faut juste qu'ils soient tous dans un dossier pour aller plus vite, et indiquer le chemin du dossier.
Pour trouver un texte dans les pdf, juste recoll suffit. faut juste qu'ils soient tous dans un dossier pour aller plus vite, et indiquer le chemin du dossier.

Re: Nemo : rechercher un document par son contenu
oui j'ai juste fais un copier du descriptif dans synaptic
Clevo P775DM3-G
I7 -7700k (quad-core (8 threads) 4.2-4.5 ghz
ram 64go DDR4
Nvidia gtx 1080 8go GDDR5X
2 x ssd 500go m.2 Samsung + 2 to ssd Samsung
Lmint 18.3 Cinnamon 64bit, kernel 4.13.0-45
I7 -7700k (quad-core (8 threads) 4.2-4.5 ghz
ram 64go DDR4
Nvidia gtx 1080 8go GDDR5X
2 x ssd 500go m.2 Samsung + 2 to ssd Samsung
Lmint 18.3 Cinnamon 64bit, kernel 4.13.0-45
- Grompf
- Messages : 606
- Enregistré le : ven. 8 janv. 2016 23:23
- Localisation : Suisse (Canton de Vaud)
Re: Nemo : rechercher un document par son contenu
Merci !Insam a écrit :En moins compliqué et tout aussi efficace, tu vas dans synaptic et tu installes Recoll !
(la première indexation peut être très longue)
ça marche !
CONFIGURATION :
1. HP Elitebook 820 G3 - Debian Gnome
2. Lenovo Thinkpad T550 i5 - carte graphique : Intel Corporation (HD Graphics 5500) - Debian Gnome
1. HP Elitebook 820 G3 - Debian Gnome
2. Lenovo Thinkpad T550 i5 - carte graphique : Intel Corporation (HD Graphics 5500) - Debian Gnome
Re: Nemo : rechercher un document par son contenu
Grompf a écrit :Merci !Insam a écrit :En moins compliqué et tout aussi efficace, tu vas dans synaptic et tu installes Recoll !
(la première indexation peut être très longue)
ça marche !
