Страница 1 из 1

recoll Поиск в документах

Добавлено: 07 май 2019, 20:38
demonlibra
Recoll is a desktop full-text search tool

Recoll — свободная программная система локального полнотекстового поиска.

Не могу заставить recoll индексировать файлы/каталоги на 2-м HDD и внешних носителях через консоль.
Через GUI индексирование проходит.

Индексирование для файлов в домашней папке:

Код: Выделить всё

$ ls "$HOME/111"
1.pdf  2.pdf  3.pdf  4.pdf  5.pdf

$ find "$HOME/111" -print | recollindex -c /tmp -i -e
:3:common/rclinit.cpp:340::Configuration directory: /tmp
:3:index/recollindex.cpp:705::recollindex: changing current directory to [/tmp]
:3:index/recollindex.cpp:750::recollindex: starting up
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:./utils/workqueue.h:196::DbUpd: tasks 0 nowakes 0 wsleeps 1 csleeps 0
:3:rcldb/rcldb.cpp:764::Db::add: docid 15 added [/home/demonlibra/111|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 16 added [/home/demonlibra/111/1.pdf|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 17 added [/home/demonlibra/111/3.pdf|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 18 added [/home/demonlibra/111/2.pdf|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 19 added [/home/demonlibra/111/4.pdf|]
:3:rcldb/rcldb.cpp:764::Db::add: docid 20 added [/home/demonlibra/111/5.pdf|]
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 170 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 170 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 170 mS
:3:./utils/workqueue.h:196::DbUpd: tasks 6 nowakes 6 wsleeps 7 csleeps 0
:3:./utils/workqueue.h:196::Internfile: tasks 6 nowakes 1 wsleeps 9 csleeps 2
:3:./utils/workqueue.h:196::Split: tasks 6 nowakes 6 wsleeps 8 csleeps 0

Индексирование для файлов на 2-м HDD

Код: Выделить всё

$ ls "/mnt/data/111"
1.pdf  2.pdf  3.pdf  4.pdf  5.pdf

$ find "/mnt/data/111" -print | recollindex -c /tmp -i -e
:3:common/rclinit.cpp:340::Configuration directory: /tmp
:3:index/recollindex.cpp:705::recollindex: changing current directory to [/tmp]
:3:index/recollindex.cpp:750::recollindex: starting up
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:./utils/workqueue.h:196::DbUpd: tasks 0 nowakes 0 wsleeps 1 csleeps 0
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:rcldb/rcldb.cpp:1958::Db::waitUpdIdle: total xapian work 0 mS
:3:./utils/workqueue.h:196::DbUpd: tasks 0 nowakes 0 wsleeps 1 csleeps 0
:3:./utils/workqueue.h:196::Internfile: tasks 0 nowakes 0 wsleeps 4 csleeps 0
:3:./utils/workqueue.h:196::Split: tasks 0 nowakes 0 wsleeps 2 csleeps 0

В файле настроек $HOME/.recoll/recoll.conf параметр skippedPaths пуст

Код: Выделить всё

skippedPaths = 
Обновлял версию 1.23.7-1 из стандартного репозитория, до последней 1.25.12. Результат не изменился.

Код: Выделить всё

$ sudo add-apt-repository ppa:recoll-backports/recoll-1.15-on
$ sudo apt upgrade
recoll -v
Recoll 1.25.12 + Xapian 1.4.5
Есть кто пользуется этой программой? Прошу помощи.

recoll Поиск в документах

Добавлено: 08 май 2019, 09:57
demonlibra
Прошу модератора исправить ссылку в начале сообщения.

Код: Выделить всё

[url=https://linuxmint.com.ru/recoll.org]Recoll[/url]
заменить на

Код: Выделить всё

[url=https://www.recoll.org]Recoll[/url]

recoll Поиск в документах

Добавлено: 08 май 2019, 10:07
rogoznik
demonlibra писал(а):
08 май 2019, 09:57
Прошу модератора исправить ссылку в начале сообщения.
Готово

recoll Поиск в документах

Добавлено: 08 май 2019, 12:14
FreeStyler
darkfenix, хм, всё равно битая получается ибо он не чует https https://recoll.org http://recoll.org

Прикольно, он с индексацией даже. А я как-то на пыхе хотел написать для сайтика :-D

recoll Поиск в документах

Добавлено: 08 май 2019, 12:34
demonlibra
Наверное я туплю. Правильная ссылка https://www.lesbonscomptes.com/recoll/

Это все мелочи. Меня вопрос индексации через консоль интересует.

recoll Поиск в документах

Добавлено: 08 май 2019, 13:20
rogoznik
demonlibra писал(а):
08 май 2019, 12:34
Наверное я туплю. Правильная ссылка https://www.lesbonscomptes.com/recoll/
Поменял

recoll Поиск в документах

Добавлено: 08 май 2019, 18:36
demonlibra
Попробовал на xubuntu live. Результат тот же. Индексирует только на первом жестком диске.

recoll Поиск в документах

Добавлено: 09 май 2019, 16:01
demonlibra
Нашел заветную опцию -f

Код: Выделить всё

-f tells recollindex to ignore file selection parameters from the configuration.
Никаких исключений в настройках не нашел, но с этой опцией индексирование заработало.

Код: Выделить всё

find "где_искать" -print | recollindex -c "временный_путь_для_базы" -i -e -f
или в полном виде с фильтрацией по типам файлов

Код: Выделить всё

find "где_искать" -type f -iname "*.pdf" -or -iname "*.doc" -or -iname "*.docx" -or -iname "*.xls" -or -iname "*.xlsx" -or -iname "*.txt" -or -iname "*.rtf" -or -iname "*.odt" -print | recollindex -c "временный_путь_для_базы" -i -e -f
Искал эту возможность для функции поиска строки в документах из контекстного меню Nemo
https://github.com/demonlibra/nemo-acti ... emo_action
https://github.com/demonlibra/nemo-acti ... ch_text.sh

recoll Поиск в документах

Добавлено: 09 май 2019, 18:44
demonlibra
Исправляюсь

Код: Выделить всё

find "где_искать" -type f \( -iname "*.pdf" -or -iname "*.doc" -or -iname "*.docx" -or -iname "*.xls" -or -iname "*.xlsx" -or -iname "*.txt" -or -iname "*.rtf" -or -iname "*.odt" \) -print | recollindex -c "временный_путь_для_базы" -i -e -f