Можно ли индексировать содержимое pdf для поиска на сайте?

Добрый день! Есть сайт с каталогами где собраны инструкции технической тематики, все инструкции в pdf, сейчас поиск ведется по заголовкам с помощью SimpleSearch, а можно сделать чтобы индексировались сами pdf, то есть даю запрос в строке поиска и сайт мне выдает pdf где упоминается нужная мне информация.
EvgenyAly
11 сентября 2019, 16:02
modx.pro
104
0

Комментарии: 3

Андрей
11 сентября 2019, 22:55
0
Если инструкция в pdf именно текстом, то можно использовать что то вроде — PdfParser. Скорее всего будет проще свой поиск написать, чем дорабатывать SimpleSearch.
Наумов Алексей
12 сентября 2019, 09:32
0
Смотря сколько у вас файлов…
Как вариант, можно через произвольную библиотеку прочитать текстовое содержимое файлов и всем массивом засунуть в скрытые ресурсы (один файл — один ресурс). Эти ресурсы и будет индексировать SimpleSearch (но лучше mSearch2). А при выводе результата поиска подменять ссылку на ресурс ссылкой на файл.
    EvgenyAly
    12 сентября 2019, 09:55
    0
    Да я как раз это и хочу сделать, файлов много больше 100.А не будет с моей стороны большой наглостью попросить пример вот этого действий
    можно через произвольную библиотеку прочитать текстовое содержимое файлов и всем массивом засунуть в скрытые ресурсы (один файл — один ресурс).
Авторизуйтесь или зарегистрируйтесь, чтобы оставлять комментарии.
3