Можно ли индексировать содержимое pdf для поиска на сайте?

Добрый день! Есть сайт с каталогами где собраны инструкции технической тематики, все инструкции в pdf, сейчас поиск ведется по заголовкам с помощью SimpleSearch, а можно сделать чтобы индексировались сами pdf, то есть даю запрос в строке поиска и сайт мне выдает pdf где упоминается нужная мне информация.
EvgenyAly
11 сентября 2019, 16:02
modx.pro
506
0

Комментарии: 3

Андрей
11 сентября 2019, 22:55
0
Если инструкция в pdf именно текстом, то можно использовать что то вроде — PdfParser. Скорее всего будет проще свой поиск написать, чем дорабатывать SimpleSearch.
    Наумов Алексей
    12 сентября 2019, 09:32
    0
    Смотря сколько у вас файлов…
    Как вариант, можно через произвольную библиотеку прочитать текстовое содержимое файлов и всем массивом засунуть в скрытые ресурсы (один файл — один ресурс). Эти ресурсы и будет индексировать SimpleSearch (но лучше mSearch2). А при выводе результата поиска подменять ссылку на ресурс ссылкой на файл.
      EvgenyAly
      12 сентября 2019, 09:55
      0
      Да я как раз это и хочу сделать, файлов много больше 100.А не будет с моей стороны большой наглостью попросить пример вот этого действий
      можно через произвольную библиотеку прочитать текстовое содержимое файлов и всем массивом засунуть в скрытые ресурсы (один файл — один ресурс).
      Авторизуйтесь или зарегистрируйтесь, чтобы оставлять комментарии.
      3