Можно ли индексировать содержимое pdf для поиска на сайте?
Добрый день! Есть сайт с каталогами где собраны инструкции технической тематики, все инструкции в pdf, сейчас поиск ведется по заголовкам с помощью SimpleSearch, а можно сделать чтобы индексировались сами pdf, то есть даю запрос в строке поиска и сайт мне выдает pdf где упоминается нужная мне информация.
Комментарии: 3
Если инструкция в pdf именно текстом, то можно использовать что то вроде — PdfParser. Скорее всего будет проще свой поиск написать, чем дорабатывать SimpleSearch.
Смотря сколько у вас файлов…
Как вариант, можно через произвольную библиотеку прочитать текстовое содержимое файлов и всем массивом засунуть в скрытые ресурсы (один файл — один ресурс). Эти ресурсы и будет индексировать SimpleSearch (но лучше mSearch2). А при выводе результата поиска подменять ссылку на ресурс ссылкой на файл.
Как вариант, можно через произвольную библиотеку прочитать текстовое содержимое файлов и всем массивом засунуть в скрытые ресурсы (один файл — один ресурс). Эти ресурсы и будет индексировать SimpleSearch (но лучше mSearch2). А при выводе результата поиска подменять ссылку на ресурс ссылкой на файл.
Да я как раз это и хочу сделать, файлов много больше 100.А не будет с моей стороны большой наглостью попросить пример вот этого действий
можно через произвольную библиотеку прочитать текстовое содержимое файлов и всем массивом засунуть в скрытые ресурсы (один файл — один ресурс).
Авторизуйтесь или зарегистрируйтесь, чтобы оставлять комментарии.