Можно ли индексировать содержимое pdf для поиска на сайте?
Добрый день! Есть сайт с каталогами где собраны инструкции технической тематики, все инструкции в pdf, сейчас поиск ведется по заголовкам с помощью SimpleSearch, а можно сделать чтобы индексировались сами pdf, то есть даю запрос в строке поиска и сайт мне выдает pdf где упоминается нужная мне информация.
- ВКонтакте
- Telegram
- Viber
- РЎРєРѕРїРСвЂВВВВВВВВровать ссылку
693
0
Комментарии: 3
12 сентября 2019, 09:32
Смотря сколько у вас файлов…
Как вариант, можно через произвольную библиотеку прочитать текстовое содержимое файлов и всем массивом засунуть в скрытые ресурсы (один файл — один ресурс). Эти ресурсы и будет индексировать SimpleSearch (но лучше mSearch2). А при выводе результата поиска подменять ссылку на ресурс ссылкой на файл.
Как вариант, можно через произвольную библиотеку прочитать текстовое содержимое файлов и всем массивом засунуть в скрытые ресурсы (один файл — один ресурс). Эти ресурсы и будет индексировать SimpleSearch (но лучше mSearch2). А при выводе результата поиска подменять ссылку на ресурс ссылкой на файл.
12 сентября 2019, 09:55
Да я как раз это и хочу сделать, файлов много больше 100.А не будет с моей стороны большой наглостью попросить пример вот этого действий
можно через произвольную библиотеку прочитать текстовое содержимое файлов и всем массивом засунуть в скрытые ресурсы (один файл — один ресурс).
Авторизуйтесь или зарегистрируйтесь, чтобы оставлять комментарии.
Здесь упомянуты:
Компонент | Текущая версия | Закачки |
mSearch2 | 1.14.12-pl от 09.01.2025 | 19 273 |
Вчера в 21:11
Здравствуйте
Есть желание использовать компонент polylang для автоматизации перевода с наименьшими усилиями, но есть пару вопросов, которые хотелось ...
Polylang 143
Вчера в 16:30
Добрый день.
Удалите плагин vpSystem от пакета.
[VirtualPage] - Виртуальные страницы. 183
Вчера в 08:40
Хочестя в тикеты при сохранении комментария добавить кнопку «проверить на ошибки» и при нажатии на нее проверить комментарий на ошибки в нейросети сох...
pbStudio: Создаём сайт с PageBlocks – настройка и главная страница 6
Вчера в 08:36
Нет, через апи идет запрос в ChatGPT, который формирует необходимые данные о блоке, а дальше PageBlocks их разбирает и создает все нужные элементы.
PageBlocks 2.6.0. Настройка меню MODX и гибкое управление страницей пользователя 12
Вчера в 00:03
Не работает парсинг с vk.com, vkvideo.ru
[videoGallery] 1.4.0 Поддержка VK Video и ещё пара фишек 9
17 апреля 2025, 23:01
Можете тоже подсказать как победить данную ошибку?
msGallerySearch - загрузка изображений в галерею minishop2 по ссылке и Google поиск картинок 44
17 апреля 2025, 21:35
Действительно! Самого главного я и не обозначил! Спасибо! Поправлю заголовок.
Речь идет именно о панели менеджера и возможности управления заказами.
...
Вывод перечня заказанных товаров в таблицу с заказами minishop2 (панель менеджера) 8
17 апреля 2025, 17:49
Очевидно ты используешь источник файлов, поэтому в админке путь прописан от источника, хочешь полный путь, откажись от источника файлов.
Не открываются загруженные файлы пишет страница не найдена 2
17 апреля 2025, 15:08
Привет, Henk. Спасибо за ответ! В посте по ссылке меня больше всего заинтересовала фраза «мы интегрировали AI в медиа-менеджер, чтобы значительно упро...
MODX/AI Hackathon Part 2 (27 марта) 4
17 апреля 2025, 13:17
в preg_match проверка проходит, и туда 100% приходит url
Здравствуйте! Первый раз такое вижу, у слеша, не 1 символ в строке, а 9!! Как это делает MODX 2