Как мы ищем документы в Naumen Disk или еще один вариант организации FTS
Одна из задач продукта Naumen Disk — обеспечить поиск по содержимому загружаемых файлов. Файлы в основном представляют собой документацию в различных форматах, в том числе без содержания текстового слоя. Например, сканы.
Андрей Агапов, руководитель направления разработки в Naumen, в статье на Habr рассказал, как с командой решали задачи по полнотекстовому поиску в таких документах: из каких вариантов выбирали и на чем в итоге остановились.