Delphi: компонент html-редактор; морфология
3151
1
Уважаемые коллеги! Мне нужен совет по реализации след. задания:
Необходимо переделать электронную библиотеку:
1. в отличие от первой версии - электронные книги должны храниться в
HTML формате, а не RTF (Видимо это означает, что нужно встроить в форму html-редактор вместо старого RTF. Редатирование html не предполагается, но желательно я думаю. Конвертить RTF в html предполагаю внешней прогой, в инете такие есть.)
2. Должен быть реализован полнотекстовый поиск с учетом морфологии
русского языка (Что использовать, какие компоненты, в каком направлении рыть, подскажите, пожалуйста?)
Необходимо переделать электронную библиотеку:
1. в отличие от первой версии - электронные книги должны храниться в
HTML формате, а не RTF (Видимо это означает, что нужно встроить в форму html-редактор вместо старого RTF. Редатирование html не предполагается, но желательно я думаю. Конвертить RTF в html предполагаю внешней прогой, в инете такие есть.)
2. Должен быть реализован полнотекстовый поиск с учетом морфологии
русского языка (Что использовать, какие компоненты, в каком направлении рыть, подскажите, пожалуйста?)
"какие компоненты" - смешно, извините.
Спросите у яндекса, может они поделятся своими компонентами
Что за библиотека? книги/документы? зачем менять формат? тем более, зачем редактировать? (совет: никогда не выдумывайте то, чего нет в ТЗ; в крайнем случае, если хочется улучшить мир - спросите заказчика надо ли это; в данном случае, если речь, например, о библиотеке классической литературы - не очень понятно что там редактировать)
Пусть старые документы хранятся в RTF, новые - HTML, елси это чем-то лучше.
Каким образом все это сйечас хранится? файлами или в БД?
Есть вот такая готовая штука desktop.yandex.ru
Умеет индексировать и искать по локальным файлам, поддерживает множество форматов, и даже почту. Аналогичный продукт есть у гугля, если ен ошибаюсь.
Можно ли это прикрутить к своему хранилищу - не знаю, но вроде описан формат плагинов, позволяющий прикручивать свои хранилища (собственно оно так и устроено, если не ошибаюсь: есть "движек" индексации и поиска, и есть плагины, читающие различные форматы), не помню уже деталей.
Если хранить все просто ввиде отдельных файлов - самое оно. Сверху на это хранилище прокрутить каталог карточек, хранящий ссылки на файлы. Ну и полнотекстовый поиск будет от яндекса - вот и счастье. Ну или плагин к своему хранилищу дописать, если в БД это лежит и сильно хочется так и оставить.
Сами вы "с учетом морфологии" делать замучаетесь, только готовое.
Спросите у яндекса, может они поделятся своими компонентами
Что за библиотека? книги/документы? зачем менять формат? тем более, зачем редактировать? (совет: никогда не выдумывайте то, чего нет в ТЗ; в крайнем случае, если хочется улучшить мир - спросите заказчика надо ли это; в данном случае, если речь, например, о библиотеке классической литературы - не очень понятно что там редактировать)
Пусть старые документы хранятся в RTF, новые - HTML, елси это чем-то лучше.
Каким образом все это сйечас хранится? файлами или в БД?
Есть вот такая готовая штука desktop.yandex.ru
Умеет индексировать и искать по локальным файлам, поддерживает множество форматов, и даже почту. Аналогичный продукт есть у гугля, если ен ошибаюсь.
Можно ли это прикрутить к своему хранилищу - не знаю, но вроде описан формат плагинов, позволяющий прикручивать свои хранилища (собственно оно так и устроено, если не ошибаюсь: есть "движек" индексации и поиска, и есть плагины, читающие различные форматы), не помню уже деталей.
Если хранить все просто ввиде отдельных файлов - самое оно. Сверху на это хранилище прокрутить каталог карточек, хранящий ссылки на файлы. Ну и полнотекстовый поиск будет от яндекса - вот и счастье. Ну или плагин к своему хранилищу дописать, если в БД это лежит и сильно хочется так и оставить.
Сами вы "с учетом морфологии" делать замучаетесь, только готовое.