Разработали модель проекта DanVit search

Очевидно, поисковик должен включать в себя следующие модули:

  • Эффективный веб-краулер, который будет регулярно обходить заданную область Интернет (веб-ресурсы, имеющие отношение к Севастополю), избегая повторений и всяких ухищрений SEO. Всю скачанную информацию (html, текст, doc, xml, pdf, flash, графику) решено хранить в БД. Не треснет?! Посмотрим.
  • Индексатор, который анализирует собранную краулером информацию, оптимизирует её (исключая повторения, опять же - всякие SEO-штучки), ранжирует и подготавливает для качественного полнотекстового поиска.
  • Собственно, поисковая машина, принимающая запросы пользователя на естественном языке (с синтаксисом, максимально приближенным к Google, Яндекс и т.п.) и быстро выдающая релевантные результаты поиска. Парадигма: "идеальная поисковая система способна точно определить, что имеет в виду пользователь, и показать именно те результаты, которые ему нужны".
  • Веб-интерфейс пользователя, лёгкий, удобный. Видимо, будет похож на интерфейсы глобальных поисковых систем, чтобы не путать пользователя.
  • Интерфейс администратора, для управления всеми параметрами системы. Будет реализован, как веб-приложение.
  • Всякие дополнительные модули: аналитика, статистика, резервное копирование, оптимизации, тестирование и т.п.

Далее занимаемся вопросами конкретной реализации, выбором инструментария, изучением опыта коллег.

Использование материалов сайта допускается только с активной ссылкой на источник.

Здесь нужно написать контактную информацию.

Мы в социальных сетях

© 2010 - 2018 D@nVitLabs