Интерфейс пользователя поисковика

Пользователь будет считать систему "своей", если он в значительной степени может управлять результатами ее работы, вводя управляющие воздействия и получая соответствующие отклики. В случае поисковых систем воздействие пользователя - это запрос и набор дополнительных параметров. Можно констатировать, что возможности эффективного управления результатами поиска в общем случае находятся в обратной зависимости от объема индекса системы.

Например, ни одна из известных автору систем не в состоянии сегодня ранжировать найденные документы по длине, как это делала некогда система Alltheweb, в то время, когда ее индекс не превышал миллиарда документов. Система "Яндекс", объем индекса которой в настоящее время - 4,55 млрд. документов, позволяет ранжировать релевантные документы по датам, чего не способна делать Google, индекс которой на порядки больший. А именно последняя возможность кажется автору принципиально важной для аналитической работы - при постоянном отслеживании публикаций по одному и тому же запросу. Для пользователя существенно наличие интуитивного информационно-поискового языка, удобная навигация в результатах поиска, ранжирование результатов, получение автоматически формируемых понятных кратких описаний документов (сниппетов).

Интерфейсы режимов "расширенного поиска" большинства поисковых систем сегодня, с одной стороны, перегружены, а с другой - не позволяют в полной мере выразить все информационные потребности. Очень часто пользователь буквально тонет в результатах первичного поиска, но, переходя в режим "расширенного", заполняя все прилагаемые поля, приходит к отсутствию результатов (при том что основная проблема веба, как информационной среды, - это избыточность информации). В связи с этим в последнее время получили распространение более гибкие визуальные интерфейсы уточнения запросов, чаще всего реализуемые путем "квазиинтеллектуальной" группировки (кластеризации) результатов первичного поиска. Появилось множество подходов, общее у которых - попытка представить результаты поиска и соответствующие им кластеры в удобном для пользователей виде.

Например, российская метапоисковая система Nigma.ru по слову "Интернет" представляет кластеры (сгруппированные документы), соответствующие автоматически определенным словам (тэгам) "интернет-магазин", "услуги", "каталог товаров", "доставка", "ссылка" др., что свидетельствует о коммерциализации российского сегмента Интернета. Nigma.ru также использует технологию отображения результатов кластеризации в виде "облака" тэгов. На каждый тэг можно "кликнуть", в результате чего получить подчиненные ему тэги. Результаты поиска, соответствующие выбранным тэгам, отображаются в нижней части страницы в традиционном списковом виде.

Другая российская поисковая система Qintura (http://search.quintura.ru/) обладает "интеллектуальным" интерфейсом, который обеспечивает получение автоматических подсказок по введенному запросу, помогает динамично управлять  процессом поиска. По запросу из одного слова Quintura предъявляет возможные фразы и словосочетания, которыми при необходимости расширяется первичный поисковый запрос.

Развитым графическим интерфейсом обладает система Гроккер (grokker.com), результаты поиска в которой группируются в круговые диаграммы. Система позволяет производить поиск в базах данных Yahoo!, Википедии, Amazon Books. Интересной особенностью системы являются такие средства уточнения запроса, как управления временем публикаций (с помощью "ползунка", как и у известного агрегатора новостей NewsIsFree), а также выбор доменов или источников.

Одним из самых динамичных новостных ресурсов Интернета сегодня можно считать и живые журналы (блоги). Компания TouchGraph, в частности, реализовала интерфейс для визуализации социосетей на основе Livejournal . TouchGraph LiveJournal Browser. Однако самый популярный инструмент компании TouchGraph Google Browser (http://www.touchgraph.com/TGGoogleBrowser.html), представляющий собой Java-апплет для визуализации тематического подобия веб-сайтов. Это весьма полезный инструмент при поиске сайтов, связанных с исходным общей тематикой. В интерфейсе TouchGraph Google Browser можно увидеть все сайты, связанные ссылками с исходным заданным сайтом, при этом пользователь может задавать глубину связей и отображать взаимосвязи различных сайтов.

Системы визуального поиска фокусируются на психологических аспектах человеческого восприятия, ориентируясь на методики, которые используют люди в процессе поиска. Именно поэтому визуальные поисковые системы имеют все шансы потеснить на информационном рынке таких гигантов веб-поиска, как Google и Yahoo!, используя базы данных последних. С другой стороны, может быть, более очевидный ход событий заключается в переходе ведущих сетевых ИПС в область визуального поиска? Ведь для пользователей визуально организованные результаты поиска выглядят гораздо привлекательнее и понятнее, чем списки гиперссылок и сниппетов, формируемых традиционными поисковыми системами.

Сегодня основной объем информационных ресурсов сети Интернет сосредоточен не на веб-сайтах, а в так называемых пиринговых, файлообменных сетях. На практике пиринговые сети состоят из рабочих станций, каждая из которых взаимодействует лишь с некоторым подмножеством узлов сети (из-за ограниченности ресурсов). Для реализации протокола P2P используются клиентские программы, обеспечивающие функциональность как отдельных рабочих станций, так и всей пиринговой сети в целом.

Достаточно часто пиринговые сети дополняются выделенными серверами. Чаще всего именно такие серверы позволяют решать вопросы поиска по запросам, так как именно эта проблема для пиринговых сетей не может считаться решенной. Вопрос эффективного поиска в таких сетях средствами самих сетей остается пока открытым (поскольку большинство из них не предполагает жесткой централизации, а напротив, они по определению являются децентрализованными), однако существуют специальные поисковые сайты в веб-пространстве, помогающие решить эту проблему.

При поиске в пиринговых сетях тема полноты поиска отодвигается на второй план, главная же задача - быстрое и эффективное нахождение наиболее релевантных откликов на запрос, передаваемый от рабочей станции всей сети. В частности, актуальная проблема - уменьшение сетевого трафика, порождаемого запросом (например, пересылки запроса по многочисленным рабочим станциям), и в то же время получение наилучших характеристик выдаваемых документов, т.е. получение качественного результата.

Приемлемое качество поиска в пиринговых сетях на сегодняшний день обеспечивают лишь специализированные, централизованно наполняемые, поисковые веб-сайты, естественно, работающие по протоколу HTTP. Например, для файлообменной сети eMule таким поисковым сервером является сайт Figator.com, а для сети Bittorrent - сайт isoHunt.com.

Как и для файлообменных сетей, для этих серверов особо актуальными и критичными являются проблемы качества и достоверности предоставляемого контента, фальсификация файлов и распространение фальшивых ресурсов, вирусов, "троянских коней", возможность фальсификации ID рабочих станций.

Использование материалов сайта допускается только с активной ссылкой на источник.

Здесь нужно написать контактную информацию.

Мы в социальных сетях

© 2010 - 2018 D@nVitLabs