Тестовые коллекции

Дорожки 2012

Архив

Дорожка поиска по Веб коллекции

Дорожка посвящена оценке методов решения задачи традиционной задаче поиска по Веб. Для этого используется набор данных имитирующий Веб и Веб запросы.

Общая процедура проведения дорожки стандартна.

Исходный набор данных - коллекции Km.ru и BY.web.

Система-участник получает коллекции Km.ru и BY.web и набор заданий. Набор заданий повторяет набор заданий 2008 года и сформирован из:

всех запросов, которые оценивались в дорожке Веб поиска в предыдущих циклах РОМИП (2003-2009)
выборки запросов из лога Яндекс за 28 мая 2007 года (выбирались запросы, по которым что-то нашлось; каждый сотый; профильтровано порно фильтром). Дополнительно были удалены запросы, использующие специфику языка запросов Яндекс.
выборки из 10000 запросов к поиску по KM.ru
выборки из 10000 запросов из лога Яндекс с белорусских IP за конец мая 2008 года (были удалены запросы, использующие специфику языка запросов Яндекс, и проведена фильтрация простым порнофильтром)

Ответом системы на каждое задание является упорядоченный список документов, длиной не более 100 ссылок.

Предполагается, что результаты поиска будут предоставлены для коллекций KM.RU и BY.WEB отдельно (в отличии от дорожки по Веб поиску 2007 года).

постановка задания ассессору:
Ассессор оценивает соответствие документов исходному запросу на основе расширенного описания информационной потребности.
метод оценки: метод "общего котла" (pooling) с глубиной пула 25 (500 запросов) для By.Web и с глубиной 50 (50-100 запросов) для KM.RU (предварительный план)
шкала оценки релевантности:
- точно/возможно/вероятно/нет/невозможно оценить
- да/нет/невозможно оценить
официальные метрики:
- точность
- полнота
- 11-точечный график TREC
- bpref