> ----- Original Message -----
> From: "oldkharkiv" <dsstepanov@...>
> To: "Sergey Krylov" <SKrylov@...>
> Sent: Tuesday, September 16, 2008 3:37 PM
> Subject: Re: Описание запросов
>
>
> > Как один из ассесор, оценивавший это задание "Фабрика звезд",
позволю
> > себе выложить его расширенное описание:
> >
> > идеальный - сайт фабрики звезд
Проанализируем описание.
1. В коллекции KM.RU _по_определению_ не может существовать сайта
"Фабрики звезд". Поэтому этот пункт сразу неправильный. Напомню, что
у нас не коллекция, состоящая из 3-4 млрд документов рунета, о
ограниченный набор документов. С таким же успехом можно искать этот
сайт в коллекции нормативно-правовых документов. Описание
сферического коня в вакууме - не наш случай.
> > релевантный+ - новости о "фабрике звезд", интервью со "звездами",
> > релевантный- - обсуждения на форумах, статьи о выпускниках
фабрики,
> > ссылки на песни "звезд"
1. Чем интервью со звездами отличаются от статей о выпускниках?
Звезды это не выпускники? Или выпускники уже не звезды?
2. Ссылки почти никогда не являются искомой информацией. Ссылка
означает, что мне надо перейти на другой, как раз релевантный
документ. За исключением каталогов, когда встречается много
однотипных ссылок (много сковородок и т.п.). Поэтому ссылки обычно
воспринимаются: если они по теме, как релевант-, в других случаях как
спам. В данном случае, следуя вашим словам, документ точно следует
оценивать как релевант-, однако ему поставлена оценка нерелевантный.
> >
> > Когда пользователи делают такие запросы, они хотят получить
информацию
> > о самой фабрике звезд (о том что это такое, кто там живет и
т.п.), а
> > не ее отходах (которыми в данном случае являются песни).
Про "хотят". Откуда вы знаете, что именно хотят получить
пользователи? Я, например, заходя на сайт с музыкой буду рад получить
песни на прослушку + список людей, входящих в "фабрику звезд". В этом
документе в явном виде присутствует список людей, входящих в Фабрику
- 2, что тоже хорошо.
Про отходы.
Вопрос: для чего создавалась фабрика звезд? Я думаю, для исполнения
песен. Это ее прямое назначение. Это документ - сборник этих песен.
Например, по запросу "Битлз" релевантными будут документы с
названиями их пластинок, потому что это их "Отходы". По запросу
"Яндекс" будет релевантным документ blogs.yandex.ru, потому что это
его "отходы", то бишь его продукция. А не только статьи и новости о
Яндексе.
В целом, описание очень академично. Точно также по запросу
"Голландия" будут нерелевантными документы с описаниями туров в
Голландию и их стоимостью. Что и было в прошлом году. А, может, я
собрался в отпуск в Голландию, и мне нужны именно туры, а статьи в
Википедии и прочие информационные материалы мне вообще неинтересны.
То есть "коммерческие" документы, документы о книгах про фабрику
звезд, туры в студию, где снималась фабрика звезд и т.п. будут
признаны нерелевантными. Я думаю, это плохая практика. Это сильно
затрудняет работу и делает процесс оптимизации параметров похожим на
шаманство, чего нужно избегать.
В этом году мы специально для таких случаев составили классификацию
возможных релевантных документов. Классификация была направлена в
оргкомитет. По представленному описанию видно, что можно "задрать"
все документы из энциклопедии mega.km.ru, тогда они будут
релевантными. Это неправильно. Выдача должна быть разнообразна. Это
самый хороший критерий выдачи. Новости ли это о предмете, статьи и
нем, о продукции, которую он выпускает. И пользователь уже сам решает
что ему нужно, что интересно. Разным нужно разное.
Так что
> > документ
http://music.km.ru/album.asp?
> > id=e876f611e88a4f0cba43de6f31f30e71 максимум можно было оценить
как
> > релевантный-
> >