Добрый день!
1. Вы, Игорь, написали: "хотел узнать мнение участников поиcковых дорожек -
хотим ли мы в этом году две отдельных дорожки по BY.Web и KM
или лучше сделать только BY.Web с увеличенным числом оцениваемых запросов
(скажем 500 на глубину 20)?
Моё мнение в случае, если будет голосование - сделать только BY.Web
с увеличенным числом оцениваемых запросов.
2. По проблеме, поднятой Сергеем Татевосяном, я уже высказался.
С уважением,
Сергей Крылов
----- Original Message -----
From: Igor Nekrestyanov
To: romip@yahoogroups.com
Sent: Monday, March 16, 2009 7:00 PM
Subject: Re: [romip] Одинаковая оценка дублей документов
Добрый день,
Прежде чем бороться с проблемой хорошо бы понять - а эта проблема актуальна?
Сколько таких случаев в таблице за два последних года?
Кстати, как раз хотел узнать мнение участников посиклвых дорожек -
хотим ли мы в этом году две отдельных дорожки по BY.Web и KM
или лучше сделать только BY.Web с увеличенным числом оцениваемых запросов
(скажем 500 на глубину 20)? Две оценки сложно - это не только
объем работы, но и задержки со стартом из-за
разного порядок сдачи результатов (выполнения заданий) участниками.
Какие есть мнения?
-igor
On Mon, 16 Mar 2009, Tatevosyan Sergey wrote:
> Добрый всем день! :)
> Для корректной оценки результатов по вебу предлагаю следующее: мы можем
> сделать базу цепочек дублей документов в коллекции КМ. Чтобы не возникло
> ситуации, когда один документ оценен релевантным, а другой, его дубль
> (например, версия для печати) - нерелевантным, после окончания оценки
> можно
> пройти скриптом по указанной базе и выявить такие случаи (если несколько
> документов по одному запросу входят в цепочку дублей, смотреть, одинаковые
> ли у них оценки; если нет - попросить того же человека переоценить
> документы
> для единообразия).
> Замечание: это не все дубли, т.к. не все они ловятся нынешней версией
> механизма.
>
> Если так нормально, ближе к процедуре оценки, предоставим базу.
>