> Предлагаю как-то зафиксировать след. вопрос о соответвии коллекций и
> заданий.
это абсолютно правильная идея, все должны понимать одинаково.
прошу прощения, что мы этого не сделали раньше -
я все откладывал публикацию формальных правил и зря
> Коллекция narod.ru из romip-2003 была разделена на тестовую и обучающую
> выборки. Поисковую дорожку требовалось выполнить для совокупности
> выборок, а результаты классификации представить только по тестовой
> выборке.
>
> Теперь предполагается, что обучающая выборка будет подмножеством dmoz.
> Кроме того, задание по классификации сайтов будет выполняться позже.
>
> Таким образом, получается след. соотв. между заданиями и коллекциями:
> web-adhoc - совокупность выборок narod.ru;
> web-qa - совокупность выборок narod.ru;
> web-classification -
> тестовая выборка = совокупность выборок narod.ru,
> обучающая выбока = dmoz.
для коллекции нормативных документов:
legal-adhoc - обе набора (legal.* и legal_training.*)
legal-classification
обучающая выборка = legal_training.*
тестовая выборка = legal.*
-igor