by neigor » Fri Dec 17, 2004 7:58 pm
> у меня сейчас очень туго со временем, постараюсь написать подробнее
> (свой текст(ы)) позже (ко ВТ):
>
ok, будем ждать.
> 1) лучше не от 1,2,3.. но от любого из, действующего по поручению
> (мы же будем расширять список ОргК)
это было бы удобно, если юридически так нормально
> 2) ну зачем нужны какие-то предварительные задания?
> наша цель - вовлечь в IR как можно больше достойных людей -
> то есть мнения экспертного совета достаточно
>
> надо учитывать распространенную практику, что берут материалы сейчас,
> их долго изучают и "зреют", затем только созревают участвовать
цель предварительных заданий - отсеять просто любопытствующих,
которые все равно делать ничего не будут, а нам надо будет озабачиваться
доставкой.
Опыт показывает, что поскольку нам надо подписанное соглашение, то
процедура выдачи материалов требует не очень большой, но в принципе
заметной работы от оргкомиетета. Хочется минимизировать трепыхания в
холостую (повысить точность), но при этом не отпугнуть
реально интересующихся (сохранить полноту)
Мое видение было таким - тестовое задание своеобразная лакмусовая бумажка,
оно свободно доступно с сайта всем. Человек должен его скачать
и сдать ответ. Мы (автоматически) проверяем, что люди хотя бы соблюдают
формат результатов (предполагая, что они при этом не написали его ручками,
а реально научились парсить наш формат данных и т.д.). Задание реально
маленькое (типа 2 запроса по паре сотен документов).
Это + подписанное соглашение достаточное условие для получения материалов,
которые могут быть выданы на болванке одним из участников или
может быть выдана ссылка на на образ в Веб (после прихода в оргкомитет письма с
подписанным соглашением).
Это похоже на то, как Google делал в их programming contest.
Правда Google сразу давал качать и весь набор, но там не надо было
подписывать соглашение.
> 3) нам надо озаботиться неконтролируемым распространением:
> а) ЛИЧНОЕ обязательство со стороны руководителя команды (или
> административно ответственного лица)
> б) + включающее условие, что он соберет аналогичные обязателства со ВСЕХ
> допущенных к данным
> (может хранить их у себя)
>
> {такая схема используется в TREC и SUMMAC}
TREC вроде так не разрешал, по крайней мере для TREC 4/5 вроде бы любое
перераспространение запрещалось.
Для коллекций типа нормативной или новостной - неконтролируемое
распространение может отпугнуть тех, кто нам данные предоставляет.
В принципе, если траффика вообще не жалко и Яндекс согласится,
то наверное narod.ru можно выложить так, чтобы его можно было скачать
и без подписания соглашения
> 4) перечень материалов - в приложения, там же могут быть и ОСОБЫЕ
> условия на распространение тех или иных материалов, которые, возможно,
> подписываются отдельно
я согласен, что в принципе соглашение должно быть максимально простым и
понятным. Я не знаю до какой степени можно его было бы упростить,
сохраняя его юридическую полезность - а нам первично лишь целевое
использование материалов.
В частности, может стоит выкинуть все обязанности оргкомитета?
Неужели отсутствие обязанностей оргкомитета может отпугнуть желающего
получить данные?
-igor