Доброе время суток, коллеги!
Накопилось несколько вопросов.
1. Список тем для фактографического поиска
Так как я не продолжил в свое время обсуждение, то, по моему мнению, таковым
списком должен считаться последний список, предложенный Георгием.
На диске с заданием этого списка не было. Наверное, стоит создать "официальный"
файл с этим списком для использования участниками и оценщиками.
Это дело 15 минут. Могу создать, если нет возражений.
2. Формат выдачи результатов для фактографического поиска.
Очевидно, что формат будет отличаться от представления поиска - в сторону
расширения/обобщения (смещение+длина фрагмента, опционально темы фрагмента -
наверное, выдачу фрагментов нужно группировать подокументно...). В общем, кто-то
должен зафиксировать.
Также могу создать неформальное описание. Далее, видимо, потребуется обсуждение.
3. Обучающая выборка для классификации сайтов.
Будет ли новая, что обсуждалась? Влад что-то писал...
Или использовать старую? Помнится, речь также шла о старой с исправлениями...
4. Что слышно по новостной дорожке?
5. Еще заметил, что xmlns совпадает у файлов
web_adhoc2004.xml и qa_track_tasks.xml. У последнего должен отличаться.
С уважением,
Владимир Плешко