РОМИП

 Новости 
 Регистрация 2012! 
 О проекте 
 Манифест 
 Общие принципы 
 Заявка на участие 
 Материалы РОМИП 
 Тестовые коллекции 
 Таблицы релевантности 
 Участники 2012 
 Дорожки 2012 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Формат представления результатов для дорожки по поиску фактов

Предполагается, что результат представляет собой XML файл или набор XML файлов, каждый из которых содержит ответы для одного или нескольких заданий (т.е. запросов).

Структура XML следующая:

<romip:taskresult xmlns="http://www.romip.ru/data/qa" xmlns:romip="http://www.romip.ru/data/common" trackId="ROMIP-2004-QA">
  <romip:run>
    <romip:systemID>yellow</romip:systemID>
    <romip:runID>1</romip:runID>
  </romip:run>
  <result frame-length="150">
    <task id="qa1">
      <fact sourceDocumentId="http://aaa.narod.ru/a.html" offset="238" length="95">
       <class id="Category1"/>
       <class id="Category2"/>
       <text>passage text</text>
      </fact>
    </task>
  </result>
</romip:taskresult>
Блок run характеризует систему с помощью которой были предоставлены результаты. systemID - идентификатор системы, которые был предоставлен организаторами при регистрации. runID - идентификатор модификации системы, которая использовалась для этого прогона (характеризует параметры эксперимента), - его форма определяется участником самостоятельно.

аттрибут frame-length у тэга result определяет максимальную длину фрагментов (разрешенные значения 150 и 300)
sourceDocumentId - индентификатор документа (docId) из коллекции
offset и length - отступ и длина фрагмента в исходном документе в байтах
class - опциональный тэг для ссылки на категорию к которой относится этот факт (идентификатор категории определен в словаре категорий для этой дорожки). Разрешено от 0 до 3-х тегов.
text - собственно текст фрагмента, содержащего описание факта, без html разметки.