РОМИП

 Новости 
 Регистрация 2012! 
 О проекте 
 Манифест 
 Общие принципы 
 Заявка на участие 
 Материалы РОМИП 
 Тестовые коллекции 
 Таблицы релевантности 
 Участники 2012 
 Дорожки 2012 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Формат представления результатов для дорожки по извлечению и классификации мнений из поисковой выдачи

Формат для предоставления результатов следующий:

<?xml version="1.0" encoding="windows-1251"?>
<romip:taskresult xmlns:romip="http://www.romip.ru/data/sentiment" collectionId="SentiBlog-2012" trackId="sentiment-extraction-%YEAR%">
<romip:run>
   <romip:systemID>Put your participant ID here</romip:systemID>
   <romip:runID>Put you run id here (anything)</romip:runID>
</romip:run>
<answerlist taskID="film">
    <query id = "234">
    <post pos = "1">
       <postID>99991</postID>
       <score> ... оценка тональности по трехбалльной шкале(см. описание дорожки по извлечению и классификации мнений из поисковой выдачи) ... </score>
    </post>
    <post pos = "2">
       <postID>7010</postID>
       <score>... оценка тональности по трехбалльной шкале(всм. описание дорожки по извлечению и классификации мнений из поисковой выдачи) ...</score>
    </post>
    ...
    </query>
    <query id = "234">
    ...
    </query>
    ...
</answerlist>
<answerlist taskID="book">
...
</answerlist>
</romip:taskresult>
Вместо %YEAR% укажите год текущего цикла РОМИП (например, 2011 для РОМИП'2011). Блок run характеризует систему, с помощью которой были предоставлены результаты.
  • systemID - идентификатор системы, который был предоставлен организаторами при регистрации.
  • runID - идентификатор модификации системы, которая использовалась для этого прогона (характеризует параметры эксперимента).
    Его форма определяется участником самостоятельно.

Тег answerlist содержит списки извлеченных документов для соответствующей области, идентификатор которой (film, book, camera) указывается как значение атрибута taskID.

Каждый запрос описывается с помощью отдельного тега query с указанием идентификатора запроса. Каждому запросу соответсвует набор найденных постов с указанием позиции в выдаче (атрибут pos, от 1 до 10), идентификатора поста (атрибут id из исходной коллекции) и оценки поста по трехбалльной шкале score (значения 2,3 или 4, см описание дорожек). При участии только в дорожке по извлечению мнений из поисковой выдачи без классификации, теги score нужно исключить из результатов.