РОМИП

 Новости 
 Регистрация 2012! 
 О проекте 
 Манифест 
 Общие принципы 
 Заявка на участие 
 Материалы РОМИП 
 Тестовые коллекции 
 Таблицы релевантности 
 Участники 2012 
 Дорожки 2012 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Коллекция текстов из блогов с разметкой по оценочной тональности и объектам

Описание

Коллекция представляет собой набор текстов из блогов, которые участвовали в тестировании дорожек в рамках РОМИП-2011. Каждый текст относится к одной из трех тематик: книги, фильмы или цифровые фотокамеры. Кроме того, у каждого текста есть оценка асессора по 2х, 3х и 5 балльной шкале. Дополнительно для каждого текста выделены объекты, о которых идет речь (главные и второстепенные).

Статистика по набору данных
  • Объем данных: 2,5 Mb
  • Число текстов: 874
  • Кодировка: windows-1251 (исключения можно трактовать как мусор)
Права на использование

Для получения доступа к коллекции необходимо подписать соглашение об использовании.

Формат

Коллекция распространяется в виде xml файлов, определенного формата.