Итоги очного семинара РОМИП'2004

(read only)

Postby neigor » Sun Oct 03, 2004 5:18 pm

Добрый день всем,

1 октября состоялась очная часть семинара, которая прошла довольно успешно
(до конца семинара досидели более 35 человек :).
Труды семинара уже выложены на romip.narod.ru, в ближайшем будущем мы вероятно
выложим и слайды докладов.

На круглом столе РОМИП'2004 обсуждалось несколько важных вопросов и я хотел
бы просуммировать мои воспоминания (если я что-то важное пропустил -
пожалуйста, поправьте):

1. Интересующие задачи для РОМИП'2005

* тематическая классификация
не только Веб-сайтов и нормативных документов, но и Веб страниц
* Поиск
- классический по запросу (существующие дорожки)
- фрагментов текста по запросу (high precision)
* Построение аннотаций документа по запросу
* QA, извлечение информации и близкие задачи
- Named Entity Extraction
- сбор фактов типа "Кто? Где? Когда?"
- выявление имен должностей в текстах
- более точная задача по фактографии
* Определение направленности документа по шкале "ругают/хвалят"
* СМИ-коллекции
- поиск, классификация
- поиск тем в новостях и проблемы близкие к тематике TDT
* Выявление сообществ/путей перемещения пользователей в Вебе
* Поиск по коллекции технических статей

2. Коллекции

Процесс создания коллекции по СМИ идет благодоря усилиям Яндекс.
Конкретные параметры и сроки пока еще окончательно неизвестны.

Возможно получение некоторого подмножества журналов Яндекс или Рамблер
для дорожек связанных с анализом поведения пользователей.

Исследовать вопрос о возможности предоставления каких-то еще новых
коллекций обещало еще несколько участников семинара.

3. Сроки

Было высказано пожелание расширить сроки проведения, чтобы увеличить
время на выполнение заданий. Возможно запуск дорожек стоит разнести
по времени. Обсуждавшийся срок начала - не позднее начала февраля.

NB:
- важно грамотно запланировать период оценки - он не должен совпадать с
сессией
- при таком раннем старте будет неясна судьба заявки на грант -
будет сложно оценить доступные ресурсы

4. Нужны ли нам зарубежные участники? Как правильно их привлекать?

В принципе некоторый интерес наблюдается и можно было бы выпустить
англоязячный CFP. Однако, этим дело не ограничится.
Для участия иностранцев необходимо как-то поддерживать общение с ними:
- информация в форуме/на сайте
(вариант решения - на сайте дублируем, в форуме отвечаем на языке на
котором был задан вопрос)
- язык общения на заключительном семинаре
(видимо русский, можно сделать синхронный перевод
труды тоже видимо на русском)
Еще есть вопрос с четкостью правил участия и прозрачностью организации
- в этой области тоже надо навести порядок.

5. Доступность корпусов РОМИП для неучастников
- в ближайшее время на сайте будут опубликованы
"очень маленькие" варианты заданий,
по выполнении которых будет выдаваться ссылка на полные варианты
(цель упрощенного варианта: отсеять несерьезные запросы,
так человек хоть убедится, что он может забирать данные РОМИП
и выдавать их в правильном формате)
- необходимо поправить соглашение об участии для этого случая
Кроме требования ссылки на РОМИП при любой публикации результатов,
соглашение также видимо будет требовать предоставить копию статей
с результатами экспериментов оргкомитету/сообществу РОМИП,
если таковые будут опубликованы

6. Переезд сайта с romip.narod.ru

Обусловлено расширением требуемых сервисов для сайта,
да и с целью использования более разумного имени сайта.
Надо решить какое имя выбрать (www.romip.ru или что-то другое?)
и куда оно поначалу будет указывать (в университете нам слабо
выложить несколько гигабайт данных для свободного скачивания
- у нас к сожалению не такой хороший/бесплатный канал).

7. Место будущего очного семинара

RCDL'2005 пройдет в Ярославле, программный комитет RCDL доволен
сотрудничеством с РОМИП и выражает готовность его продолжать.
На круглом столе обсуждались альтернативные варианты, но пока
выгода от совмещения с RCDL перевешивает.
Тем не менее окончательное решение еще не принято.

-igor
neigor
Оргкомитет
 
Posts: 331
Joined: Sat Feb 08, 2003 2:06 pm

Return to Объявления Оргкомитета

Who is online

Users browsing this forum: No registered users and 8 guests

cron