| |
Семинар РОМИП'2005
Здесь собрана подробная информация о прошедшем в 2005 году семинаре:
Результаты и отчеты участников РОМИП'2005 доступны в разделе "Публикации".
Хроника событий
- 16 марта 2005
-
Начало распространения официальных приглашений к
участию в семинаре РОМИП'2005
- 31 марта 2005
-
Опубликован список участников РОМИП'2005.
- 22 апреля 2005
-
Опубликованы правила дорожек. Начало
распространения заданий для них.
- 28 мая 2005
-
В связи с техническими причинами был изменен контактный адрес
оргкомитета РОМИП. Новый адрес - romip[AT]romip.ru.
- 3 июня 2005
-
Состоялся доклад о РОМИП на конференции Диалог'2005.
- 6 июня 2005
-
Завершен прием заявок на участие.
- 11 июня 2005
-
Сроки предоставления результатов участниками перенесены на:
- 19 июня: классификация сайтов
- 19 июня: поиск по нормативной коллекции, поиск по смешанной коллекции,поиск по документу-образцу
- 19 июня: поиск по Веб, классификация Веб страниц
- 26 июня: фактографический поиск
- 2 июля: аннотирование, новостная дорожка
- 28 июня 2005
-
В связи c обнаруженной
технической ошибкой в новостной коллекции сроки сдачи результатов по
новостной дорожке и дорожке фактографического поиска перенесены на 9 июля.
- 23 июня 2005
-
Закончен сбор результатов по дорожкам поиска по Веб коллекции, по смешанной
коллекции и по документу-образцу, а также по классификации Веб-сайтов.
- 15 июля 2005
-
Закончекн сбор результатов по дорожке фактографический поиск по новостной
коллекции. Начало оценки дорожек поиска.
- 1 августа 2005
-
Закончен сбор результатов по дорожкам аннотрирования, классификации по
нормативно-правовой коллекции.
- 12 августа 2005
-
Закончен сбор результатов по дорожкам классификации Веб-страниц и
Веб-сайтов. Начало оценки дорожек аннотрирования, классификации.
- 4 сентября 2005
-
Опубликован формат для подготовки
статей для трудов РОМИП'2005. Срок сдачи статей - 15 сентября 2004.
- 18 сентября 2005
-
Разосланы результаты оценки для 8-ми из 10 дорожек РОМИП (за
исключением дорожек по фактографическому поиску и новостной дорожки).
- 23 сентября 2005
-
Разосланы результаты по второй части дорожки фактографического поиска по
новостной коллекции (поиск фактов).
- 24 сентября 2005
-
Опубликована программа очной встречи РОМИП'2005 в
Ярославле, которая проходила совместно с конференцией RCDL'2005.
- 25 сентября 2005
-
Завершен сбор отчетов участников для включения в труды РОМИП'2005.
- 8 октября 2005
-
Опубликованы слайды очной встречи, которая
состоялась в Ярославле 6 октября. Труды РОМИП'2005 выложены в разделе публикации.
- 18 октября 2005
-
Опубликованы фотографии с очной
встречи семинара РОМИП'2005 в Ярославле.
Оргкомитет
- Михаил Агеев(МГУ, Москва)
- Павел Браславский (ИМаш УрО РАН, Екатеринбург)
- Максим Губин (Кодекс, Санкт-Петербург)
- Борис Добров (УИС РОССИЯ, Москва)
- Игорь Кураленок (ПМПУ СПбГУ, Санкт-Петербург)
- Игорь Некрестьянов (мат.мех СПбГУ, Санкт-Петербург)
- Владимир Плешко (Гарант-Парк Интернет, Москва)
- Илья Сегалович (Яндекс, Москва)
- Влад Шабанов(Рамблер,Москва)
Участники
-
ACK
Исследовательский проект. В рамках РОМИП'2005 планируется провести апробацию
алгоритма уточнения поисковых запросов методом обратной связи по
релевантности.
В основе алгоритма лежит контекстно-ассоциативная модель текста, учитывающая
частоту совместной встречаемости различных терминов в предложениях
исследуемых
текстов (описание модели и метода уточнения запросов изложено в
статье, опубликованной в журнале "Труды МАИ",N18).
-
AStars
На РОМИП-2005 будет проведено тестировние нескольких алгоритмов,
разработанных исследовательской группой Института Системного Анализа РАН.
Основной упор делался на предварительную обработку текста перед
классификацией, в то время как непосредственно для классификации
использовались уже проверенные, хорошо известные алгоритмы.
-
Exactus
Интеллектуальная поисковая система "Exactus" является разработкой
Лаборатории Интеллектуальных Технологий и Систем ИСА РАН, а также
Исследовательского Центра Искусственного Интеллекта ИПС РАН. В системе
применяется метод семантико-синтаксического анализа, основанный на
принципах коммуникативно-грамматической школы и использующий
неоднородные семантические сети для представления фрагментов ситуаций,
описанных в тексте. Кроме того, точность и полнота поиска в системе
повышается также за счет: вычисления значимости фрагментов текста,
расширения поискового запроса синонимами и сходными по смыслу именными
группами, ввода запроса на естественном языке, возможности выбора
различных стратегий поиска (профилей поиска) и т. д. Разработка
является научно-исследовательской и доведена до стадии
исследовательского прототипа.
-
eXtragon
Система автоматического реферирования использует традиционные подходы для
выдел
важных предложений из текста на основе следующих параметров:
- частота встречаемости слова в тексте;
- графическое оформление слов;
- положение предложения в документе;
- "сигнальные" слова и фразы.
-
NNCS
Компания "Бинейро" представляет макет системы контекстно-зависимой
классификации и поиска документов по запросу - "NNСS" (Neural Network
Classification & Search). Планируется осуществить тестирование
разработанного
компанией подхода к представлению документов с использованием рекуррентных
нейронных сетей.
-
RCO
На РОМИП-2005 планируется провести апробацию
ряда алгоритмов, разрабатываемых исследовательской
группой бизнес-подразделения RCO компании "Гарант-Парк-Интернет".
Основное направление деятельности исследовательской группы связано с
развитием алгоритмов синтактико-семантического анализа текстов на
естественном языке. Среди прикладных задач, решаемых на базе созданных
группой алгоритмов, можно выделить построение содержательного портрета
текста, поиск упоминаний о персонах и организациях, построение
семантической сети текста, поиск и классификация фактов, оценка
тональности текста по отношению к объекту.
-
SearchInform
Технология поиска компании СофтИнформ позволяет осуществлять поиск
похожих
по содержанию документов в любых объемах данных. Она разработана на
основе математической модели анализа структуры документа и выбора
похожих слов, предложений и массивов текста.
Результатом поиска является вывод максимально
похожих на заданный фрагмент текста документов с указанием
процента релевантности. Также поддерживается поиск по словам
и фразам среди больших объемов неструктурированной информации.
-
Specs
Исследовательский проект, посвященный созданию системы
периодического тематического поиска. В рамках РОМИП-2005 будут рассмотрены
вопросы предварительной обработки текста и его представления для
классификатора, а также модификации существующих алгоритмов классификации
и алгоритмов композиции классификаторов.
-
WHO.Integrum
Система извлечения информации об объектах и связях между ними ФИО -
Должность - Организация (ФДО). В системе используются стандартные общие
лингвистические модули (морфологический, синтаксический и
фрагментационный анализаторы), настраиваемые модули выделения из текста
обозначений типизированных объектов (человек, организация, география и
т.п.) и их отождествления по тексту, а также модуль анализа обозначений
ситуаций, выраженных предикативной вершиной предложения и его актантами.
-
ДЕКОМ
Исследовательский прототип системы поиска и классификации
правовой информации.
Применяется подход на основе построения онтологии предметной области.
-
Золушка
Исследовательский проект, в рамках которого изучаются несколько
задач информационного поиска.
-
Кодекс
Полнотекстовая база данных, предназначенная для создания информационных
систем и хранилищ документов. На базе нее созданы информационно-правовый
системы "Кодекс" и "Стройэксперт", электронные системы документооборота
"Кодекс", ряд заказных систем.
-
Поиск@Mail.ru
-
Поисково-аналитическая система Галактика-Зум
Работа системы основана на составлении и анализе информационного портрета
(ИП) выборки документов. ИП представляет собой список языковых инвариантов
(слов и словосочетаний), отличающих данную выборку от прочих. ИП
используется для решения задач быстрого представления результатов запроса
без чтения текстов документов, автоклассификации и автореферирования.
-
Синдбад
Система классификации текстовой информации "Синдбад" представляет
собой набор утилит для структуризации и каталогизации текстовой
информации, в том числе, классификации данных, связи между которыми
невозможно представить в виде иерархической модели.
-
УИС РОССИЯ
Университетская информационная система РОССИЯ (www.cir.ru, УИС РОССИЯ) -
проект, нацеленный на создание информационных ресурсов для гуманитарных
исследований. Поддерживается Научно-исследовательским вычислительным
центром МГУ им.М.В.Ломоносова (НИВЦ МГУ) и АНО Центр информационных
исследований.
Для выполонений заданий РОМИП используется информационно-поисковая
система УИС РОССИЯ, к которой добавляются новые тестируемые модели и
модули.
-
Яндекс
- Новости: Новостной агрегатор 1.4
- Классификация: Классификатор 2.0 beta
- Поиск: Яндекс.Server 3.2.12
|