РОМИП

 Новости 
 Регистрация 2012! 
 О проекте 
 Манифест 
 Общие принципы 
 Заявка на участие 
 Материалы РОМИП 
 Тестовые коллекции 
 Таблицы релевантности 
 Участники 2012 
 Дорожки 2012 
 Архив 
 Публикации 
 FAQ 
 Форум 

Switch to EnglishSwitch to English
 

Зарегистрированные участники РОМИП'08

Были получены следующие заявки на участие в РОМИП'2008:

 Поиск по запросу по Веб-коллекцииПоиск по запросу по коллекции нормативно-правовых документовПоиск по запросу по смешанной коллекцииПоиск похожих документовКлассификация Веб-сайтовКлассификация Веб-страницКлассификация нормативно-правовых документовКластеризация новостного потокаКонтекстно-зависимое аннотирование текстовых документовВопросно-ответный поискПоиск изображений по визуальному подобиюПоиск нечетких дубликатов в коллекции изображений
Branch Image - - - - - - - - - - + +
EventSupervisor - - - - - - - + - - - -
Exactus + + + + - - - - + + - -
HeadHunter + + - - - - - - - - - -
IFM - - - - - - - - - - - +
ImSim - - - - - - - - - - - +
LISA - - - - - - - - - - + +
mnoGoSearch + + + - - - - - - - - -
NNCS - - - + + - - - - - - -
PhotoFinder - - - - - - - - - - + -
RCO - - - + + + + + - - - -
RMaxg + + + - - - - - - - - -
SPECS + - - - - + + - - - - -
Subject Search Sleuth (SSS) + + + - - - - - - - - -
Yandex + - - - - - - - + - - -
Галактика-Zoom - - - + + + + - - - - -
Поиск@Mail.ru + - - - - - - - - - - +
Поиск KM.ru + + + - - - - - - - - -
УИС РОССИЯ + + - + + + + + - - - -


  • Branch Image
    Система поиска изображений по подобию и классификации в реальном времени. В основе системы лежит кластеризация в многомерном пространстве признаков изображений. Основной объем исследований заключается в выявлении и формализации различных высокоуровневых и низкоуровневых признаков изображений (цвета, формы, текстуры, наличия объектов определенных классов и пр.), а также определения их важности (весовых коэффициентов, которые используются, в частности, при кластеризации). Одной из особенностей системы является ее ориентация на эффективную работу с пиктограммами изображений (уменьшенными копиями изображений, хранящимися в базе данных поисковой системы), что облегчает процесс внедрения системы и ее модификацию.

  • EventSupervisor
    Система отбора линеек новостей посвященных одному событию, основанная на модифицированной версии алгоритма CMU TDT. Особенностью алгоритма является определение направленности текста новости (предсказательной, оповещающей или обсуждающей) и использование ее для выявления первых упоминаний события.

  • Exactus
    Exactus - система семантического поиска и анализа текстовой информации в гетерогенных информационных ресурсах и сервисах. Exactus - это научно-исследовательский проект, который развивается в Институте Системного Анализа РАН в течении последних 5 лет командой опытных лингвистов, программистов, математиков и психологов.
    Новая версия Exactus успешно сочетает в себе статистические и лингвистические методы анализа текстов и функицонирует на высокопроизводительной кластерной установке под управлением операционной системы Unix. Exactus представляет поисковый сервисы естественно-языкового поиска, вопросно-ответного поиска, расширения запроса близкими по смыслу словами из Тезауруса, персональной онтологии пользователя и много другое.

  • HeadHunter
    Экспериментальная поисковая система, в которой используются классические алгоритмы и собственные разработки. На семинаре планируется опробовать ряд алгоритмов оценки релевантности, основанных на более глубоком анализе содержания индексируемых документов.

  • IFM
    Предлагаемая система поиска нечетких дубликатов - IFM, основана на методах interest point detection , таких как Difference of Gaussians (DoG), Laplasian of Gaussian (LoG) и др. Основная идея состоит в определении ярких (salient) локальных участков в изображении, которые инвариантны по отношению к преобразованиям различного рода, и описании их в удобном для поиска виде. Таким образом, изображение характеризуется не единственным сложным и сильно многомерным вектором параметров, а набором относительно простых векторов, соответствующих локальным участкам (local interest points). При этом задача сравнения двух изображений сводится к сравнению локальных свойств этих изображений. Для решения этой задачи необходимы методы индексирования описаний локальных свойств изображения и масштабируемые методы поиска. Задачей предлагаемой системы является сравнение и обобщение существующих методов. Кроме задачи поиска дубликатов, рассматривается задача идентификации - бинарного сравнения двух изображений.

  • ImSim

  • LISA
    В основе подхода лежит идея перехода от исходного изображения к специальному представлению - так называемой матрице изменения яркостей. В качестве меры близости для сравнения изображений используется взвешенная псевдометрика, которая оперирует со знаками частных производных от функций яркостей компонент цветового пространства.

  • mnoGoSearch
    mnoGoSearch - программное обеспечение для организации поиска по сайту или группе сайтов. Из особенностей системы можно отметить использование SQL базы данных в качестве хранилища.

  • NNCS
    Система контекстно-зависимой классификации и поиска документов по запросу, основанная на представлении документов с использованием рекуррентных нейронных сетей.

  • PhotoFinder
    Исследовательский проект в области поиска изображений по содержанию. В рамках проекта реализованы методы поиска, основанные на различных цветовых и текстурных признаках изображений. Особое внимание уделяется вопросу синтеза различных методов поиска при формировании общего результата. Разработаны три алгоритма для комбинирования промежуточных результатов:

    • с использованием функции синтеза WTGF (Weighted Total with Gravitation Function), отличительной чертой которой является возможность учитывать разные веса для входных источников (неадаптивный подход);
    • "смешанные метрики": адаптивный алгоритм синтеза без использования механизма обратной связи;
    • синтез с использованием механизма обратной связи.
    В рамках РОМИП 2008 мы хотим протестировать перечисленные выше механизмы синтеза для одних и тех же методов поиска. В качестве методов поиска будет использован поиск по статистическим параметрам распределения цвета (моменты первого и второго порядков), поиск по цветовым гистограммам и поиск по текстуре с использованием фильтров ICA.

  • RCO
    Компания RCO специализируется на исследованиях в области компьютерной лингвистики и создании компонентов интеллектуального анализа текста для информационно-поисковых и информационно-аналитических систем. На семинаре планируется провести апробацию ряда алгоритмов тематической классификации документов и структуризации новостного потока.

  • RMaxg
    Библиотека и набор тестовых утилит для проведения экспериментов в области сжатия данных, эффективного индексирования, статистических моделей и методов машинного обучения.

  • SPECS
    Исследовательский проект, посвященный созданию системы периодического тематического поиска в Web. В рамках РОМИП будет проведена оценка влияние на качество решения задач поиска и классификации использования различных методов сегментации Web-страниц.

  • Subject Search Sleuth (SSS)
    Subject Search Sleuth (SSS) - это система поиска и построения резюме, в основе которой лежит оригинальный быстрый непереборный алгорифм приближённого поиска строки запроса, котрый допускает перестановку терминов, присутствующих в образце, а также присутствие других терминов или отсутствие некоторых из них. Благодаря использованию в качестве элементов поиска Q-Термов (а не слов, канонических словоформ или корневых морфем) алгорифм SSS легко применим к поиску по текстам на разных языках. Текущая реализация поддерживает 40 языков, а именно, большинство европейских, а также азиатские (японский, китайский, корейский), и ряд других, включая иврит, индонезийский и арабский.

  • Yandex
    Версия поисковой системы stable-9-5

  • Галактика-Zoom
    Галактика-Zoom представляет собой систему обработки больших объемов неструктурированных данных. Система является инструментом для создания хранилища текстовой информации, обладает возможностями полнотекстового поиска и аналитических исследований. При проведении поиска возможно использование контекстного или тематического поиска, поиска с учетом морфологии языка, развитого языка поисковых запросов. Система предоставляет возможность построения информационного образа объекта исследования (Информационного портрета) на основе языковых конструкций - слов и словосочетаний.

  • Поиск@Mail.ru

  • Поиск KM.ru
    Версия поисковой системы mod.2. В основе системы - традиционные алгоритмы и собственные разработки.

  • УИС РОССИЯ

    Университетская информационная система РОССИЯ (УИС РОССИЯ) - проект, нацеленный на интеграцию информационных ресурсов для гуманитарных исследований. Поддерживается Научно-исследовательским вычислительным центром МГУ им.М.В.Ломоносова (НИВЦ МГУ) и АНО Центр информационных исследований (АНО ЦИИ).

    Решения на основе технологий УИС РОССИЯ - тематический анализ текстов, классификация по большим рубрикаторам, интерактивный поиск документов - используются в некоторых органах государственной власти и управления, коммерческих организациях.