-
ATSearch-2010
ATSearch-2010 система информационного поиска, основанная на решениях
полученных в рамках проекта АТ.Поиск.
-
Dislexer
Экспериментальная система поиска, использующая алгоритмы синтаксического
анализа для снятия омонимии в запросах и коллекции документов.
-
Exactus
Exactus - система семантического поиска и анализа текстовой информации.
Exactus - это научно-исследовательский проект, который
развивается в Институте системного анализа РАН в течении последних 5 лет
командой опытных лингвистов, программистов, математиков и
психологов. Основной целью участия в Ромип является независимая
экспериментальная проверка разработанных методов и моделей на
больших объемах данных.
-
Extractor
Экспериментальная система извлечения фактов.
-
IFM3
Система поиска изображений по содержанию IFM3 основана на текстовом подходе
к задачам анализа изображений. На основе словаря признаков
изображения характеризуются в терминах векторной модели типа tf/idf. Для
построения словаря используется кластеризация дескрипторов типа
SURF, вычисленных в точках интереса на основе обучения метрики в
пространстве хеш-дескрипторов.
-
MPP
Система кластеризации, использующая для построения метрик хорошо изученные
задачи машинного обучения.
-
PhotoFinder
Исследовательский проект в области поиска изображений по содержанию. В
рамках проекта реализованы методы поиска, основанные на
различных цветовых и текстурных признаках изображения. Особое внимание
уделяется вопросу синтеза различных методов поиска при
формировании общего результата.
В рамках РОМИП 2010 мы хотим протестировать адаптивный метод синтеза двух
цветовых признаков (цветовые гистограммы и цветовые моменты).
-
PIRS
PIRS - учебная система, разрабатывающаяся в рамках исследовательской работы.
Методы поиска изображений по содержанию основаны на выявлении и
комбинировании особенностей изображений разных уровней. При разработке
методов поиска предпочтение отдавалось точности/полноте, нежели
вычислительной эффективности.
-
PTCS
Система параллельной тематической текстовой классификации, работающая на
многопроцессорных/многопроцессорных компьютерах или на
вычислительном кластере. Система разработана в Вятском государственном
гуманитарном университете (г. Киров) и основана на методе
опорных векторов. Особенностью системы является использование параллельных
вычислений на всех этапах работы, что позволяет в процессе
обучения и дообучения проводить максимально подробную оценку эффективности и
точную настройку параметров.
-
RCO
Компания RCO специализируется на исследованиях в области компьютерной
лингвистики и создании компонентов интеллектуального анализа
текста для информационно-поисковых и информационно-аналитических систем. На
семинаре планируется провести апробацию ряда алгоритмов
кластеризации новостного потока.
-
ROOKEE
Исследовательский проект, в рамках которого изучаются несколько задач
информационного поиска:
- разработка и оценка методологий контекстно-зависимого аннотирования
- разработка и оценка алгоритмов тематической классификации веб сайтов и веб
страниц.
-
Sophia
Система поиска, основанная на предварительной кластеризации коллекции.
Алгоритм кластеризации собственный. Ранее система тестировалась
на больших англоязычных коллекциях (газетные публикации, рефераты патентов,
рефераты статей по медицинской тематике -- medline). Целью
участия в РОМИП является тестирование системы на русскоязычной коллекции.
-
SSS
-
Yandex.Server
-
Галактика-Zoom
Галактика-Zoom - это система обработки больших объемов неструктурированных
данных, инструмент для создания хранилища текстовой информации с
возможностями полнотекстового поиска и аналитических исследований. В системе
реализованы различные режимы поиска: контекстный, тематический,
с учетом морфологии языка, с использованием языка запросов. Система
предоставляет возможность построения информационного образа
результатов поиска (информационного портрета) на основе языковых конструкций
- слов и словосочетаний.
-
КС классификатор
Классификатор классификацирует документы по ключевым словам.
Был представлен на конференции RCDL (статья). Используется для классификации хостов в поисковой системе Яндекс.
-
Поиск KM.ru
Поисковая система KM.RU - это традиционные поисковые алгоритмы и собственные
разработки.
-
СКАТ
СКАТ Система классификации и анализа тектов. Предназначена для выполнения
вытоматической классификации текстов как путем обучения на
примерах, так и путем задания правил классификации на специальном языке.
Целью участия в РОМИП является оценка новых подходов и методов к
классификации текстовых данных.
-
УИС РОССИЯ
Университетская информационная система РОССИЯ (УИС РОССИЯ) - проект,
нацеленный на интеграцию информационных ресурсов для
гуманитарных исследований. Поддерживается Научно-исследовательским
вычислительным центром МГУ имени М.В.Ломоносова (НИВЦ МГУ имени
М.В.Ломоносова) и АНО Центр информационных исследований (АНО ЦИИ).
Решения на основе технологий УИС РОССИЯ - тематический анализ текстов,
классификация по большим рубрикаторам, интерактивный поиск документов,
агрегирование новостного потока - используются в некоторых органах
государственной власти и управления, коммерческих организациях.
-
Умба
Вопросно-ответная система Умба - метапоисковая система общего назначения,
извлекающая из коллекции документов точные фактографические
ответы на вопросы, сформулированные на русском языке.
Система следует типовой архитектуре QA систем, участвующих в TREC и CLEF.
Задача разделена на подзадачи, каждая из которых решена неким наивным
способом.
Одна из подзадач - проверка соответствия ответа вопросу - решена ещё и
авторским методом с использованием выделения семантических связей между
словами.
Сейчас система отвечает на вопросы "кто" (о персонах) и "где" (о топонимах).
Цель участия в семинаре - оценить улучшение в общей выдаче системы за счёт
предложенной авторской реализации модуля по сравнению с исходной наивной
реализацией. Планируется сделать несколько прогонов метода с разными
параметрами.
Результаты автор планирует использовать в экспериментальной части
кандидатской диссертации.
-
Яндекс.Картинки
Алгоритмы, используемые в поиске изображений.