Re: заметки с круглого стола в Петрозаводске
Posted: Thu Oct 01, 2009 12:24 pm
--- In romip@yahoogroups.com, "Tatevosyan Sergey"
> > для оценки формальной релевантности по коллекции Legal (интересные
> > документы) можно ее включить в web-коллекцию - обернуть только для
> > приличия, например, в домен типа kodex.by :) - там же никто не
> > оценивает правда на странице или нет
>
> >Я бы, пожалуй, не стал в такой дорожке участвовать. Но если кто-то захочет
> - почему бы и нет.
> А вот мы как раз рассматриваем legal именно как еще одну дорожку веб :))
Допустим, мы действительно сделаем 2 дорожки.
Мне тут пришло в голову, что создание двух дорожек из одной коллекции содержит в
себе некую гипотетическую уязвимость.
Допустим, мы добавим в правовую дорожку информацию о версиях документа, как
предлагал Максим Губин. Теоретически, в эту коллекцию можно добавить и другие
поля, которые характерны для реальных правовых коллекций (например, поле для
хранения рубрики документа). Будем называть дорожку поиска по этой коллекции
дорожкой "legal".
Дорожку, в которой поиск будет производиться, исходя из принципов веб-поиска,
назовем "kodex.ru". В коллекции для этой дорожки информации об версионности и
т.п. не будет, поскольку все документы в ней считаются обычными веб-страницами.
За исключением дополнительных полей, коллекции для дорожек legal и kodex.ru
будут совпадают.
Можно предположить, что поисковая система, учитывающая дополнительные данные
правовой коллекции, в дорожке "legal" получит некоторое преимущество перед
системой, не принимающей это во внимание.
В этом случае появляется гипотетическая угроза, что участник дорожки "kodex.ru"
схитрит. Выполняя задания этой дорожки, он будет использовать вместо коллекции
kodex.ru коллекцию legal с дополнительными полями. Таким образом, его система
получит фору перед другими участниками дорожки.
Разумеется, я не верю, что кто-то из участников воспользуется этой уязвимостью.
Но все же лучше изначально спроектировать условия дорожек так, чтобы не
существовало даже теоретической возможности схитрить.
Сафронов.
> > для оценки формальной релевантности по коллекции Legal (интересные
> > документы) можно ее включить в web-коллекцию - обернуть только для
> > приличия, например, в домен типа kodex.by :) - там же никто не
> > оценивает правда на странице или нет
>
> >Я бы, пожалуй, не стал в такой дорожке участвовать. Но если кто-то захочет
> - почему бы и нет.
> А вот мы как раз рассматриваем legal именно как еще одну дорожку веб :))
Допустим, мы действительно сделаем 2 дорожки.
Мне тут пришло в голову, что создание двух дорожек из одной коллекции содержит в
себе некую гипотетическую уязвимость.
Допустим, мы добавим в правовую дорожку информацию о версиях документа, как
предлагал Максим Губин. Теоретически, в эту коллекцию можно добавить и другие
поля, которые характерны для реальных правовых коллекций (например, поле для
хранения рубрики документа). Будем называть дорожку поиска по этой коллекции
дорожкой "legal".
Дорожку, в которой поиск будет производиться, исходя из принципов веб-поиска,
назовем "kodex.ru". В коллекции для этой дорожки информации об версионности и
т.п. не будет, поскольку все документы в ней считаются обычными веб-страницами.
За исключением дополнительных полей, коллекции для дорожек legal и kodex.ru
будут совпадают.
Можно предположить, что поисковая система, учитывающая дополнительные данные
правовой коллекции, в дорожке "legal" получит некоторое преимущество перед
системой, не принимающей это во внимание.
В этом случае появляется гипотетическая угроза, что участник дорожки "kodex.ru"
схитрит. Выполняя задания этой дорожки, он будет использовать вместо коллекции
kodex.ru коллекцию legal с дополнительными полями. Таким образом, его система
получит фору перед другими участниками дорожки.
Разумеется, я не верю, что кто-то из участников воспользуется этой уязвимостью.
Но все же лучше изначально спроектировать условия дорожек так, чтобы не
существовало даже теоретической возможности схитрить.
Сафронов.