Page 1 of 1

Document URL in System Reports

PostPosted: Tue Jul 08, 2008 12:46 pm
by SKrylov
Добрый день,

Достаточно много документов по ссылкам (URL), указанных в коллекции
BY.WEB, не существует. Например, у документа с docID, равным 2001:
http://www.myfish.by/section/627/312.html
(эта ссылка, и многие другие не работают - нет документа по указанному
адресу) Думаю, что и в KM.RU такие найдутся.

Зачем тогда нужны URL'и в отчётах систем? Ведь документов на Webe - всё
равно уже нет или они могли быть изменены (я не против тегов URL: пусть
их используют системы, которые могут это делать). Но почему нельзя отвечать
просто номерами документов, взятыми из тегов ? Неужели аксессоры
загружают документы в броузер, ориентируясь на найденные системой URL???

Поясните, пожалуйста.
Сергей Крылов

Re: [romip] Document URL in System Reports

PostPosted: Tue Jul 08, 2008 2:58 pm
by neigor
нет, асессоры конечно видят текст документа, который есть в коллекции.

docURL в ответе это наверное теперь действительно избыточно.
В РОМИП'2007 поиск производился по объединению KM и BY
и там теоретически мог бы быть конфликт id
(к тому же коллекции появились в разное время).

Инструменты для построения пулов могут ожидать наличия docURL,
так что нам будет проще, если ваш прогон будет соответствовать формату.
Если это технически сложно, то мы конечно сможем перекодировать ваш ответ.

-igor


On Tue, 8 Jul 2008, Sergey Krylov wrote:

> Добрый день,
>
> Достаточно много документов по ссылкам (URL), указанных в коллекции
> BY.WEB, не существует. Например, у документа с docID, равным 2001:
> http://www.myfish.by/section/627/312.html
> (эта ссылка, и многие другие не работают - нет документа по указанному
> адресу) Думаю, что и в KM.RU такие найдутся.
>
> Зачем тогда нужны URL'и в отчётах систем? Ведь документов на Webe - всё
> равно уже нет или они могли быть изменены (я не против тегов URL: пусть
> их используют системы, которые могут это делать). Но почему нельзя отвечать
> просто номерами документов, взятыми из тегов ? Неужели аксессоры
> загружают документы в броузер, ориентируясь на найденные системой URL???
>
> Поясните, пожалуйста.
> Сергей Крылов

Re: [romip] Document URL in System Reports

PostPosted: Thu Jul 10, 2008 10:46 am
by igor_kuralenok
Прошу прощения, но как тогда быть с href'ами в BY. Основная идея была
в том, что x% этих ссылок (около 10) будут разрешаться внутри
коллекции...

IK
08.07.2008, в 18:58, Igor Nekrestyanov написал(а):

> нет, асессоры конечно видят текст документа, который есть в коллекции.
>
> docURL в ответе это наверное теперь действительно избыточно.
> В РОМИП'2007 поиск производился по объединению KM и BY
> и там теоретически мог бы быть конфликт id
> (к тому же коллекции появились в разное время).
>
> Инструменты для построения пулов могут ожидать наличия docURL,
> так что нам будет проще, если ваш прогон будет соответствовать
> формату.
> Если это технически сложно, то мы конечно сможем перекодировать ваш
> ответ.
>
> -igor
>
>
> On Tue, 8 Jul 2008, Sergey Krylov wrote:
>
>> Добрый день,
>>
>> Достаточно много документов по ссылкам (URL), указанных в коллекции
>> BY.WEB, не существует. Например, у документа с docID, равным 2001:
>> http://www.myfish.by/section/627/312.html
>> (эта ссылка, и многие другие не работают - нет документа по
>> указанному
>> адресу) Думаю, что и в KM.RU такие найдутся.
>>
>> Зачем тогда нужны URL'и в отчётах систем? Ведь документов на Webe -
>> всё
>> равно уже нет или они могли быть изменены (я не против тегов URL:
>> пусть
>> их используют системы, которые могут это делать). Но почему нельзя
>> отвечать
>> просто номерами документов, взятыми из тегов ? Неужели
>> аксессоры
>> загружают документы в броузер, ориентируясь на найденные системой
>> URL???
>>
>> Поясните, пожалуйста.
>> Сергей Крылов

Re: [romip] Document URL in System Reports

PostPosted: Thu Jul 10, 2008 6:03 pm
by neigor
Речь про ОТВЕТ системы, а не про идентификаторы внутри коллекции.
В коллекции у каждого документа есть и id, и url.

Так что с href все должно быть хорошо.

-igor

On Thu, 10 Jul 2008, Игорь Кураленок wrote:

> Прошу прощения, но как тогда быть с href'ами в BY. Основная идея была
> в том, что x% этих ссылок (около 10) будут разрешаться внутри
> коллекции...
>
> IK
> 08.07.2008, в 18:58, Igor Nekrestyanov написал(а):
>
>> нет, асессоры конечно видят текст документа, который есть в коллекции.
>>
>> docURL в ответе это наверное теперь действительно избыточно.
>> В РОМИП'2007 поиск производился по объединению KM и BY
>> и там теоретически мог бы быть конфликт id
>> (к тому же коллекции появились в разное время).
>>
>> Инструменты для построения пулов могут ожидать наличия docURL,
>> так что нам будет проще, если ваш прогон будет соответствовать
>> формату.
>> Если это технически сложно, то мы конечно сможем перекодировать ваш
>> ответ.
>>
>> -igor
>>
>>
>> On Tue, 8 Jul 2008, Sergey Krylov wrote:
>>
>>> Добрый день,
>>>
>>> Достаточно много документов по ссылкам (URL), указанных в коллекции
>>> BY.WEB, не существует. Например, у документа с docID, равным 2001:
>>> http://www.myfish.by/section/627/312.html
>>> (эта ссылка, и многие другие не работают - нет документа по
>>> указанному
>>> адресу) Думаю, что и в KM.RU такие найдутся.
>>>
>>> Зачем тогда нужны URL'и в отчётах систем? Ведь документов на Webe -
>>> всё
>>> равно уже нет или они могли быть изменены (я не против тегов URL:
>>> пусть
>>> их используют системы, которые могут это делать). Но почему нельзя
>>> отвечать
>>> просто номерами документов, взятыми из тегов ? Неужели
>>> аксессоры
>>> загружают документы в броузер, ориентируясь на найденные системой
>>> URL???
>>>
>>> Поясните, пожалуйста.
>>> Сергей Крылов

Re: [romip] Document URL in System Reports

PostPosted: Fri Jul 11, 2008 8:59 am
by SKrylov
Так href'ам документов никто не мешает ссылаться друг на друга
прямо внутри коллекции, уважаемый Игорь. Я только говорил о
том, что документов на Вебе уже нет, и что аксессорам нужно бы
просматривать документы не по URL, а по их "слепку", т.е. по
docID (перекодировать URL обратно, и загружать для них файл
из коллекции, что Игорь Н. подтвердил своим ответом ниже).

Для моей системы, которая игнорирует URL, получается просто
лишнее перекодирование: она находит файл с именем DocID, но
вынуждена отвечать с URL, раз формат ответов такой. Затем, для
того, чтобы показать файл аксессору, URL снова перекодируется
в имя файла из коллекции (DocID). В принципе, ничего страшного
нет: небольшая лишняя работа для "железки", и ничего более ... А
с перекрёстными URL внутри коллекции - всё в порядке. Другое
дело, что документы по этим URL с Веба Вы уже можете не скачать.
Но это и не требуется.

С уважением,
Сергей

----- Original Message -----
From: "Игорь Кураленок" ik@...>
To: romip@yahoogroups.com>
Sent: Thursday, July 10, 2008 2:46 PM
Subject: Re: [romip] Document URL in System Reports


Прошу прощения, но как тогда быть с href'ами в BY. Основная идея была
в том, что x% этих ссылок (около 10) будут разрешаться внутри
коллекции...

IK
08.07.2008, в 18:58, Igor Nekrestyanov написал(а):

> нет, асессоры конечно видят текст документа, который есть в коллекции.
>
> docURL в ответе это наверное теперь действительно избыточно.
> В РОМИП'2007 поиск производился по объединению KM и BY
> и там теоретически мог бы быть конфликт id
> (к тому же коллекции появились в разное время).
>
> Инструменты для построения пулов могут ожидать наличия docURL,
> так что нам будет проще, если ваш прогон будет соответствовать
> формату.
> Если это технически сложно, то мы конечно сможем перекодировать ваш
> ответ.
>
> -igor
>
>
> On Tue, 8 Jul 2008, Sergey Krylov wrote:
>
>> Добрый день,
>>
>> Достаточно много документов по ссылкам (URL), указанных в коллекции
>> BY.WEB, не существует. Например, у документа с docID, равным 2001:
>> http://www.myfish.by/section/627/312.html
>> (эта ссылка, и многие другие не работают - нет документа по
>> указанному
>> адресу) Думаю, что и в KM.RU такие найдутся.
>>
>> Зачем тогда нужны URL'и в отчётах систем? Ведь документов на Webe -
>> всё
>> равно уже нет или они могли быть изменены (я не против тегов URL:
>> пусть
>> их используют системы, которые могут это делать). Но почему нельзя
>> отвечать
>> просто номерами документов, взятыми из тегов ? Неужели
>> аксессоры
>> загружают документы в броузер, ориентируясь на найденные системой
>> URL???
>>
>> Поясните, пожалуйста.
>> Сергей Крылов