Document URL in System Reports

Классическая задача поиска по запросу (ad-hoc track), поиск по образцу

Document URL in System Reports

Postby SKrylov » Tue Jul 08, 2008 12:46 pm

Добрый день,

Достаточно много документов по ссылкам (URL), указанных в коллекции
BY.WEB, не существует. Например, у документа с docID, равным 2001:
http://www.myfish.by/section/627/312.html
(эта ссылка, и многие другие не работают - нет документа по указанному
адресу) Думаю, что и в KM.RU такие найдутся.

Зачем тогда нужны URL'и в отчётах систем? Ведь документов на Webe - всё
равно уже нет или они могли быть изменены (я не против тегов URL: пусть
их используют системы, которые могут это делать). Но почему нельзя отвечать
просто номерами документов, взятыми из тегов ? Неужели аксессоры
загружают документы в броузер, ориентируясь на найденные системой URL???

Поясните, пожалуйста.
Сергей Крылов
SKrylov
 
Posts: 9
Joined: Tue Jul 08, 2008 8:46 am

Re: [romip] Document URL in System Reports

Postby neigor » Tue Jul 08, 2008 2:58 pm

нет, асессоры конечно видят текст документа, который есть в коллекции.

docURL в ответе это наверное теперь действительно избыточно.
В РОМИП'2007 поиск производился по объединению KM и BY
и там теоретически мог бы быть конфликт id
(к тому же коллекции появились в разное время).

Инструменты для построения пулов могут ожидать наличия docURL,
так что нам будет проще, если ваш прогон будет соответствовать формату.
Если это технически сложно, то мы конечно сможем перекодировать ваш ответ.

-igor


On Tue, 8 Jul 2008, Sergey Krylov wrote:

> Добрый день,
>
> Достаточно много документов по ссылкам (URL), указанных в коллекции
> BY.WEB, не существует. Например, у документа с docID, равным 2001:
> http://www.myfish.by/section/627/312.html
> (эта ссылка, и многие другие не работают - нет документа по указанному
> адресу) Думаю, что и в KM.RU такие найдутся.
>
> Зачем тогда нужны URL'и в отчётах систем? Ведь документов на Webe - всё
> равно уже нет или они могли быть изменены (я не против тегов URL: пусть
> их используют системы, которые могут это делать). Но почему нельзя отвечать
> просто номерами документов, взятыми из тегов ? Неужели аксессоры
> загружают документы в броузер, ориентируясь на найденные системой URL???
>
> Поясните, пожалуйста.
> Сергей Крылов
neigor
Оргкомитет
 
Posts: 331
Joined: Sat Feb 08, 2003 2:06 pm

Re: [romip] Document URL in System Reports

Postby igor_kuralenok » Thu Jul 10, 2008 10:46 am

Прошу прощения, но как тогда быть с href'ами в BY. Основная идея была
в том, что x% этих ссылок (около 10) будут разрешаться внутри
коллекции...

IK
08.07.2008, в 18:58, Igor Nekrestyanov написал(а):

> нет, асессоры конечно видят текст документа, который есть в коллекции.
>
> docURL в ответе это наверное теперь действительно избыточно.
> В РОМИП'2007 поиск производился по объединению KM и BY
> и там теоретически мог бы быть конфликт id
> (к тому же коллекции появились в разное время).
>
> Инструменты для построения пулов могут ожидать наличия docURL,
> так что нам будет проще, если ваш прогон будет соответствовать
> формату.
> Если это технически сложно, то мы конечно сможем перекодировать ваш
> ответ.
>
> -igor
>
>
> On Tue, 8 Jul 2008, Sergey Krylov wrote:
>
>> Добрый день,
>>
>> Достаточно много документов по ссылкам (URL), указанных в коллекции
>> BY.WEB, не существует. Например, у документа с docID, равным 2001:
>> http://www.myfish.by/section/627/312.html
>> (эта ссылка, и многие другие не работают - нет документа по
>> указанному
>> адресу) Думаю, что и в KM.RU такие найдутся.
>>
>> Зачем тогда нужны URL'и в отчётах систем? Ведь документов на Webe -
>> всё
>> равно уже нет или они могли быть изменены (я не против тегов URL:
>> пусть
>> их используют системы, которые могут это делать). Но почему нельзя
>> отвечать
>> просто номерами документов, взятыми из тегов ? Неужели
>> аксессоры
>> загружают документы в броузер, ориентируясь на найденные системой
>> URL???
>>
>> Поясните, пожалуйста.
>> Сергей Крылов
igor_kuralenok
Оргкомитет
 
Posts: 21
Joined: Fri Oct 03, 2003 7:24 am

Re: [romip] Document URL in System Reports

Postby neigor » Thu Jul 10, 2008 6:03 pm

Речь про ОТВЕТ системы, а не про идентификаторы внутри коллекции.
В коллекции у каждого документа есть и id, и url.

Так что с href все должно быть хорошо.

-igor

On Thu, 10 Jul 2008, Игорь Кураленок wrote:

> Прошу прощения, но как тогда быть с href'ами в BY. Основная идея была
> в том, что x% этих ссылок (около 10) будут разрешаться внутри
> коллекции...
>
> IK
> 08.07.2008, в 18:58, Igor Nekrestyanov написал(а):
>
>> нет, асессоры конечно видят текст документа, который есть в коллекции.
>>
>> docURL в ответе это наверное теперь действительно избыточно.
>> В РОМИП'2007 поиск производился по объединению KM и BY
>> и там теоретически мог бы быть конфликт id
>> (к тому же коллекции появились в разное время).
>>
>> Инструменты для построения пулов могут ожидать наличия docURL,
>> так что нам будет проще, если ваш прогон будет соответствовать
>> формату.
>> Если это технически сложно, то мы конечно сможем перекодировать ваш
>> ответ.
>>
>> -igor
>>
>>
>> On Tue, 8 Jul 2008, Sergey Krylov wrote:
>>
>>> Добрый день,
>>>
>>> Достаточно много документов по ссылкам (URL), указанных в коллекции
>>> BY.WEB, не существует. Например, у документа с docID, равным 2001:
>>> http://www.myfish.by/section/627/312.html
>>> (эта ссылка, и многие другие не работают - нет документа по
>>> указанному
>>> адресу) Думаю, что и в KM.RU такие найдутся.
>>>
>>> Зачем тогда нужны URL'и в отчётах систем? Ведь документов на Webe -
>>> всё
>>> равно уже нет или они могли быть изменены (я не против тегов URL:
>>> пусть
>>> их используют системы, которые могут это делать). Но почему нельзя
>>> отвечать
>>> просто номерами документов, взятыми из тегов ? Неужели
>>> аксессоры
>>> загружают документы в броузер, ориентируясь на найденные системой
>>> URL???
>>>
>>> Поясните, пожалуйста.
>>> Сергей Крылов
neigor
Оргкомитет
 
Posts: 331
Joined: Sat Feb 08, 2003 2:06 pm

Re: [romip] Document URL in System Reports

Postby SKrylov » Fri Jul 11, 2008 8:59 am

Так href'ам документов никто не мешает ссылаться друг на друга
прямо внутри коллекции, уважаемый Игорь. Я только говорил о
том, что документов на Вебе уже нет, и что аксессорам нужно бы
просматривать документы не по URL, а по их "слепку", т.е. по
docID (перекодировать URL обратно, и загружать для них файл
из коллекции, что Игорь Н. подтвердил своим ответом ниже).

Для моей системы, которая игнорирует URL, получается просто
лишнее перекодирование: она находит файл с именем DocID, но
вынуждена отвечать с URL, раз формат ответов такой. Затем, для
того, чтобы показать файл аксессору, URL снова перекодируется
в имя файла из коллекции (DocID). В принципе, ничего страшного
нет: небольшая лишняя работа для "железки", и ничего более ... А
с перекрёстными URL внутри коллекции - всё в порядке. Другое
дело, что документы по этим URL с Веба Вы уже можете не скачать.
Но это и не требуется.

С уважением,
Сергей

----- Original Message -----
From: "Игорь Кураленок" ik@...>
To: romip@yahoogroups.com>
Sent: Thursday, July 10, 2008 2:46 PM
Subject: Re: [romip] Document URL in System Reports


Прошу прощения, но как тогда быть с href'ами в BY. Основная идея была
в том, что x% этих ссылок (около 10) будут разрешаться внутри
коллекции...

IK
08.07.2008, в 18:58, Igor Nekrestyanov написал(а):

> нет, асессоры конечно видят текст документа, который есть в коллекции.
>
> docURL в ответе это наверное теперь действительно избыточно.
> В РОМИП'2007 поиск производился по объединению KM и BY
> и там теоретически мог бы быть конфликт id
> (к тому же коллекции появились в разное время).
>
> Инструменты для построения пулов могут ожидать наличия docURL,
> так что нам будет проще, если ваш прогон будет соответствовать
> формату.
> Если это технически сложно, то мы конечно сможем перекодировать ваш
> ответ.
>
> -igor
>
>
> On Tue, 8 Jul 2008, Sergey Krylov wrote:
>
>> Добрый день,
>>
>> Достаточно много документов по ссылкам (URL), указанных в коллекции
>> BY.WEB, не существует. Например, у документа с docID, равным 2001:
>> http://www.myfish.by/section/627/312.html
>> (эта ссылка, и многие другие не работают - нет документа по
>> указанному
>> адресу) Думаю, что и в KM.RU такие найдутся.
>>
>> Зачем тогда нужны URL'и в отчётах систем? Ведь документов на Webe -
>> всё
>> равно уже нет или они могли быть изменены (я не против тегов URL:
>> пусть
>> их используют системы, которые могут это делать). Но почему нельзя
>> отвечать
>> просто номерами документов, взятыми из тегов ? Неужели
>> аксессоры
>> загружают документы в броузер, ориентируясь на найденные системой
>> URL???
>>
>> Поясните, пожалуйста.
>> Сергей Крылов
SKrylov
 
Posts: 9
Joined: Tue Jul 08, 2008 8:46 am


Return to Поисковые дорожки

Who is online

Users browsing this forum: Bing [Bot] and 0 guests

cron