обучающее множество DMOZ

Общие обсуждения - потенциальные будущие дорожки, использование материалов РОМИП вне семинара, очные встречи и прочие вопросы для которых нет отдельной подтемы

обучающее множество DMOZ

Postby neigor » Thu Jun 10, 2010 6:51 am

On 6/9/10 11:37 PM, Александр Салтыков wrote:
> Спасибо. Есть еще вопрос по поводу
классификации веб-страниц.
> В обучающей выборке были указаны тематики
для 38 доменов из коллекции DMOZ, которых не
удалось найти в коллекции. Вопрос: это
ошибка на нашей стороне (возможно скачали
не все файлы и т.п.), т.е. ситуация невозможна
в принципе, или такое возможно и доменов нет
вообще?
>
в принципе такое возможно и в наборе данных,
так как они строились не
полностью синхронно.
Хотя конечно подозрительно, ранее вроде на
это не жаловались.

У меня нет готового ответа, но может кто-то
из участников работающих с
DMOZ может подвердить или опровергнуть?

-igor
neigor
Оргкомитет
 
Posts: 331
Joined: Sat Feb 08, 2003 2:06 pm

Re: обучающее множество DMOZ

Postby ageev2003 » Thu Jun 10, 2010 9:29 am

Добрый день!

Thursday, June 10, 2010, 10:51:07 AM, you wrote:
IN> On 6/9/10 11:37 PM, Александр Салтыков wrote:
>> Спасибо. Есть еще вопрос по поводу классификации веб-страниц.
>> В обучающей выборке были указаны тематики для 38 доменов из коллекции DMOZ,
которых не удалось найти в коллекции. Вопрос: это ошибка на нашей стороне
(возможно скачали не все файлы и т.п.), т.е.
>> ситуация невозможна в принципе, или такое возможно и доменов нет вообще?

В файле content-rus.rdf действительно есть пустые категории, например:

<Topic r:id="Top/World/Russian/Компьютеры">
<catid>32813</catid>
</Topic>

Так что, это не ошибка.

С уважением,
Михаил Агеев.
ageev2003
Оргкомитет
 
Posts: 28
Joined: Wed Apr 07, 2004 6:58 am


Return to Общие вопросы

Who is online

Users browsing this forum: No registered users and 0 guests

cron