Веб коллекция BY.webОписаниеКоллекция построена компанией Яндекс как выборка из страниц домена .by, присутствовавших в индексе поисковой системы Яндекс по состоянию на май 2007 года. Коллекция строилась по следующему принципу: с каждого известного сайта из домена .by брались все страницы на глубину 3 ссылки от стартовой. Статистика по набору данных
Особенности коллекции
Права на использованиеНаходится в открытом доступе. ФорматКоллекция распространяется в виде xml файлов, определенного формата . Список дорожек, в которых использовалась коллекция |