Добрый день,
новая коллекция нормативных документов содержит довольно много
(~42.000) старых редакций других документов.
Можно использовать это, например, для того чтобы оценить решение следующей
задачи - выявить и упорядочить в хронологическом порядке все редакции
каждого из документов.
Наверное методы обнаружения частичных дубликатов обнаружат разные редакции
достаточно эффективно, но возможно упорядочивание редакций сделает задачу
чуть более интересной?
Оценка автоматизируется, так что можно проводить дорожку даже с небольшим
числом участников.
Кому-нибудь интересна такая задача или другая задача использующая
доступность разных редакций?
-igor