Мы вынули всех персон с dilet.narod.ru - всего получилось 4984.
Для каждой персоны мы планируем включить в задание ФИО +
кусочек описания до первой точки/запятой/скобки, что на самом деле
описывает область деятельности. Цель - уточнение какого Иванова
мы тут имеем ввиду.
Ассессоры получат полный вариант описания (он сам по себе часто содержит
факты - годы жизни и игогда другие ключевые события, что может помочь
соориентироваться при проведении оценки).
Примеры:
Шандор Петёфи, венгерский поэт
Фридрих Вильгельм Канарис, немецкий адмирал
Эти эвристики не идеально сохраняют всю доступную информацию (так, например,
про Канариса еще написано, что он руководитель Абвера, но мы это потеряем
в заданиях для систем), но хочется избежать случаев вида
"Рихард Зигмонди
австрийский химик, лауреат Нобелевской премии 1925 года."
Не совсем понятно, что делать со случаями когда у человека есть
несколько имен/псевдонимов. Например:
Лоренцо де Медичи (Великолепный)
Фёдор Сологуб (Фёдор Кузьмич Тетерников)
Мэрилин Монро (Норма Бейкер)
Игорь (Гарик) Иванович Сукачёв
Владимир Ильич Ленин (Ульянов)
Л. Пантелеев (Алексей Иванович Еремеев)
Пока мы склоняемся к мысли оставить их в таком виде
(всего таких случаев 345), слегка подчистив случае вида:
Пол Крестон (настоящие имя и фамилия Джозеф Гуттаведжо)
Николай Николаевич Ерёменко (младший)
(убрав все не относящиеся к имени)
Непонятно, как правда вычистить это:
Джон Форд (Шон Алоизиус О'Фирна или О'Фини)
В конце-концов таких случаев немного и даже без них у нас будет порядка 4500
заданий, что вполне прилично. Или мы всегда можем принять волевое
решение не включать эти варианты в кандидаты на оценку
(хотя возможно такие персоны будут чаще упоминаться в нашем наборе данных
и поэтому на них интересно оценивать)
Какие есть предложения?
-igor