Статистика по шаблонным страницам

Классификация нормативно-правовых документов, веб-сайтов и веб-страниц

Postby segalovich » Thu Feb 13, 2003 8:24 pm

Мне кажется, что имеет смысл отсекать
только "целиком шаблонные страницы",
да и то не все, а скажем только те,
что имеет посещаемость ниде пороговой

Илья

-------- Original Message --------
Subject: RE: ВОПРОСЫ И ОТВЕТЫ ПО НАРОДНЫМ САЙТАМ
Date: Thu, 13 Feb 2003 20:44:11 +0300
From: Alexander Dilevsky dil@...>
To: Ilya Segalovich iseg@...>

Если я написал правильный скрипт, то вот процентное содержание шаблонных
страниц по отношению к общему числу html-страниц на сайте.
То есть, около половины пользователей шаблонами не пользуется вообще
(have no templates), полностью шаблонных сайтов - 30-40%.

w7:

Total sites on disk: 52112
0-5% templates - 1129 sites (2.17%)
5-10% templates - 719 sites (1.38%)
10-15% templates - 607 sites (1.16%)
15-20% templates - 315 sites (0.60%)
20-25% templates - 335 sites (0.64%)
25-30% templates - 379 sites (0.73%)
30-35% templates - 518 sites (0.99%)
35-40% templates - 90 sites (0.17%)
40-45% templates - 178 sites (0.34%)
45-50% templates - 48 sites (0.09%)
50-55% templates - 1117 sites (2.14%)
55-60% templates - 83 sites (0.16%)
60-65% templates - 176 sites (0.34%)
65-70% templates - 496 sites (0.95%)
70-75% templates - 93 sites (0.18%)
75-80% templates - 381 sites (0.73%)
80-85% templates - 395 sites (0.76%)
85-90% templates - 273 sites (0.52%)
90-95% templates - 189 sites (0.36%)
95-100% templates - 57 sites (0.11%)
100% templates - 17519 sites (33.62%)
Erroneous data (some template pages removed from disk) - 320 sites (0.61%)
26695 sites (51.23%) have no templates
Not found on disk: 2

w3:

Total sites on disk: 43229
0-5% templates - 896 sites (2.07%)
5-10% templates - 557 sites (1.29%)
10-15% templates - 503 sites (1.16%)
15-20% templates - 224 sites (0.52%)
20-25% templates - 271 sites (0.63%)
25-30% templates - 337 sites (0.78%)
30-35% templates - 463 sites (1.07%)
35-40% templates - 54 sites (0.12%)
40-45% templates - 150 sites (0.35%)
45-50% templates - 33 sites (0.08%)
50-55% templates - 1091 sites (2.52%)
55-60% templates - 50 sites (0.12%)
60-65% templates - 134 sites (0.31%)
65-70% templates - 420 sites (0.97%)
70-75% templates - 66 sites (0.15%)
75-80% templates - 288 sites (0.67%)
80-85% templates - 287 sites (0.66%)
85-90% templates - 162 sites (0.37%)
90-95% templates - 125 sites (0.29%)
95-100% templates - 46 sites (0.11%)
100% templates - 18632 sites (43.10%)
Erroneous data (some template pages removed from disk) - 226 sites (0.52%)
18214 sites (42.13%) have no templates
Not found on disk: 3
segalovich
Оргкомитет
 
Posts: 46
Joined: Fri Jan 31, 2003 1:21 pm

Re: Статистика по шаблонным страницам

Postby neigor » Thu Feb 13, 2003 9:48 pm

А почему нам важна посещаемость?

Может быть выкинуть все "целиком шаблонные сайты" (а не
"целиком шаблонные страницы"), но вязть данные с обоих серверов?

а сколько мы при этом потеряем сайтов из каталога?
(если там шаблонные сайты доминируют, то для классификатора это
наверное будет существенной помехой ...)

-igor
neigor
Оргкомитет
 
Posts: 331
Joined: Sat Feb 08, 2003 2:06 pm


Return to Тематическая классификация

Who is online

Users browsing this forum: No registered users and 12 guests

cron