+2.35
Рейтинг
2.03
Сила

Малик

Немного статистики по объёму базы данных форума Дизель

Меня часто спрашивают о размере базы данных форума Дизель, я отвечаю что-нибудь типа «база занимает примерно 35 ГБ на жёстком диске». Тут как раз кое-что проверял и заодно решил разместить и сюда.

Общее число строк всех таблиц — 49,4 млн.
Общий объём данных всех таблиц (без индексов) — 22,2 GB.

Самые большие таблицы:
1. таблица постов — 17,9 млн. строк, 9,7 GB
2. таблица тем — 13,9 млн. строк, 2,6 GB
3. таблица личных сообщений — 5,5 млн. строк, 3,2 GB

Интересная статистика по Дизелю (количество тем и сообщений)

Занимаюсь разбором полётов по переводу на новую версию движка форума Дизель, задался вопросом о том, сколько новых тем и сообщений размещается в сутки. Интересные цифры получаются.

Новые темы за сутки:
Май 27 — 54843
Май 28 — 56124
Май 29 — 55277
Май 30 — 50475
Май 31 — 50017
Июнь 1 — 36763 (суббота)
Июнь 2 — 37284 (воскресенье)

Сообщения за сутки:
Май 27 — 64847
Май 28 — 65778
Май 29 — 65309
Май 30 — 60324
Май 31 — 61061
Июнь 1 — 43556 (суббота)
Июнь 2 — 44905 (воскресенье)

Т.е. в будний день на форуме создаётся не менее 50 тысяч новых тем и 60 тысяч новых сообщений, это в среднем 34 темы (50000/24/60) и 41 сообщение (60000/24/60) в минуту.
Лично меня эти цифры впечатлили, я ожидал намного меньших значений. Жуть… )

Пробуем перейти на новую версию движка

Сегодня, в пятницу 24 мая, в 19:00, форум Дизель остановлен на техобслуживание. Буду пытаться обновить версию движка на актуальную.
Переход не будет безболезненным, но деваться некуда, надо развиваться, двигаться вперёд, а без обновления движка это практически невозможно.
К сожалению, объёмы форума не позволяют сделать это быстро, только конвертирование базы данных занимает больше суток.
Кроме того, не факт, что всё пройдёт нормально и результат будет приемлимым. Не исключаю вариант, что переход будет неудачным и по окончании работ мне придётся опять запустить старую версию.

Предупреждение о работах было вывешено ещё в понедельник.
Прошу прощения за неудобства.

Счётчик хитов по провайдерам Кыргызстана

Добавил счётчик хитов по провайдерам Кыргызстана. Чтобы увидеть её нужно выбрать пункт «КГ-хиты» в статистике нужного сайта.
Как и ожидалось большая часть хитов приходит из сетей Мегалайна и КТ. Например, для форума Дизель, на данный момент это 33% из Мегалайна и 21% из КТ. На третьем месте ЭлКат с 12% всех хитов по Кыргызстану.

Добавлен счётчик хитов по КГ

Добавил счётчик хитов по КГ. Пока для сведения, а когда убедимся, что всё нормально, думаю переключить построение рейтинга именно по этому показателю.
База IP-адресов взята с сайта компании ЭлКат: www.elcat.kg/ip/kg-nets-isp.txt

Включил комментарии

Дистрибутивом рейтинговой системы предусмотрена возможность оставлять комментарии для сайтов — участников системы. Когда запускал рейтинг решил, что комменты не нужны — пользы мало, а только лишняя возможность для спамеров и критиканов. Так что комменты были отключены.
Однако теперь я решил попробовать. Включил комменты, добавил иконку карандашика со ссылкой на них.
Посмотрим, что будет.

А правильно ли строить рейтинг по количеству посетителей?

Движок рейтинговой системы по-умолчанию строит рейтинг по количеству хитов, т.е. общему количеству открытий страниц сайта.
Я не так давно внёс исправления в движок, так чтобы он при построении рейтинга ориентировался на количество посетителей. Для Кирнета мне показалось это более логичным — всё-таки важнее сколько уникальных посетителей заходит на сайт, а не сколько раз они его открывали и обновляли.
Однако, после появления в рейтинге нескольких казахстанских ресурсов у меня возникли сомнения. Ясное дело, что в Казахстане количество пользователей намного больше, чем в Кыргызстане и получается несправедливо по отношению к нашим сайтам. Например, тысяча посетителей для Кирнета — это много, а тысяча посетителей для Казнета — это мизер, таким образом местный сайт с тысячей посетителей должен быть выше в рейтинге, чем казахстанский сайт с таким же количеством посетителей.
Если взять в качестве примера обе Намбы (КЗ и КГ), то получается, что по количеству посетителей наша Намба проигрывает казахстанской раза в 3, но при этом по количеству хитов проигрывает совсем немного, процентов на 20. Хм, не очень показательный пример, давайте лучше посмотрим на Намба.КЗ и (кто бы знал) форум Дизель. В этом случае получается, что примерно в 3 раза меньшее количество посетителей Дизеля заходят на него раза в 2 чаще. Брр… что-то я запутался в попытках пояснить свою мысль… )
Так вот, теперь мне кажется, что автор движка наверное был прав в том, что решил строить рейтинг по количеству хитов, т.е. посещений сайта, а не по количеству посетителей.
О, может так будет понятнее — посетители считаются даже если они зашли один раз на первую страницу сайта и сразу же ушли с сайта, а вот хиты считаются каждый раз когда открывается сайт. Т.е. всё-таки показатель популярности сайта не количество человек, зашедших на сайт, а количество посещений сайта. Утрированный пример для наглядности — на сайт «А» зашёл 1 человек 100 раз, а на сайт «Б» зашли 100 человек по одному разу, какой сайт популярнее? Мне кажется, что сайт «А», т.к. хоть и один пользователь, но ему сайт был явно интересен, а во втором случае 100 человек зашли один раз, но, очевидно, их ничего там не задержало.

Короче говоря, думаю, что пока я ничего менять не буду, а вот когда выйдет новая версия движка — оставлю метод постройки рейтинга как есть, т.е. по количеству хитов (посещений).

Интересная статистика после подключения к рейтингу сайта Намба.КЗ

Интересная статистика после подключения в рейтинг сайта Намба.КЗ. Неудивительно, что Намба.КЗ опережает форум Дизель по количеству посетителей примерно в два раза, но по количеству хитов, т.е. количеству заходов на сайт, Дизель существенно, примерно в полтора раза, опережает Намбу.КЗ. Например, за вчерашние полные сутки, 9 августа, получилось:
— у Намба.КЗ 89111 посетителей, 824330 хитов и 78840 хостов;
— а у Дизеля 37418 посетителей, 1236960 хитов и 20698 хостов;
Получается, что пользователей Дизеля меньше в два раза, но заходят они в полтора раза чаще, причём с хостов в 4 раза меньшем количестве )

На третьем месте в рейтинге Намба.КГ — 31758 пользователей, 711978 хитов и 19827 хостов за 9 августа. Показатели близки к показателям Дизеля, более того, в нерабочее время Намба.КГ зачастую опережает Дизель в рейтинге, который, напомню, строится по количеству посетителей.

Общее же количество хитов, которые попадают в статистику рейтинговой системы WWW.NET.KG за сутки уже приближается к 4-м миллионам. А зарегистрированных ресурсов на данный момент — 381.

Теперь рейтинг ведётся по количеству посетителей

В оригинале скрипт рейтинговой системы WWW.NET.KG рассчитывал рейтинг сайтов по количеству хостов. Мне всегда это казалось странным, ведь есть более показательный параметр — количество посетителей. А количество хостов, как раз-таки, наименее интересная цифра, на мой взгляд. Ну какая, спрашивается, разница со скольки IP-адресов обращались на тот или иной сайт, ведь неизвестно сколько людей сидит за каждым IP-адресом — может один-два (если это чей-то домашний компьютер), а может несколько сотен или даже тысяч (если это прокси-сервер большой организации или мобильного оператора).
Количество посетителей, конечно же, тоже условная цифра, но всё же более интересная. На основе нескольких параметров — IP-адрес клиента и прокси-сервера, идентификатора браузера и языку — вычисляется идентификатор клиента. Количество уникальных идентификаторов клиента и принимается за количество посетителей. Таким образом, этот показатель учитывает браузеры, а не людей (что неудивительно). Так что вполне может быть, что за одним браузером работает несколько человек и они учтутся как один или что в корпоративной сети у всех стоят одинаковые операционки и браузеры, при этом прокси-сервер не передаёт IP-адрес клиентов и все они посчитаются как один посетитель )