Анализ данных МедиаВики

Материал из ИОТ Вики - проекта сетевого социально-педагогического сообщества "СоцОбраз"

Перейти к: навигация, поиск

Например, если мы хотим исследовать динамику развития российских образовательных площадок, основанных на технологии медиавики, то нам предстоит утомительная работа по еженедельному сбору статистических данных с 10 - 15 площадок. С использованием электронных таблиц Google эта работа может быть делегирована электронной таблице. Медиавики отдает в открытый доступ свою статистику. И если мы обратимся к конкретной вики с запросом, то она нам все про себя расскажет.


На следующем рисунке собраны данные по наиболее крупным региональным образовательным МедиаВики. Мы выбрали следующие параметры:

  • Страницы - общее число страниц, которые содержаться в базе данных. Сюда входят страницы участников и их производные, шаблоны
  • Полноценные статьи, в которых есть ссылки на другие статьи
  • Участники
  • Изображения - это все файлы, которые загружены участниками в МедиаВики.

Изображение:Statistic-wiki-13-11-08.png

Что сразу бросается в глаза и может быть использовано в качестве значимых параметров:

  • Количество зарегистрированных участников и количество статей везде достаточно близкие цифры. По ряду серверов участников даже больше. Т.е. есть е участники, которые зарегистрировались и не написали ни одной статьи, кроме страницы Участник:Имя_Участника
  • Количество файлов, которые загружены в базу данных. По большинству образовательных вик количество загруженных файлов превышает число статей. Почему? Во-первых, зарегистрировался участник, добавил к своей страничке графический файл - свою фотографию и дальше все закончилось. Во-вторых, участники загружают не только фотографии, рисунки и схемы, но и другие файлы. Например, в АстроВики участники добавляют проекты Скретч, а в iteach добавляют презентации и документы Word.