Вид публикации: Статья
Год: 2013
Издательство: СБОРНИК ТРУДОВ НИКОНОВСКИХ ЧТЕНИЙ. М. 2013 Г.
Целевое назначение: Научное
Автор(ы): САЛЬНИКОВ С.Г.
Статус: завершенный
Наименование: РЕЙТИНГИ САЙТОВ ОРГАНИЗАЦИЙ РОССЕЛЬХОЗАКАДЕМИИ: ГОД СПУСТЯ
ГРНТИ: 68.85
Ключевые слова: Рейтинг, сайт, РАСХН
Объем (п.л.): 8
Формат: обычная
PDF-файл: http://www.viapi.ru/download/2013/126947.pdf


РЕЙТИНГИ САЙТОВ ОРГАНИЗАЦИЙ РОССЕЛЬХОЗАКАДЕМИИ: ГОД СПУСТЯ

 

С.Г. Сальников, к.ф.-м.н., ведущий науч. сотр.

Всероссийского института аграрных проблем и информатики им. А.А. Никонова

 

Введение. К предыдущим Никоновским чтениям автором был предложен рейтинг сайтов научных организаций Россельхозакадемии [1].  В настоящей статьей приводится новый рейтинг таких сайтов (по состоянию на 1 июня 2013 года).

В качестве основы для расчётов рейтингов (как и в работе [1]) была взята методика из статьи [2], которая была определённым образом модифицирована автором (подробнее об этом сказано ниже в соответствующем разделе).

Новый рейтинг (как и рейтинг из работы [1]) продолжает серию работ [2-5], в которых приводятся расчёты для аналогичных локальных (страновых, отраслевых и т.п.) рейтингов. Эти работы, напомним, были стимулированы в свою очередь успехом рейтинга сайтов научных организаций «Ranking Web of World Research Center» [6]. Методология расчёта этого рейтинга была предложена в своё время лабораторией Cybernetics Labs, входящей в состав CSIC – одного из крупнейших исследовательских центров Испании в области информатики.  Подробнее с данным рейтингом можно ознакомиться в работе [7].

В качестве дополнительных расчётов приводится также сопоставление двух рейтингов (из текущей статьи и из работы [1]). Это позволяет понять динамику изменения данного показателя, выявить сайты лидеры, сайты быстро прогрессирующие и отстающие.

Проводится также (подобно расчётам в статье [1]) анализ отдельных составляющих (индикаторов) рейтинга сайтов и анализ динамики этих показателей за 2012-2013 гг.

 

Методика расчёта. Напомним вкратце методику расчёта рейтингов сайтов научных организаций Россельхозакадемии, приведённый в [1] и используемый в настоящей статье с небольшими изменениями (о них ниже).

Согласно [7] определим вебометрические индикаторы S, V, R и Sc:

S – размер сайта (S-size) – общее количество страниц, обнаруживаемых на конкретном сайте конкретной поисковой машиной. В качестве таковых в работе использовались для сбора данных по индикатору S поисковые системы Яндекс, Google и Yahoo, соответствующие индикаторы обозначены SЯндекс, SGoogle и SYahoo;

V – видимость сайта (V-visibility) – количество уникальных гиперссылок с других веб-ресурсов на ресурсы данного конкретного сайта. В качестве сервисов, используемых для расчётов величины V, использовались сервисы поисковых служб Яндекс, Google и сервиса Solomono. Соответствующие конкретные индикаторы получили обозначение  VЯндекс, VGoogle и VSolomono;

R –  полнотекстовость сайта (R-rich files) – количество полнотекстовых файлов, то есть суммарное количество файлов с расширениями PDF, DOC, PPT, DOCX, RTF, PPTX (последние три формата добавлены нами только в данном рейтинге) обнаруживаемых на конкретном сайте конкретным сервисом.  В качестве сервисов, используемых для расчётов величины V, использовались сервисы поисковых служб Яндекс, Google. Соответствующие конкретные индикаторы получили обозначение  RЯндекс и RGoogle;

Sc – научность сайта (Sc-scholar) – количество ссылок на сайт, обнаруживаемых сервисом Google Scholar (обозначение - ScGoogle).

Как и в [6] к расчётам Sc добавим расчёты по ScЯндекс – количеству упоминаний конкретного сайта в Каталоге сайтов Яндекса.

Рейтинг сайта вычисляется по формуле

 

W=V+S+2*R+1,5*Sc,

где

 

V=log10(1+V0); V0= (VЯндекс+VGoogle+VSolomono)/3

S=log10(1+S0); S0= (SЯндекс+SGoogle+SYahoo)/3

R=log10(1+R0); R0= (RЯндекс+RGoogle)/2

Sc=(log10(1+ScЯндекс)+log10(1+ScGoogle))/2

Как и в [1] повторим, что данная методика обладает радом недостатков. Так, по-прежнему плохо кореллируют показатели внутри отдельных групп. Например, среди пар показателей  SЯндекс, SGoogle и SYahoo  только для пары (SЯндекс , SYahoo) коэффициент корреляции составляет 0.76, для двух других пар (SЯндекс , SGoogle)  и (SGoogle , SYahoo) он составляет 0.38 и 0.39 соответственно. Год назад наблюдалась такая же картина, но приемлемой парой была пара (SЯндекс , SGoogle). Это говорит о значительной изменчивости (закрытых) процедур расчёта данных показателей, что, конечно, искажает результаты расчётов интегрирующего индикатора S.

Аналогично для показателей VЯндекс, VGoogle и VSolomono имеем следующие коэффициенты корреляции для пар (VЯндекс , VSolomono), (VЯндекс , VGoogle)  и (VGoogle , VSolomono) -  0.32, 0.18 и 0.32. То есть корреляция неприемлема ни в одной паре показателей.

Для пары  (RЯндекс , RGoogle) корреляция, как и в [1] очень сильна – 0,92, так что расчёты R0 по приведенной выше формуле вполне логичны.

 

 

Целевое множество рейтинга. В качестве такового, как и в [1] взяты сайты научных организаций, входящих в состав Россельхозакадемии. В настоящем рейтинге, помимо сайтов 101 организаций из прошлого рейтинга (из списка 105 сайтов прошлого года выпали сайты 4-х организаций -  ВНИИ механизации сельского хозяйства, ВНИИ ветеринарной санитарии, гигиены и экологии, ВНИТИ биологической промышленности и Саратовской НИВС - ввиду их недоступности на момент проведения обследования), добавлены также 40 вновь найденных сайтов. Таким образом, общий список обследованных организаций составил 141 научную организацию.

Заметим, что несколько сайтов в новом рейтинге составляют сайты организаций, структурно входящих в другие организации из данного списка (структурные подразделения, станции и т.п.) В силу очень небольшого состава таких организаций решено было оставить их в списке для сравнения с сайтами других организаций и с сайтами родительских организаций. В рейтинге, приведённом ниже, такие организации отдельно указаны в примечаниях к списку.

 

Рейтинг сайтов. В приведенной ниже таблице 1 представлен ранжированный список всех 105 сайтов вместе со значениями рейтинга и наименованиями учреждений.







Анализ результатов. Расчёты рейтинга позволяют сделать ряд обобщений

Так, группировка по индикатору V выглядит следующим образом (таблица 2):



Как видно, в отличие от прошлого года, произошло существенное смещение среднего показателя в сторону группы с показателем от 100 до 1000.  Более подробный анализ показывает, что причина такого смещения как в том, что вновь включенные в список сайты в подавляющей своей части принадлежат к данной группе (и к группе от 10 до 100 ссылок), так и в том, что сайты, уже присутствовавшие в списке в прошлом году улучшили свои показатели и переместились в более высокие группы в данной таблице.

Для индикатора S имеем следующее распределение (табл. 3)


Как видно, общая картина распределения, по сравнению с прошлым годом, существенно (относительно) не изменилась. По-прежнему преобладают сайты с общим числом страниц от 10 до 100 (почти ½ сайтов), значительный процент (чуть более 1/3 сайтов) составляют сайты с числом страниц от 100 до 1000. Оставшиеся две группы (как и год назад) немногочисленны, и составляют сайты-лидеры с числом страниц более 1000 и сайты-аутсайдеры с числом страниц менее 10.

Для индикатора R имеет место следующее распределение (табл. 4)


Как видно, ситуация, по сравнению с прошлогодним рейтингом,  только немного ухудшилась. Количество сайтов с количеством публикаций свыше 100 практически не изменилось, все вновь прибывшие сайты попали примерно поровну в категории до 10 и от 10 до 100 страниц.

Для индикатора научности Sc имеет место следующее распределение (табл. 5)



Как видно, и здесь ситуация, по сравнению с прошлым годом, только ухудшилась: большинство вновь прибывших сайтов попали в первую группу.  

Как и для рейтингов прошлого года приведём для сравнения таблицу рейтингов, рассчитанных как по описанной выше методике, так и по методике, учитывающей только порядковое место в  каждом из частных рейтингов по индикаторам V, S, R и Sc, с последующим суммированием оценок-мест таких частных рейтингов (табл. 6).  


Как видно, первая четвёрка сайтов вновь совпадает в обоих списках (с небольшой перестановкой), а общий процент совпадения вновь (как и в прошлогоднем рейтинге) составляет 80%.

 

Наконец, определённый интерес составляет сопоставление нового списка с прошлогодним по части динамики изменения положения отдельных сайтов. Для простоты анализа остановимся только на первых 30-ти позициях рейтинга (табл. 7).



Как видно, позиции первых 15 сайтов практически не изменились, за исключением перестановок внутри списка.   Вновь появившийся в списке СибНИИСХиТ сразу занял высокое 11-е место, едва не попав в десятку лучших сайтов. Также высокое (16-е) место занял вновь появившийся сайт ВИЖ. Заметен прогресс СКЗНИИСиВ (перемещение с 23-го на 9-е место),  ВНИИ сельскохозяйственной микробиологии (перемещение с 71-го на 17-ое место), ВНИИ зернобобовых и крупяных культур (с 72-го на 23-е место) и ВНИИ виноградарства и виноделия (с 62-го на 30-е), ВНИИ фитопатологии (с 95-го на 21-е место). Серьёзно снизились позиции сайта НИИСХ Юго-Востока (с 5-го на 14-е место) и Ставропольского НИСХ (с 15-го на 25-е место). В целом, вновь появившиеся сайты в списке первых 30-ти позиций присутствуют только в составе 4-х сайтов (ВИЖ, СибНИИСХиТ, МосНИИСХ и СибНИИЖ) из 40-ка вновь появившихся, что говорит о в среднем более низком качественном уровне вновь найденных 40-ка сайтов научных организаций Россельхозакадемии.

 

Анализ данных в разрезе отдельных индикаторов и на уровне отдельных сайтов позволяет (как и в прошлом году) сделать определённые группировки по качеству сайтов. Наряду с появлением в этом году явного лидера – сайта ВИР - по-прежнему имеется 4 сайта (упомянутый выше сайт ВИР и сайты ВНИИ экономики сельского хозяйства, ВНИИ птицеперерабатывающей промышленности и ВИАПИ им. А.А. Никонова) которые имеют значительный отрыв от остальных сайтов. Только эти сайты (как и годом ранее) могут быть признаны «сайтами научной организации» в полной мере. Сайты в позициях с 5-ой по 25-ую соответствуют понятию «научный сайт» почти в полной мере. Сайты в списке на 25-45 местах могут быть отнесены к сайтам с хорошим уровнем научности. Сайты с 45 по 75-ю позицию могут быть признаны вполне удовлетворительными. Сайты с 75 по 115-ю позицию превышают минимальные оценки (в лучшем случае) только по 1-2 индикаторам, и положение дел с ними следует признать только удовлетворительным. Наконец, начиная с 115-ой позиции в списке, сайты удовлетворяют критериям «научности» по всем индикаторам в минимальной степени, и положение дел с ними следует признать неудовлетворительным.

 

Источники.

[1] Сальников С.Г. Рейтинги сайтов организаций Россельхозакадемии// Материалы Международной научно-практической конференции «Информатизация в АПК: состояние, тенденции, перспективы».-М.: ВИАПИ им. А.А. Никонова: «Энциклопедия российских деревень», 2012. – С. 40-45.

[2] Мазалов В.В., Печников А.А. О рейтинге официальных сайтов научных учреждений Северо-Запада России// Управление большими системами. Выпуск 24. С. 130-146.

[3] Шокин Ю.И., Клименко О.А., Рычкова Е.В., Шабальников И.В. Рейтинг сайтов научных организаций СО РАН// Вычислительные технологии 2008. Т. 13. N 3. С. 128-135.

[4] Ханчук А.И., Наумова В.В. Информационное пространство Дальневосточного отделения РАН// Информационные технологии. Вестник ДВО РАН 2009. N 4. С. 122-129.

[5] Шокин Ю.И., Клименко О.А., Рычкова Е.В. Рейтинг сайтов научных организаций Республики Сербия [Электронный ресурс] – Режим доступа: http://www.ict.nsc.ru/userfiles/file/presentation/MIT-09/Srbija_webometrics.pdf

[6] Ranking Web of World Research Centers [Электронный ресурс] – Режим доступа:  http://research.webometrics.info

[7] Карпенко О.М., Бершадская М.Д., Вознесенская Ю.А. Международный рейтинг университетских веб-сайтов [Электронный ресурс] – Режим доступа:   www.edit.muh.ru/content/mag/trudy/09_2008/06.pdf






Назад в раздел