Вебометрика
Вебоме́трика (англ. webometrics) — это раздел информатики, в рамках которого исследуются количественные аспекты конструирования и использования информационных ресурсов, структур и технологий применительно к Всемирной паутине[1].
Термин введён Томасом Алминдом (Tomas C. Almind) и Петером Ингверсеном (Peter Ingwersen) в 1997 году в работе Informetric analyses on the World Wide Web: Methodological approaches to «webometrics»[2].
Вебометрика является составляющей инфометрии
.С середины 90-х компания Cybermetrics Lab занимается вебометрическими исследованиями и ранжированием веб-сайтов университетов мира .
Вебометрика включает в себя четыре основных направления исследований:
- Разработка и использование веб-индикаторов (индексы цитирования, наблюдаемость сайтов)
- Анализ социальных феноменов в Веб (социальные сети, сообщества сайтов)
- Сбор данных о Веб (роботы, краулеры, поисковые машины, информационный поиск)
- Анализ гиперссылок (в частности, связи между сайтами вузов и научных организаций)
Вебометрика как составляющая инфометрии
Вебометрика является одной из составляющих инфометрии. Кроме того, вебометрика связана с библиометрией и в определённой степени пересекается с наукометрией[1].
Инфометрия — научная дисциплина, предметом которой являются количественные измерения хранимой и используемой информации[4].
Библиометрия — научная дисциплина, занимающаяся изучением документов на основе количественного анализа первичных и вторичных источников информации с помощью формализованных методов с целью получения данных об эффективности, динамике, структуре и закономерностях развития исследуемых областей[4].
Наукометрия — научная дисциплина, занимающаяся изучением количественных методов развития науки как информационного процесса[5].
Киберметрия — научная дисциплина, занимающаяся количественным анализом новых возможностей по обработке информации, хранимой в электронном виде, и её визуализации[6].
Направления вебометрики
Ранжирование веб-сайтов вузов и научно-исследовательских институтов мира
Испанская лаборатория Cybermetrics Lab разработала методологию ранжирования веб-ресурсов вузов и научно-исследовательских институтов.
В соответствии с данной методологией строится алгоритм ранжирования сайтов на основе четырёх индикаторов[7]:
Индикатор | Аббревиатура | Значение | Поисковые машины |
---|---|---|---|
Visibility | V | Количество ссылок с других сайтов | Google, Yahoo, Live Search и Exalead |
Size | S | Общее количество страниц сайта | Yahoo Search, Live Search и Exalead |
Rich files | R | Количество полноценных текстовых файлов | |
Scholar | Sc | Количество размещенных на сайте статей и их цитирований | Google Scholar |
Алгоритм ранжирования сайтов
Ранжирование сайтов происходит по следующему алгоритму:
- Подсчет значений индикаторов
- Упорядочивание сайтов по убыванию значений соответствующих индикаторов. Для обозначения ранга (или позиции) сайта используются следующие обозначения: RankV для Visibility, RankS для Size, RankR для Rich files, RankSc для Scholar
- Расчет вебометрического ранга (Webometrics Rank — WR)
Критика методологии ранжирования лаборатории Cybermetrics Lab
В работе метода ранжирования веб-сайтов, предложенного лабораторией Cybermetrics Lab, наблюдается ряд недостатоков[7]:
- В методе не учитывается, что учебные учреждения могут поддерживать множество различных доменных областей;
- Не производится учёт веб-ресурсов подразделений учебных учреждений;
- Если на сайте присутствует неакадемическая информация, то она также будет учитываться при составлении индикаторов.
Анализ гиперссылок
Входящие ссылки — количество веб-страниц, ссылающихся на данную веб-страницу или на данный веб-сайт[9]. Данный индикатор используется в качестве показателя значимости некоторой веб-страницы алгоритмами PageRank и HITS. Эти алгоритмы основываются на нахождении страниц релевантных поисковому запросу и на дальнейшим ранжировании полученного списка с учётом входящих ссылок. Страницы с наибольшим количеством входящих ссылок имеют более высокий ранг. Далее происходит упорядочивание списка веб-страниц с учётом их ранга.
Некоторые гиперссылки могут создаваться только с целью навигации между сайтами. Такие гиперссылки должны игнорироваться, так как они не определяют значимость целевой веб-страницы. Кроме того на некоторых сайтах может происходить множественное повторение одних и тех же ссылок. В данном случае следует учитывать только одну входящую ссылку и игнорировать все остальные.
Вебометрика в России
Поскольку методология ранжирования веб-ресурсов, предложенная Cybermetrics Lab, обладает рядом недостатков[7] и к тому же не использует российские поисковые машины (например, Яндекс), в России разрабатываются проекты по созданию собственных вебометрических рейтингов научных учреждений, избавленных от вышеперечисленных недостатков.
Институт прикладных математических исследований КарНЦ РАН
Под руководством Печникова Андрея Анатольевича был создан Вебометрический рейтинг научных учреждений России[10]. В данном проекте задействованы только официальные сайты научных учреждений России. За основу ранжирования взята методология, предложенная Cybermetrics Lab, но учитывающая использование российской поисковой системы Яндекс и краулера BeeCrawler[11]. Используемая методология ранжирования сайтов описана в работе «О рейтинге официальных сайтов научных учреждений Северо-Запада России»[12].
Институт вычислительных технологий СО РАН
Одним из проектов данного института является создание Рейтинга сайтов научных учреждений СО РАН, под руководством Ю. И. Шокина. Для расчета количества внешних ссылок (V) и количества страниц на сайте (S) помимо поисковых систем Google и Яндекс используется также Bing[13]. Для нахождения результирующего значения V и S находится среднее арифметическое. Для нахождения индекса цитирования (Sc) используются системы Google Scholar и Индекс цитирования Яндекса. Используемая методология ранжирования сайтов описана в работе «Рейтинг сайтов научных организаций СО РАН»[14].
Институт научной и педагогической информации РАО
Под руководством, д.т.н А. Б. Антопольского был создан Вебометрический индекс Российских вузов и НИИ. В качестве источников перечня анализируемых web-ресурсов используются официальные перечни учреждений, размещенные на порталах государственных академий и перечень аккредитованных образовательных учреждений[15]. Для формирования индекса используются основные вебометрические показатели[16]. Показатели V, S и R основываются на результатах работы поисковых систем Google и Яндекс, а показатель Sc вычисляется на основе Цитируемости учреждения по РИНЦ. Используемая методология ранжирования сайтов описана в работе «Измерение присутствия в Интернете образовательных учреждений»[17].
Дальневосточный геологический институт
Сервис вебометрических исследований научных сайтов предназначен для анализа сайтов научных организаций Дальневосточного Отделения РАН, Отделения Наук о Земле РАН и других научных сайтов. Сервис был создан под руководством д.г.-м.н. Наумова В. В.. Для расчета основных вебометрических показателей используются поисковые системы Google, Яндекс, Bing и Yahoo[18]. Для расчета вебометрического ранга используется следующая формула:
Используемая методология ранжирования сайтов описана в работе «Информационное пространство Дальневосточного отделения РАН»[19].
Сибирский федеральный университет
Рейтинг сайтов вузов и институтов предоставляет вузам наиболее полные актуальные сведения о состоянии их сайтов с точки зрения вебометрики. Для этого производится еженедельное обновление рейтинга и сохранение истории изменений индикаторов. Методика расчёта рейтинга аналогична методике лаборатории Cybermetrics Lab. Расчет вебометрического ранга производится по следующей формуле[20]:
Сравнение методов построения вебометрического индекса
Вычисление основных вебометрических параметров может основываться на результатах различных поисковых систем. Далее представлена сравнительная таблица использования поисковых систем каждым из приведенных выше институтов и количества обработанных ими веб-ресурсов.
Институт | Visibility | Size | Rich files | Scholar | Кол-во обработанных веб-ресурсов |
---|---|---|---|---|---|
Институт прикладных математических исследований КарНЦ РАН | Google, BeeCrawler | Яндекс, Google, BeeCrawler | Яндекс, Google | Google Scholar | 343 (2013 год)[21] |
Институт вычислительных технологий СО РАН | Яндекс, Google, Bing | Яндекс, Google, Bing | Яндекс, Google | Индекс цитирования Яндекса, Google Scholar | 94 (2013 год)[22] |
Институт научной и педагогической информации РАО | Яндекс, Google | Яндекс, Google | Яндекс, Google | Цитируемость учреждения по РИНЦ | 1843 (2012 год)[23] |
Дальневосточный геологический институт ДВО РАН | Google, Yandex, Bing, Yahoo | Google, Yandex, Bing, Yahoo | Google, Yandex, Bing, Yahoo | Google Scholar | 121 (2013 год)[24] |
Сибирский Федеральный университет СФУ | Majestic SEO | Google Scholar | 657 (2013 год)[25] |
См. также
Примечания
- ↑ 1 2 Webometrics — Ten Years of Expansion, 2006, p. 2.
- ↑ Informetric analyses on the World Wide Web: Methodological approaches to «webometrics», 1997.
- ↑ Webometrics — Ten Years of Expansion, 2006, p. 3.
- ↑ 1 2 Документ. Архив. История. Современность, 2010.
- ↑ Наукометрия, 1969.
- ↑ Визуализация в инфометрии — красота, да и только, 2009.
- ↑ 1 2 3 Рейтинг официальных сайтов, 2008, p. 25.
- ↑ Задача дележа затрат, 2010, p. 189.
- ↑ Webometrics and Social Web Research Methods, 2013, p. 26.
- ↑ Печников А. А. Сравнительный анализ связности веб-графов научных учреждений Архивная копия от 26 февраля 2021 на Wayback Machine // Современные проблемы науки и образования. № 3. 2014.
- ↑ Методика 2013 г. ИПМИ КарНЦ РАН.
- ↑ О рейтинге официальных сайтов, 2009.
- ↑ Методика 2013 г. Институт вычислительных технологий СО РАН.
- ↑ Рейтинг сайтов научных организаций, 2008.
- ↑ list.
- ↑ Методика 2012 г. Институт научной и педагогической информации РАО.
- ↑ Измерение присутствия в Интернете образовательных учреждений, 2012, p. 117.
- ↑ Методика 2013 г. Дальневосточный геологический институт.
- ↑ Информационное пространство Дальневосточного отделения РАН, 2009.
- ↑ Методика 2013 г. Сибирский Федеральный Университет Архивная копия от 2 декабря 2013 на Wayback Machine
- ↑ Вебометрический рейтинг научных учреждений России . Дата обращения: 24 сентября 2018. Архивировано 24 сентября 2018 года.
- ↑ Рейтинг сайтов научных учреждений СО РАН . Дата обращения: 16 ноября 2013. Архивировано 18 декабря 2013 года.
- ↑ Вебометрический индекс Российских вузов и НИИ Архивная копия от 16 ноября 2013 на Wayback Machine
- ↑ Сервис вебометрических исследований научных сайтов Архивная копия от 21 октября 2014 на Wayback Machine
- ↑ Рейтинг сайтов вузов и институтов Архивная копия от 2 декабря 2013 на Wayback Machine
Литература
- Peter Ingwersen. Webometrics — Ten Years of Expansion. — Nancy (France), 2006.
- Tomas C. Almind, Peter Ingwersen. Informetric analyses on the World Wide Web: Methodological approaches to «webometrics» // Journal of documentation. — 1997. — Т. 53, № 4. — С. 404—426.
- А.А. Пронин. Документ. Архив. История. Современность. — 11-е изд. — Екатеринбург: Издательство Уральского университета, 2010. — С. 225—226. — ISBN 978-5-7996-0566-7. (недоступная ссылка)
- В.В. Налимов. Наукометрия. — М.: Наука, 1969. — С. 12.
- Александр Беленький. Визуализация в инфометрии — красота, да и только. — КомпьютерПресс, 2009. — № 4.
- В.В. Мазалов, А.А. Печников, А.В. Чирков, Ю.В. Чуйко. Задача дележа затрат на создание веб-коммуникатора как кооперативная игра // Управление большими системами: сборник трудов. — Москва: Институт проблем управления им. В.А. Трапезникова РАН, 2010. — № 30—1. — С. 187—196. — ISSN 1819-2440.
- А.А. Печников, О.Г. Илюкевич. Рейтинг официальных web-сайтов университетов России и Финляндии: сравнительный анализ (рус.) // Информационные ресурсы России. — Москва: Российское энергетическое агентство Министерства энергетики Российской Федерации, 2008. — № 3. — С. 25—28. — ISSN 0204-3653.
- Mike Thelwall. Webometrics and Social Web Research Methods. — University of Wolverhampton, 2013.
- Мазалов Владимир Викторович, Печников Андрей Анатольевич. О рейтинге официальных сайтов научных учреждений Северо-Запада России // Управление большими системами: сборник трудов. — 2009. — № 24. — С. 130—146.
- Ю.И. Шокин, О.А. Клименко, Е.В. Рычкова, И.В. Шабальников. Рейтинг сайтов научных организаций СО РАН. — 2008.
- А.Б. Антопольский, Ю.Е. Поляк. Измерение присутствия в Интернете образовательных учреждений // Проблемы современного образования. — 2012. — № 4. — С. 117—131. — ISSN 2218-8711.
- А.И. Ханчук, В.В. Наумов. Информационное пространство Дальневосточного отделения РАН // Вестник ДВО РАН. — 2009. — № 4. — С. 122—129. Архивировано 23 октября 2014 года.
Ссылки
- Перечень аккредитованных образовательных учреждений (ноябрь 2013). Дата обращения: 16 ноября 2013. Архивировано из оригинала 10 июня 2015 года.
- Методика 2013 г. ИПМИ КарНЦ РАН (ноябрь 2013).
- Методика 2013 г. Институт вычислительных технологий СО РАН (ноябрь 2013).
- Вебометрический индекс российских вузов и НИИ. Методика 2012 г. Институт научной и педагогической информации РАО. Ноябрь 2013 года.
- Методика 2013 г. Дальневосточный геологический институт (ноябрь 2013). Архивировано из оригинала 21 октября 2014 года.