18+

Артур Скальский

©  Газета.Ru

Интернет и ИТ Мир

2889

22.10.2010, 00:32

Кликай по-научному

Популярность веб-сайтов описана математической моделью.

Создана математическая модель, описывающая динамику популярности веб-сайтов. Оказалось, что посещаемость сайта изменяется не плавно, а резкими случайными всплесками, которые и позволяют «делать кассу» рекламе. Провоцировать эти всплески сложно, однако социальные сети — самый лучший инструмент для этого.

Как веб-сайты становятся популярными? Почему одни страницы становятся популярными очень быстро, другие наращивают число посетителей постепенно, а третьи вообще остаются малоизвестными? Есть ли математическая закономерность в этих процессах?

Этими вопросами задались ученые из США (Университет Индианы) и Италии (Турин). Они проанализировали два огромных массива данных — статьи «Википедии» и интернет-пространство целой страны — Чили.

Их исследование показало, что нарастание онлайн-популярности наступает не в результате постепенного накопления числа посетителей страницы, а происходит резкими вспышками.

Такое поведение свойственно так называемым критическим системам — к ним относятся крахи фондовых рынков и ряд природных явлений. Работу математиков публикует Physical Review Letters. Они также разработали модель, которая описывает динамику онлайн-популярности.

«Популярность в интернете — непредсказуемая вещь, внимание публики резко перемещается от одного ресурса к другому. Статистически эти колебания подобны землетрясения и лавинам», — пояснил первый автор работы Джейкоб Раткевич из Университета Индианы.

Онлайн-информация, резко становящаяся популярной, оказывает огромное влияние на формирование позиции общества, культуру и политику.

Кроме того, реклама, размещенная на сайте, «ставшем звездой», становится неизмеримо прибыльней всякой иной. Конечно, каждый сайт стремится стать как можно более посещаемым и сохранить во времени своих читателей, однако практика показывает, что «гиперпосещаемость» почти никогда не удается удержать.

В первом изученном примере — посещаемости «Википедии» — ученые проанализировали два параметра: число кликов, ведущих на каждую статью, а также число ссылок на нее, опубликованных на внешних ресурсах. В более ранних работах утверждалось, что распределение популярности веб-страниц подчиняется степенной зависимости. Однако судить о динамике популярности каждой отдельной страницы было сложно, так как информации о числе посетителей и ссылок в каждый момент времени не было. Авторы работы восполнили этот пробел: они обработали информацию о трафике от миллионов страниц. Всего были обработаны три миллиона статей «Википедии» (2001—2007 годов) с временным разрешением в одну секунду, три миллиона статей «Википедии» (2008—2010 годов) с временным разрешением в один час и три миллиона интернет-страниц домена Чили (.cl) с разрешением один год (2002—2006 годов). Разрешение показывает частоту «сетки», наименьший период времени, через который производится вторичное детектирование посещаемости страницы. Для этого использовались внутренние данные «Википедии», а также информация чилийского поисковика TODOCL.

Оказалось, что почти все страницы переживали вспышку популярности в самом начале своего существования. Затем некоторые страницы действительно показывали стабильный экспоненциальный рост, однако большая часть в среднем сохраняла небольшую посещаемость, ее рост и падение происходили резкими скачками.

Распределение скачков посещаемости сайтов, как оказалось, подчиняется «закону тяжелого хвоста», также характерного для критических систем.

Такое распределение чрезвычайно неравномерно: большая часть точек характеризуется небольшими значениями (в данном случае это число посетителей в день), и лишь малая часть — очень большими. Однако именно эти всплески определяют суммарный трафик: они столь велики, что каждый из них на порядки превышает суммарную величину посещаемости «неудачных дней». Однако динамика этих «всплесков» отличается от динамики популярности «горячей» новости, подчеркивают ученые. Если внимание, обращаемое на новость, очень быстро затухает, то «всплески» популярности сайтов следуют сериями, и это в итоге влияет на повышение общей популярности страницы.

Математики разработали классификационную модель, которая качественно воспроизводит часть особенностей «всплескового» поведения популярности веб-сайтов, однако для более качественного описания «эффекта тяжелого хвоста» им пришлось добавить в модель специальный «реклассификационный механизм». Реклассификация случайным образом «вздувает» популярной той или иной страницы. Парадоксально, но именно такой механизм позволяет приблизить модель к описанию экспериментальных данных.

«Несмотря на то что модель имеет в больше степени описательный характер, мы надеемся, что более глубокое понимание процесса развития популярности веб-сайта приведет в конечном итоге к развитию методов прогнозирования возникновения популярности именно в упреждающем смысле.

Однако искусственно повысить популярность какого-то конкретного сайта с помощью нашего механизма не удастся», — подытожил Раткевич.

Однако ученые уже готовы предоставить рецепт популярности. Анализ использования социальных сетей в формировании популярности сайтов показал, что они вполне пригодны как минимум для создания временного всплеска посещаемости. «Бомбы из твиттера» взлетают в рейтингах, как ракеты, и могут легко забраться на самую верхушку результатов поиска Google», — отмечают исследователи.

Артур Скальский

©  Газета.Ru

Интернет и ИТ Мир

2889

22.10.2010, 00:32

URL: https://m.babr24.news/?ADE=89173

Bytes: 5391 / 5391

Скачать PDF

Поделиться в соцсетях:

Также читайте эксклюзивную информацию в соцсетях:
- Телеграм
- ВКонтакте

Связаться с редакцией Бабра:
[email protected]

Другие статьи и новости в рубрике "Интернет и ИТ"

T2 и VK займутся развитием искусственного интеллекта для маркетинга и аналитики

Мобильный оператор T2 и VK заключили соглашение о сотрудничестве в области технологий искусственного интеллекта, цифрового маркетинга и аналитики на ...

Источник: Babr24.com.

Интернет и ИТ

Россия

712

25.06.2025

Часть красноярцев всё ещё остаётся без интернета спустя 11 дней после кибератаки на «Орион»

Провайдер «Орион» сообщил, что восстановил интернет в Красноярске на 85%. Об этом компания написала в своих соцсетях 23 июня.

Мошенники звонят красноярцам от имени «Ориона». Провайдер просит быть внимательнее

Провайдер «Орион телеком» предупредил об участившихся случаи мошенничества от имени компании.

«Орион Телеком» всё ещё восстанавливает интернет в Красноярске спустя неделю после сбоя

Жители Красноярска 19 июня продолжают жаловаться на отсутствие интернета и телевидения от провайдера «Орион Телеком» — проблемы сохраняются уже ...

Сотрудники новосибирской мэрии перейдут на месседжер MAX

Мэр Новосибирска Максим Кудрявцев поручил сотрудникам администрации перейти на российский мессенджер MAX для внутренней переписки с 23 июня.

Источник: Babr24.com.

Интернет и ИТ

Новосибирск

1268

19.06.2025

Часть красноярских абонентов «Орион Телекома» уже четыре дня остается без интернета. Когда всё починят?

Многие абоненты «Орион Телекома» уже четыре дня остаются без интернета из-за масштабной DDoS-атаки, которая произошла ночью 12 июня.

Красноярцы остались без интернета из-за DDoS-атаки на крупнейшего провайдера в городе

В ночь на 12 июня крупнейший интернет-провайдер Красноярска «Орион телеком» столкнулся с масштабной DDoS-атакой.

E-Mongolia обзавелась функцией регистрации деревьев

Единая электронная система E-Mongolia – монгольский аналог Госуслуг – получила функцию регистрации деревьев.

T2 дарит иркутянам качественную связь через Wi-Fi

Абоненты Т2 в Иркутской области получили возможность пользоваться технологией Voice over Wi-Fi!

Источник: Babr24.com.

Интернет и ИТ

Иркутск

2845

30.05.2025

T2 дарит радость каждому понедельнику

Т2 с партнерами снова запустила акцию «Понедельники», на этот раз она продлится до середины июня.

Источник: Babr24.com.

Интернет и ИТ

Иркутск

3716

19.05.2025

Т2 защищает: SMS-коды от важных сервисов не будут приходить во время звонка

T2 вводит инновационную защиту против телефонных мошенников: SMS-коды теперь приходят с задержкой.

Автор: Саша Савельева.

Источник: Babr24.com.

Интернет и ИТ

Россия

5347

01.05.2025

T2 ускорила интернет на Байкале: Харанцы готовы к туристическому сезону!

Лето близко, и T2 подготовилась к сезону на Байкале: новая базовая станция в Харанцах обеспечит быстрый интернет туристам и местным жителям даже в ...

Источник: Babr24.com.

Интернет и ИТ, Туризм

Байкал

5202

22.04.2025