20 мая 2024, понедельник, 22:30
TelegramVK.comTwitterYouTubeЯндекс.ДзенОдноклассники

НОВОСТИ

СТАТЬИ

PRO SCIENCE

МЕДЛЕННОЕ ЧТЕНИЕ

ЛЕКЦИИ

АВТОРЫ

Кассовые сборы фильмов предсказывают по Википедии

Сравнение реальных кассовых сборов со спрогнозированными на основе деятельности пользователей Википедии
Сравнение реальных кассовых сборов со спрогнозированными на основе деятельности пользователей Википедии
Márton Mestyán, Taha Yasseri, János Kertész

Ученые создали алгоритм прогнозирования финансового успеха фильма на основе данных о деятельности интернет-пользователей. В статье, опубликованной в PLOS ONE, трое венгерских авторов продемонстрировали, что популярность фильма можно предсказать задолго до его выхода на экран с помощью измерения активности редакторов и читателей статьи об этом фильме в Википедии.

Исследователи неоднократно с успехом применяют анализ сетевой активности пользователей для получения различной информации. Такеси Сакаи и коллеги из Токийского университета в 2010 году предложили использовать «Твиттер» для выявления сообщений о землетрясениях. В дальнейшем один из соавторов Сакаи – Макото Окадзаки – применил семантический анализ сообщений «Твиттера» для обнаружения радуг и городских пробок. В США компьютерная система на основе «Твиттера» используется для выявления ресторанов с некачественной пищей. Лингвисты изучают блогосферу с целью выявления изменений в языке или географического распределения языков. Анализ «Твиттера» позволяет предсказывать изменения промышленного индекса Доу-Джонса  с точностью до 87,6% или же результаты выборов. В других исследованиях анализируются статистика поисковых запросов в Google, количество загрузок на сайте arXiv.org, пользовательские комментарии к статьям в интернет-изданиях и другие виды сетевой активности.

Мартон Местьян (Márton Mestyán), Таха Яссери (Taha Yasseri) и Янош Кертес (János Kertész) предлагают оценивать активность редакторов и количество просмотров страницы о готовящемся фильме в Википедии для оценки его будущей популярности и кассовых сборов. Для отработки методики они использовали данные о 312 фильмах, которые вышли на экраны в США в 2010 году. Разработанный ими метод анализа дает хорошие прогнозы уже за один месяц до появления картины в кинотеатрах. При анализе учитывались: количество просмотров статьи, количество пользователей, которые вносили изменения, количество самих изменений и его один показатель – коэффициент строгости, основанный на том, какое количество правок подвергаются в дальнейшем пересмотру.

Исследователи подчеркивают, что их статистический метод, независящий от языка, легко может быть применен к кинорынкам других стран и даже для прогнозирования популярности других видов продукции.

Редакция

Электронная почта: polit@polit.ru
VK.com Twitter Telegram YouTube Яндекс.Дзен Одноклассники
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2024.