TechFusion.ruНовостиБольшие данные помогут предсказывать отпуска по соцсетям

Большие данные помогут предсказывать отпуска по соцсетям

Большие данные

Ученые НИТУ «МИСиС» разработали математическую модель, которая сможет прогнозировать следующее местоположение человека, основываясь на его текущих публикациях в Twitter. Алгоритм использует для «предсказаний» большие данные и машинное обучение

Российские ученые представили алгоритм, способный предугадывать место отдыха человека, основываясь на его публикациях в соцсетях. Решение использует для прогнозов большие данные (Big Data) и машинное обучение (ML). Статья о разработке опубликована в статье An ensemble classification approach for prediction of user’s next location based on Twitter data в журнале Journal of Ambient Intelligence and Humanized Computing.

Как сообщили в пресс-службе вуза, прогнозы следующего местоположения пользователей базируются на публикациях людей в Twitter с геолокацией. При отборе данных категории сопоставлялись с характеристиками личности пользователя. Для построения модели прогнозирования был использован метод ансамблевой классификации, объединяющей результаты всех базовых классификаторов.

«Мы использовали не только открытые данные о путешествиях, но и о личностях самих путешественников. Сначала мы извлекли из данных все геотегируемые твиты и категоризировали. Из случайного набора 5000 профилей пользователей разных европейских стран (Франция, Германия, Швеция, Испания, Италия, Швейцария, Польша, Греция и многие другие) было выложено более 800 тысяч твитов. При отборе данных наиболее посещаемыми в поездках категориями оказались «Еда», «Ночные клубы», «Вокзалы», «Церкви», «Морские пляжи». Для каждой категории мы подготовили отдельный набор данных», — рассказала руководитель исследования, директор Института информационных бизнес-систем НИТУ «МИСиС» Марина Нежурина.

По мнению разработчиков, алгоритм будет полезен представителям туристического бизнеса, так как позволит предсказывать востребованность курортов в отпускной период. Сейчас ученые работают над возможностью конкретизации прогнозов с учетом гражданства, возраста и пола пользователей.

Иллюстрация на обложке: pixabay.com