Город: Тест Санкт-Петербург Новосибирск Казань Язык: Русский English

Профилирование атрибутов пользователей из множества источников данных различной модальности (Александр Фарсеев, National University of Singapore)
Computer Science семинар

Что: Лекция
Когда: Воскресенье, 08 ноября 2015, 11:15–12:50
Где: ПОМИ РАН
Слайды: csseminar_lecture_081115.pdf

Описание

Автоматическое построение профиля пользователей (профилирование), включающее в себя определение таких атрибутов пользователей как мобильность (географические предпочтения, пространственно-временные паттерны) и демографические атрибуты (пол, возраст, профессия), завоевывает все большую и большую популярность. С другой стороны, быстрый рост социальных платформ позволяет выполнять анализ данных пользователей одновременно из нескольких источников. Например, данные из ВКонтакте могут отражать особенности пользователя с текстовой стороны, в то время как данные из Foursquare и Instagram — со стороны мобильности и визуальных предпочтений, соответственно.

Тем не менее, исследования в области профилирования пользователей на основе данных из множества источников относительно редки. Более того, на данный момент, не существует в свободном доступе наборов данных, обеспечивающих проведение масштабных исследований в этом направлении. В рамках проекта (NUS-MSS), мы предоставили такой набор данных и провели первоначальные эксперименты относительно кросс-платформенного профилирования пользователей на основе данных различной модальности.

Мы собрали и предоставили в общий доступ кросс-платформенный набор мультимодальных данных из трех географических регионов. Далее, на основе собранных данных, мы построили модель для извлечения демографических атрибутов пользователя. Из результатов экспериментов можно отметить, что данные из различных социальных источников взаимно дополняют друг друга, а их эффективная интеграция способна улучшить результаты профилирования пользователей.

Видео