Ежедневно машинам Веб-поиска задают миллионы запросов. Логи поисковых машин - ценный источник информации об интересах, поведении и предпочтениях пользователей. Чтобы вернуть пользователю адекватный ответ, машины должны хорошо понимать
запросы, которые обычно состоят всего из нескольких слов.
В рамках курса мы рассмотрим основные задачи, методы и приложения анализа запросов. Мы разберем характеристики исходных данных - логов поисковых машин, а также приведем примеры стандартных
логов, доступных для исследовательских целей.
В первой части мини-курса будут более подробно рассмотрены задачи сегментации запросов (разбиение запроса на основные смысловые компоненты), тематической классификации запросов, а также выделения семантически близких запросов. Слушателям будет предложено поэкспериментировать с этими задачами на реальных данных.
Во второй части курса мы обсудим результаты практики, рассмотрим методы перевода запросов на другой язык, а также пространственные (локальные) и временнЫе аспекты запросов к машинам Веб-поиска.
Видео лекций: https://www.lektorium.tv/course/22794?id=22794
Дата и время | Занятие | Место | Материалы |
---|---|---|---|
27 ноября 17:20–18:55 |
Характеристики запросов, источники данных, сегментация, Лекция | ПОМИ РАН | слайды |
27 ноября 19:05–20:40 |
Тематическая классификация, близкие запросы, Лекция | ПОМИ РАН | слайды |
19 декабря 11:15–14:35 |
География в запросах. ВременнЫе аспекты запросов. Перевод запросов, Лекция | ПОМИ РАН | слайды |
19 декабря 14:35–14:50 |
Академические инициативы Яндекса, Лекция | ПОМИ РАН | слайды |