Ежедневно машинам Веб-поиска задают миллионы запросов. Логи поисковых машин - ценный источник информации об интересах, поведении и предпочтениях пользователей. Чтобы вернуть пользователю адекватный ответ, машины должны хорошо понимать
запросы, которые обычно состоят всего из нескольких слов.
В рамках курса мы рассмотрим основные задачи, методы и приложения анализа запросов. Мы разберем характеристики исходных данных - логов поисковых машин, а также приведем примеры стандартных
логов, доступных для исследовательских целей.
В первой части мини-курса будут более подробно рассмотрены задачи сегментации запросов (разбиение запроса на основные смысловые компоненты), тематической классификации запросов, а также выделения семантически близких запросов. Слушателям будет предложено поэкспериментировать с этими задачами на реальных данных.
Во второй части курса мы обсудим результаты практики, рассмотрим методы перевода запросов на другой язык, а также пространственные (локальные) и временнЫе аспекты запросов к машинам Веб-поиска.
Semester | Branch |
---|---|
autumn 2010 | Saint Petersburg |