Естественный язык, как и многие другие сложные системы и явления, удобно представлять и изучать в виде графов. Благодаря теоретико-графовым представлениям эффективно решаются многие задачи естественного языка и информационного поиска: извлекаются ключевые слова, определяются их значения, идентифицируются языки, и др.
Данный открытый курс начнётся с классических теоретико-графовых подходов к обработке естественного языка и информационному поиску, таких как TextRank и марковская кластеризация, и завершится современными методами на основе машинного обучения, такими как StarSpace и графовые свёрточные сети. Особое внимание уделяется оценке качества описанных методов при помощи как автоматических, так и экспертных оценок. Курс состоит из пяти лекций:
Описанные в курсе методы представляются с подробным пошаговым разбором и изучением свойств, как теоретических, так и практических. Курс предназначен для студентов, аспирантов, аналитиков данных, исследователей в области обработки естественного языка и информационного поиска (но не ограничивается ими).
Semester | Branch |
---|---|
spring 2021 | Saint Petersburg |