Представим, что у нас есть большой объем данных. Данные могут быть получены с метеорологических сенсоров, это может быть интернет-трафик или, например, банковские транзакции. Какую ценную информацию мы способны извлечь в условиях, когда памяти программы имеется значительно меньше чем объема данных, которые необходимо обработать? Что, если сохранить, а потом обработать ВСЮ ценную информацию невозможно?
В курсе мы рассмотрим алгоритмическую составляющую обработки потоковых данных. Входом для алгоритма будет последовательность элементов, пройтись по которой можно один или малое число раз. Мы научимся оценивать число различных элементов, искать наиболее частые, определять медиану и оценивать другие подобные метрики, используя при этом полилогарифическое количество памяти.
Литература
Лекционный материалы по аналогичному курсу Дармутского Колледжа
S. Muthukrishnan Data Streams: Algorithms and Applications
(выбрать Book: pdf)
Правила получения зачёта: rules.pdf
Дата и время | Занятие | Место | Материалы |
---|---|---|---|
14 сентября 11:15–12:50 |
Введение. Детерминированный поиск частых элементов, Лекция | ПОМИ РАН | файлы |
05 октября 11:15–12:50 |
Мультипроходный точный детерминированный поиск статистик, Лекция | ПОМИ РАН | видео |
12 октября 11:15–12:50 |
Детерминированный приближенный поиск статистик, Лекция | ПОМИ РАН | Нет |
19 октября 11:15–12:50 |
Число различных элементов, Лекция | ПОМИ РАН | слайды, видео |
09 ноября 11:15–12:50 |
Приближенный поиск частых элементов. Оценка моментов, Лекция | ПОМИ РАН | слайды |
16 ноября 11:15–12:50 |
Минимальные хэш-функции. Синхронизация множеств, Лекция | ПОМИ РАН | слайды, видео |
16 ноября 13:00–14:35 |
Полупотоковые алгоритмы на графах. Базовые алгоритмы, Лекция | ПОМИ РАН | слайды, видео |
23 ноября 11:15–12:50 |
Полупотоковые алгоритмы на графах. Эскизы, разрезы, спарсификаторы, Лекция | ПОМИ РАН | слайды, видео |