Представим, что у нас есть большой объем данных. Данные могут быть получены с метеорологических сенсоров, это может быть интернет-трафик или, например, банковские транзакции. Какую ценную информацию мы способны извлечь в условиях, когда памяти программы имеется значительно меньше чем объема данных, которые необходимо обработать? Что, если сохранить, а потом обработать ВСЮ ценную информацию невозможно?
В курсе мы рассмотрим алгоритмическую составляющую обработки потоковых данных. Входом для алгоритма будет последовательность элементов, пройтись по которой можно один или малое число раз. Мы научимся оценивать число различных элементов, искать наиболее частые, определять медиану и оценивать другие подобные метрики, используя при этом полилогарифическое количество памяти.
Литература
Лекционный материалы по аналогичному курсу Дармутского Колледжа
S. Muthukrishnan Data Streams: Algorithms and Applications
(выбрать Book: pdf)
Правила получения зачёта: rules.pdf
Date and time | Class|Name | Venue|short | Materials |
---|---|---|---|
14 September 11:15–12:50 |
Введение. Детерминированный поиск частых элементов, Lecture | ПОМИ РАН | files |
05 October 11:15–12:50 |
Мультипроходный точный детерминированный поиск статистик, Lecture | ПОМИ РАН | video |
12 October 11:15–12:50 |
Детерминированный приближенный поиск статистик, Lecture | ПОМИ РАН | No |
19 October 11:15–12:50 |
Число различных элементов, Lecture | ПОМИ РАН | slides, video |
09 November 11:15–12:50 |
Приближенный поиск частых элементов. Оценка моментов, Lecture | ПОМИ РАН | slides |
16 November 11:15–12:50 |
Минимальные хэш-функции. Синхронизация множеств, Lecture | ПОМИ РАН | slides, video |
16 November 13:00–14:35 |
Полупотоковые алгоритмы на графах. Базовые алгоритмы, Lecture | ПОМИ РАН | slides, video |
23 November 11:15–12:50 |
Полупотоковые алгоритмы на графах. Эскизы, разрезы, спарсификаторы, Lecture | ПОМИ РАН | slides, video |