Город: Тест Санкт-Петербург Новосибирск Казань Язык: Русский English

Число различных элементов
Алгоритмы обработки потоковых данных

Что: Лекция
Когда: Воскресенье, 19 октября 2014, 11:15–12:50
Где: ПОМИ РАН
Слайды: streaming_algorithms_lecture_191014.pdf

Описание

Минимальный набор из тервера. 2-независимые хэш-функции. Задача подсчета различных элементов в потоке. Алгоритм Флажолета-Мартина по версии Алона-Матиаса-Сзегеди (AMS'99). Считает ответ с фиксированной погрешностью и вероятностью ошибки не более \(\delta\). Использует \(O(\log \frac{1}{\delta} \log n)\) памяти. Алгоритм BJKST'04 считает ответ с мультипликативной погрешностью \(\epsilon\) и вероятностью ошибки не более \(\delta\). У нас будет \(O(\log \frac{1}{\delta} \log n)\). Можно довести до \(O(\log n + \log \frac{1}{\delta} (\log \frac{1}{\epsilon} + \log \log n))\).
Статья Флажолета, Мартина (1983)
Статья Алона, Матиаса, Сзегеди (1999)
Статья BJKST (2004)

Видео