City: Test Saint Petersburg Novosibirsk Kazan Language: Русский English

Применение алгоритмов машинного обучения на платформе Hadoop для обработки большого объема данных (Milind Bhandarkar, Greenplum Labs)
Seminar on Computer Science

What: Lecture
When: Tuesday, 09 October 2012, 18:30–20:00
Where: ПОМИ РАН

Description

Hadoop стал основной платформой для масштабируемых приложений высоконагруженной обработки больших объемов данных. В данной лекции мы обсудим философию дизайна и архитектуру Hadoop, опишем способы разработки приложений и библиотек на базе Hadoop для обработки терабайтов данных. Мы также поговорим о практическом использовании технологии в Data Mining и Machine Learning (в лекции будут рассмотрены способы реализации общих алгоритмов Data Mining для Hadoop, и рассмотрены варианты масштабируемых систем обучения и оценки).

О лекторе. Милинд Бхандаркар — программист параллельных приложений, евангелист технологии Hadoop. Chief Scientist в лаборатории EMC Greenplum. Милинд является членом команды основателей технологии Hadoop. Один из главных экспертов по экосистеме Hadoop, а также применению данной технологии в машинном обучении и аналитике больших объемов данных.

Video