Город: Санкт-Петербург Новосибирск Казань Язык: Русский English

Применение алгоритмов машинного обучения на платформе Hadoop для обработки большого объема данных (Milind Bhandarkar, Greenplum Labs)
Computer Science семинар


Что: Лекция
Когда: Вторник, 09 октября 2012, 18:30–20:00
Где: ПОМИ РАН

Описание

Hadoop стал основной платформой для масштабируемых приложений высоконагруженной обработки больших объемов данных. В данной лекции мы обсудим философию дизайна и архитектуру Hadoop, опишем способы разработки приложений и библиотек на базе Hadoop для обработки терабайтов данных. Мы также поговорим о практическом использовании технологии в Data Mining и Machine Learning (в лекции будут рассмотрены способы реализации общих алгоритмов Data Mining для Hadoop, и рассмотрены варианты масштабируемых систем обучения и оценки).

О лекторе. Милинд Бхандаркар — программист параллельных приложений, евангелист технологии Hadoop. Chief Scientist в лаборатории EMC Greenplum. Милинд является членом команды основателей технологии Hadoop. Один из главных экспертов по экосистеме Hadoop, а также применению данной технологии в машинном обучении и аналитике больших объемов данных.

Видео