Moscow Data Science Meetup

27 мая 2016 г., пятница
Начало события в 18.30

27 мая в московском офисе Mail.Ru Group состоится традиционная встреча сообщества Moscow Data Science. Докладчики из крупных российских компаний и научных организаций поделятся своим опытом решения практических задач анализа данных. К участию приглашаются энтузиасты в области машинного обучения, рекомендательных систем, анализа социальных графов и смежных с ними дисциплин. После окончания докладов будет возможность пообщаться в неформальной обстановке.

В программе встречи:

— H2O на Spark: как мы пили газировку и чуть не захлебнулись

Дмитрий Носов, Rambler&Co

H2O — интересная и многообещающая платформа машинного обучения. Она может порадовать аналитика скоростью работы с большими объемами данных, набором алгоритмов, наличием API для нескольких языков программирования, и, конечно же, красивыми и подробными отчетами по построенным моделям. H2O написана на Java, поэтому работает везде (tm), в том числе на кластере Spark. В докладе спикер поделится своим опытом использования H2O на Spark и YARN, а также причинами отказа от использования H2O в production-окружении, не смотря на все ее положительные качества.

— Глубокое обучение и извлечение признаков в прогнозировании временных рядов

Павел Филонов, «Лаборатория Касперского»

Автоматическое выделение признаков, которые имеет место при построении глубоких сетей, видится перспективным инструментом, способным значительно сократить объём работ по подготовке данных. В докладе рассматривается задача прогнозирования значений временного ряда и сравниваются подходы к ее решениям как с использованием ручного выделения признаков, так и построенные на полностью автоматической обработке сырых данных.

— Решение задачи Search Results Relevance (на платформе Kaggle)

Александр Дьяконов, ВМК МГУ

Разбирается задача по определению релевантности поисковой выдачи, которая решалась на прошлогоднем «Практическом семинаре по АД kaggle». Описывается очень простой алгоритм, который не использует сложных методов анализа текстов, словарей и ансамблей алгоритмов, и который, тем не менее, смог попасть в десятку сильнейших среди более чем 1300 участников.

Сбор участников в 18:30, начало докладов – 18:50.

Для тех, кто не сможет присутствовать лично, будет организована онлайн-трансляция.

Адрес: офис Mail.Ru Group, Ленинградский проспект, 39, стр. 79.

Ближайшие события

Архив событий по теме