Moscow Data Science 4 сентября

4
сентября 2015 года
Начало события в 18:00

О мероприятии

4 сентября, в пятницу, Mail.Ru Group проведет традиционную встречу сообщества Moscow Data Science. Первое подобное событие состоялось в офисе компании в 2013 году, и теперь участники регулярно обмениваются профессиональным опытом и обсуждают вопросы, связанные с применением алгоритмов машинного обучения для решения задач анализа больших данных, построения рекомендательных систем и SNA.

В программе – 3 доклада по 30 минут, после которых участники смогут пообщаться в неформальной обстановке за чашкой чая. В этот раз спикерами выступят:

Дмитрий Селиванов, Однокласники

Finding Similar Items in high-dimensional spaces: Locality Sensitive Hashing

Дмитрий познакомит слушателей с эффективным вероятностным методом снижения размерности многомерных данных – Locality Sensitive Hashing. На примере задачи поиска похожих текстовых документов гости подробно разберут алгоритм Minhash и научатся выявлять дубликаты за линейное время.

Дмитрий Бабаев, независимый исследователь

Data science using Big Data. Pragmatic approach

Подготовка данных, построение предиктивных моделей и дальнейшее их использование становятся сложнее при работе с big data. Возникают новые проблемы, которые отсутствуют при работе с обычными объемами данных. Комбинация привычных и новых инструментов работы с данными позволяет использовать большие данные, применяя привычные подходы работы с данными. Спикер расскажет, как эффективно использовать стандартные инструменты машинного обучения из Python Data Stack (IPython Notebook, SciKit-Learn, Pandas) совместно с Apache Spark и Hadoop Stack. Он затронет подходы к машинному обучению на больших данных и LSML, а также поделится практическими приемами ML в комбинации со Spark.

Андрей Кутузов, Mail.Ru Group

Нейронные языковые модели и задача определения семантической близости слов для русского языка

Доклад касается популярных в последние годы нейронных или предсказательных моделей, которые переворачивают семантический анализ текстов с ног на голову. Эти модели позволяют быстро получать векторы (не нужна запятая) во много тысяч раз компактнее, чем при традиционном подходе, и качество при этом только повышается.

Начало встречи в 18.00.

Трансляция доступна здесь.

Адрес: Ленинградский проспект, 39, строение 79 (м. «Аэропорт»). 

Поделиться
4
сентября 2015 года
Начало события в 18:00