Data mining разработчик

Социальные сети, Одноклассники

Одноклассники – это крупнейшая развлекательная социальная сеть в России. Это место, где можно всегда оставаться на связи со своими друзьями и близкими, выкладывать и редактировать фотографии, слушать любимую музыку, смотреть самые популярные видео, сериалы и фильмы, дарить эмоции друзьям и близким при помощи самых разных подарков, играть в самые интересные игры, находить группы известных компаний и брендов и многое-многое другое!

Более трети дневной аудитории заходит в социальную сеть Одноклассники со своих мобильных устройств, используя как мобильную версию сайта, так и приложения для iOS, Android и WP-устройств.

Более 6 миллионов пользователей онлайн в час пик, более 350 тысяч web-запросов в секунду, более 650 тысяч обращений к фотографиям и видео в секунду на сайте, свыше 5000 серверов и устройств хранения, петабайты данных – это наша повседневная реальность и рабочая среда. Большинство задач, которые возникают перед нами каждый день, не имеют готовых решений – поэтому мы используем собственные разработки. Это сложная, увлекательная и очень интересная работа.

Мы ищем человека с хорошей математической подготовкой, способного искать и анализировать современные научные проблемы, предлагать свои идеи, реализовывать наукоемкие алгоритмы с промышленным уровнем качества. В ходе работы предстоит решать широкий спектр задач, включая, но не ограничиваясь, коллаборативный анализ, автоматическая каталогизация пользовательского контента, борьба со спамом, анализ медийных объектов (аудио, видео, изображения, тексты). Приветствуется контакт с научным сообществом и публикация результатов в рамках тематических блогов, научных журналов и конференций, квалификационных работ и диссертаций.

Информация о проекте:

  • В рамках проекта уже используются различные технологии: С++ для анализа мульти-медиа контента, Python для экспериментов, Java для реализации основных алгоритмов, а также Hadoop для обработки больших массивов данных в распределенном режиме.
  • Из алгоритмов - это и разнообразные алгоритмы кластеризации, стохастические обходы графов, Фурье, SVD и т.д.
  • Основной целью является интеллектуальный анализ данных портала (статистика активности, метаинформация, мульти-медиа контент и т.д.) и использование найденных корреляций для улучшения user experience (персонализация контента, рекомендации, поиск информации).
  • Подробности см в статье "Big data: размер имеет значение?" на http://habrahabr.ru/company/odnoklassniki/blog/216401/

 

Требования к кандидату:

  • Повышенный интерес к системам интеллектуальной обработки информации, методам их разработки и областям применения, знания и опыт приветствуются.
  • Отличная математическая подготовка (непрерывный и дискретный анализ, теория вероятности и статистическая обработка данных, принципы работы алгоритмов и структур данных).
  • Знакомство с принципами разработки промышленных высоконагруженных систем с широкой аудиторией (планирование, тестирование, внедрение), опыт Java программирование приветствуется.
  • Креативный подход к работе и жизни, способность к обсуждению своих и чужих идей.

город

Санкт-Петербург

Пройти тестирование

Присылайте ваше резюме на hr@corp.mail.ru