Have something interesting to share with Java Eastern Europe community?
Become a speaker now

Записки с передовой: Hadoop, NoSql, RDBMS, Katta

Описание: Хотите услышать о проекте, где используется стек технологий из Hadoop для распределенной обработки и хранения данных, Katta для распределенного хранения и обработки Lucene индексов, MongoDB для хранения неструктурированных данных? Мы хотели бы рассказать о реальном опыте применения этой связки, с какими проблемами мы столкнулись и как мы их решали. Допустим одна из проблем это использование сторонних библиотек в Hadoop Map/Reduce, все очевидно, но как сделать это красиво и удобно? Или как запустить Hadoop job из под web приложения, а не из консоли, и мониторить ее выполнение? А вот проблема хранения и обработки неструктурированных данных в MySql. Что за данные мы хранили там и почему решили использовать MongoDB? И зачем же мы все-таки используем Katta? Все эти проблемы и их решения исходят из реальной бизнес идеи, и обо всем этом мы расскажем вам.
Тип выступления: Доклад (50 минут)
Роман Николаенко

Роман Николаенко

Харьков, Украина

Engineer в компании Grid Dynamics. Нравятся интересные задачи, связанные с разработкой распределенных систем и их дизайном. Текущий проект на Java связан с разработкой распределенной системы обработки данных, использующей Apache Hadoop и MongoDB.

Алексей Гайдук

Алексей Гайдук

Харьков, Украина

Senior Engineer в компании Grid Dynamics. В IT более 10 лет, более 5 лет разработки всего, что связано с языком Java. В данный момент занимается написанием приложения для обработкой больших объемов данных.

Видеозапись выступления

Слайды презентации