Google Cloud Dataflow Now Available на Apache Flink

apache

Разработчики приобретают еще одну платформу для исполнения конвейеров Потока данных. Они могут сейчас выполнить собственные программы на механизме распределенной обработки Apache Flink.

У разработчиков, применяющих Гугл Cloud Dataflow для записи конвейеры, которые комбинируют потоковые задачи и партию обработки сейчас, имеется опция исполнения их программ на новом механизме распределенной обработки Apache Flink.Ремесленники данных, Берлин, находящийся в Германии производитель Flink высвободил Облачного бегуна Потока данных для Flink, что разрешает любой программе Потока разрешённых выполняться на кластере Flink, расположенном в облаке либо установленном на месте.Flink есть новым проектом верхнего уровня от Базы ПО Apache, которая предлагает механизм распределенной обработки для исполнения партия и паровые приложения обработки.

Ремесленники данных обрисовывают его как альтернативу компоненту MapReduce Хэдупа, что способен к работе вполне независимо от экосистемы Hadoop.Облачный Поток данных Гугл есть моделью программирования для потоковых задач и объединения партии обработки на громадных наборах данных. Разработка создана для компаний, наблюдающих на сокровище бизнеса выдержки и от данных в покое и от данных в движении.

Кое-какие варианты применения для потоковой передачи аналитики включают визуализацию данных настоящего времени, предупреждение в настоящем времени и мониторинг безопасности.Объявление Flink расширяется до три число платформ, которые сейчас дешёвы разработчикам для потоковых приложений и выполнения партии обработки посредством Потока данных.

Облачный Поток данных был первоначально выпущен как сервис на Облачной Платформе Гугл. Тогда в декабре, Гугл выпустил Облачный Набор разработчика ПО (SDK) Потока данных для разработчиков, сохраняющих надежду портировать модель программирования на другие механизмы обработки. В январе Гугл и Клоудера заявили о доступности Потока данных на популярной платформе Искры Apache Клоудеры.

В сообщении в блоге Ремесленники Данных обрисовали нового бегуна как инструмент, что разрешит пользователям Потока данных более легко действенно применять Apache Flink как бэкэнд исполнения для их программ.«Flink и Cloud Dataflow отлично согласовываются, потому, что они оба совместно применяют видение собственного пакетной обработки и объединения потока данных на уровне механизма», отметил блог.Додавая Flink к бегунам, которые доступны для Потока данных, у пользователей сейчас имеется больше выбора для рабочей потоковой и гибридной партии аналитики и в облаке и на предпосылке, сообщило сообщение в блоге.

По словам Ремесленников Данных, новый бегун Flink поддерживает всю пакетную функциональность Потока данных. Команда Сейчай трудится над встраиванием помощи аналитики потоковой передачи в бегуна, отмеченный блог, не показывая период времени.В сообщении в блоге, объявляющем о новой разработке, главный менеджер по продукции Гугл Уильям Вэмбенеп заявил, что бегун Flink повышает исполнение и мобильность конвейеров Потока данных.

«[Flink] предоставляет устойчивому механизму исполнения пользовательское управление памятью и оптимизатор на базе издержек», сообщил Вэмбенеп. «И лучший из всех, у Вас имеется обеспечение, что Ваши конвейеры Потока данных являются переносимыми вне Гугл Cloud Dataflow».Аналитические компании как Forrester ожидают, что спрос на потоковую передачу одолжений аналитики и разработок будет расти за следующие пару лет, потому, что больше организаций пробует извлечь цена из огромных количеств данных, сгенерированных сейчас от операций, веб-маршрутов перемещения, облачных сервисов и мобильных приложений.Основной облачный Amazon соперников Гугл и Микрософт оба имеют потоковые услуги по обработке в настоящем времени, которые подобны Потоку данных.

Разработку Amazon вызывает Кинезом и рекламирует компания как сервис, которая способна к помощи компаниям взять и проанализировать терабайты данных в час. Потоковый механизм обработки событий Аналитики Микрософт так же создан, чтобы оказать помощь компаниям взять бизнес-понимание в настоящем времени от данных, взятых из приложений, данных, устройств и датчиков.