Skip to content

buleline 是一个非常易用,高性能,能够应对海量数据的实时数据处理,构建于Apache Spark之上。 使用场景 1.海量数据ETL 2.海量数据聚合 3.多源数据处理

License

Notifications You must be signed in to change notification settings

kioco/io.cjx.blueline

Repository files navigation

Blueline是一个非常易用,高性能,能够应对海量数据的实时数据处理产品,构建于Apache Spark之上。

使用场景 海量数据ETL 海量数据聚合 多源数据处理

特性 简单易用,灵活配置,无需开发 实时流式处理 离线多源数据分析 高性能 海量数据处理能力 模块化和插件化,易于扩展 支持利用SQL做数据处理和聚合 支持Spark 2.x

工作流程 外部数据源 -------> input ----> filter ----->output ----->外部数据源 多个Filter.output构建了数据处理的Pipeline,满足各种各样的数据处理需求,如果您熟悉SQL,也可以直接通过SQL构建数据处理的Pipeline,简单高效.

支持的插件 1.Input plugin

Kafka,mysql

2.filter

Json,Deta,sql

3.output plug

Kafka,mysql,jdbc

环境依赖

Spark on Yarn

Spark Standalone

Spark on Mesos

About

buleline 是一个非常易用,高性能,能够应对海量数据的实时数据处理,构建于Apache Spark之上。 使用场景 1.海量数据ETL 2.海量数据聚合 3.多源数据处理

Resources

License

Stars

Watchers

Forks

Packages

No packages published