PiFlow是一个功能强大的大数据流水线系统,基于分布式计算框架Spark开发使用它可以进行高效的数据采集、清洗、计算和存储等功能。并且可以将数据可视化,通过各种线形图、柱状图和饼状图等等直观将数据展现出来。
使用方便
提供所见即所得的Web界面来配置数据流
监控数据流状态
检查数据流日志
提供检查点
强大的可扩展性:
支持定制的数据处理组件开发
出众的表演
基于分布式计算引擎Spark
强大
提供100多种数据处理组件
包括spark,mllib,hadoop,hive,hbase,solr,redis,memcache,elasticSearch,jdbc,mongodb,http,ftp,xml,csv,json等
JDK 1.8
Scala-2.11.8
Apache Maven 3.1.0或更高版本
Spark-2.1.0,Spark-2.2.0,Spark-2.3.0
Hadoop-2.6.0
增加可视化分析功能,包括线性图、柱状图、饼状图、散点图;
增加可编程特性,无缝衔接上下游组件,按需在线开发和调试;
增加多语言特性,支持Scala、Python、Shell等多种语言的编程;
增加Spark依赖jar包管理
中医汤头歌诀查询软件 绿色免费版V1.01
行业软件Esale服装连锁销售管理软件 免费版v7.6.5.1
行业软件虚拟模拟炒股练习软件 官方版v2.0.1
行业软件PBM资产管理软件 官方版v2.18.98
行业软件易达计时计件管理软件 官方版v37.3.8
行业软件爱采集阿里巴巴采集大师 最新版v1.1.1.1
行业软件外贸小叮当系统询盘客户管理插件 最新版v1.0
行业软件宏达出生证管理系统 最新版v2.0
行业软件Siemens Simcenter FEMAP 2021 免费版v2021.1.0
行业软件宏达门诊收费与药房管理系统 官方版v1.0
行业软件管家婆免费进销存软件 官方版v2.1.4
行业软件PBM设备管理(租借)系统 官方版v2.18.98
行业软件