Superset-轻量级开源可视化BI工具

1、引言

数据可视化是关于数据视觉表现形式的科学技术研究,是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。利用商业性可视化工具有如:Tableau、DataV、FineReport、FineBI等可以简捷灵活地进行数据可视化工作,但是需要收费购买;利用前端可视化组件如:ECharts、D3、Three.js等也可以做出丰富的图表页面,但是要求一定的技术基础。开源可视化分析工具如:Bokeh、Matplotlib、Metabase、Superset等首先是无软件成本的,其次是要考虑它们的便捷性。本文将简要介绍一款轻量级开源可视化BI工具:Superset,其成熟度不如商业可视化工具,但是胜在无软件成本且有一定的灵活性。

2、Superset简介

Superset是一款由Airbnb开源的、目前由Apache孵化的,基于Flask-appbuilder搭建的“现代化的企业级BI(商业智能)Web应用程序”,它通过创建和分享dashboard,为数据分析提供了轻量级的数据查询和可视化方案。

Superset的可取之处有很多如:它自带SQLite数据库并支持连接Hive、Impala、MySql、Oracle等几乎所有主流的数据源;支持和弦图、事件流图、热力图、视图表等及其它常规的可视化展示图表;支持可控的数据展示,能自定义展示字段、数据源等;支持权限控制,以满足不同使用人员对数据和数据库的权限要求;同时内含SQL查询面板模块、具有较美观友好的操作界面等。另外,查阅资料可知Superset可以基于Python的虚拟环境安装或Docker容器安装,经实践建议基于Docker安装,避免因python依赖包的安装遗漏或版本不符等问题造成失败。

3、几种使用场景

Superset是一款自助式的BI工具,可利用于探索式的日常数据分析中,它能够对接常用的大数据分析工具、能够连接主流数据库或直接上传CSV数据文件,内含多类型展示图表样式,使用者通过自定义图表或dashboard可以直观地发现、分析、预警数据中所隐藏的问题,及时应对业务中的风险或发现增长点。

Superset也可利用于数据可视化成果共享,实现团队协同,使用者可将制作好的图表或发布的dashboard可见于团队成员,并通过权限配置控制团队成员对它们的可编辑性,各成员可发挥各自的想法,实现迭代化更新。

另外,Superset具有“SQL Lab”模块,可作为一个数据库管理工具,SQL查询面板可以对已连接的数据源进行数据查询,对数据源进行配置选择后也可实现数据库表的创建、修改和删除,通过该设置可避免对重要数据源的误改、误删。

4、Superset实战入门

在该部分将通过疫情dashboard、企业客户dashboard这两个dashboard实例制作来了解Superset的功能,dashboard的制作可分为四步:连接数据源、添加及设置table、制作charts、制作dashboard;同时可在“SQL Lab”对数据库表的数据进行查询及结果可视化。首先基于Docker在内网环境成功安装了Superset应用,并通过浏览器访问登陆,登陆界面如下:

4.1、连接数据源

按照示例新建数据库、连接数据源,

选择“Sources_Databases”点击“+”按钮添加数据源

填写好Database的基础信息后,点击“Test Connection”,若弹出框显示“Seems OK!”则表示成功连接数据源。其中,Oracle数据源的“SQL Alchemy URL”编辑形式为:“oracle://用户名:密码@ip地址:端口/实例名”,其它数据源URI形式可参考:https://docs.sqlalchemy.org/en/13/core/engines.html#database-urls。

4.2、table添加及设置

成功连接数据源后按以下步骤添加可视化数据tables,

选择“Sources_Tables”点击“+”按钮添加可视化数据表

 

选择需要的数据库及数据表,点击“Save”按钮进行保存

 

对添加的table进行基础设置,包括三部分:Details(设置表基础信息);List Columns(设置数据属性,groupable/filterable/istemporal);List mertics(预设数据过滤,sum/count等)

 

4.3、制作charts

制作疫情情况dashboard的基础是制作一个个的charts图表,

在tables列表中双击要制作chart的表名,进入绘图区域

 

点击visualization type,在弹出框选择需要可视化的图表类型

 

对要进行可视化的图表进行参数设置,Time/Metric/filter等,设置好后点击“Save”进行保存,同时页面跳转至charts列表页

 

点击“View Query”可在弹出框查看可视化数据SQL

做好的chart将依次罗列于charts列表页,在该页双击图表名可跳转至绘图区域,并对已编辑的chart进行修改

 

4.4、制作dashboard

当制作dashboard的charts准备就绪后,就可以开始制作dashboard,

选择“dashboard”点击“+”按钮添加可视化面板,双击dashboard名进入编辑区域

 

点击“Edit dashboard → Action”下拉列表选择“Add Slices”即可为面板添加charts素材,各charts组件的大小及位置可以拖动调整,也可对已添加的chart进行更名、强制更新、编辑、重绘图、移除等。Dashboard中的charts添加调整好后点击“Save”进行保存

 

4.5、SQL查询面板

在Superset的SQL Lab中可以实现对已连接连数据源进行数据查询,同时也可对查询到的结果进行图表展示,

选择“Sources_Databases”进入数据库列表页,选中需要展示在SQL Lab中的数据库,点击编辑图标进入Edit Databases页,将“Expose in SQL Lab、Allow Run Sync”勾选上即可在SQL查询面板对数据库表进行查询,若想对库表进行创建、修改、删除等操作则需选择性的勾选“Allow CREATE TABLES或Allow DML”

 

选择“SQL Lab_SQL Editor”就可以进入SQL查询页面,在编辑区写好查询sql后点击“Run Query”即显示查询结果

 

针对查询到的sql结果,点击“Visualize”按钮,在弹出框设置好相应信息后点击弹出框中的“Visualize”按钮即可跳转至绘图页面,随后可基于查询出的数据进行可视化图表制作

 

4.6、dashboard实例介绍

4.6.1、疫情dashboard

2019年12月底在中国武汉发现了首例新冠肺炎,2020年2月中旬全球其它国家相继发现了新冠病例并且其数量呈爆发式增长,疫情dashboard是基于全球新冠疫情数据制作的(19年12月20日-20年7月31日),数据来源于github的一个爬虫项目,它会定期去抓丁香医生的疫情数据信息,包括各国各区域的新冠肺炎的确诊人数、治愈人数和死亡人数。疫情数据文件准备就绪后,按照“四步走步骤”即可制作疫情dashboard。

疫情dashboard包括以下7类图表:

词云图Word Cloud,直观展示各国确诊人数的多少情况

数值趋势图Big Number with Trendline,数值直接展示某个时间点的全球确诊、治愈及死亡总人数;同时附带趋势图,可查看各时间的疫情数值情况

分布柱形图Distribution-Bar Chart,详细展示某个时间点的各国确诊、治愈及死亡人数,可作横向国家疫情对比

时间线性趋势图Time Series-Line Chart,一图展示各时间点的各国确诊人数趋势情况,可做横向国家对比、纵向时间线对比;一图展示各时间点的中国确诊、治愈及死亡人数趋势情况

国家地图Country Map,展示某个时间点的中国各省的确诊人数情况

强度拉力图Directed Force Layout,展示某个时间点的中国各省各市的确诊人数情况,圆点代表省或市,圆点大小代表该省或市确诊人数的多少

太阳图Sunburst,该图包括两个层级维度,直观展示某个时间点的中国各省各市的确诊人数占比及数值情况下图为制作好的疫情dashboard:

 

4.6.2 企业客户dashboard

企业客户dashboard,主要展示各子公司的客户情况,包括:企业客户数、单一企业共同客户数、两家企业共同客户数和客户迁徙数,其分析数据为某企业的5个子企业的半年客户数据(20年6月-20年12月)。同样,数据准备就绪后,按照“四步走步骤”制作企业客户dashboard。

企业客户dashboard包括以下8类图表:

数值趋势图Big Number with Trendline,数值直接展示某个时间点的企业客户总数、单一企业共同客户总数及两家企业共同客户总数;同时附带趋势图,可查看各时间点的客户总数情况

双轴线图Dual Axis Line Chart,展示各时间点的企业客户总数及客户总数增量情况

饼图Pie Chart,展示某个时间点的各企业客户数及占比情况

气泡图Bubble Chart,展示某个时间点的各企业的客户数及其环比增量、环比增幅三者的关系,气泡大小表示各企业的客户数,X轴Y轴分别标识其环比增量和增幅

视图表Table View,直接罗列某时间点的各企业客户数情况,另外单元格内的进度条将数值情况更加直观化

时间线性趋势图Time Series-Line Chart,一图展示各时间点的各企业客户数趋势情况;一图展示各时间点的单一企业共同客户数趋势情况

透视表Pivot Table,一图展示某时间点的两家企业共同客户数情况;一图展示某时间点的企业间客户迁徙(迁入和迁出)情况

和弦图Chord Diagram,一图展示企业间的迁入客户情况;一图展示企业间的迁出客户情况下图为制作好的企业客户dashboard:

 

5、小结

Superset的优点有很多,当然Superset也有不足如:不支持图表的下钻功能、不支持多图表间的复杂联动、处理大数据集效率较低等等。针对其不足,一方面看Airbnb后续是否会优化,另一方面也可以对它进行二次开发。但是Superset只是一款轻量级的BI应用,复杂的数据关联可以在ETL过程中完成,而Superset读取最终的结果表,另外它完全可以支撑起TB级的数据源读取。总而言之,对于个人开发者和中小型团队来说,若要选择一个无软件成本且方便高效的自助式数据分析工具,Superset是个不错的选择。

转自:百度安全验证

顺其自然~
关注 关注
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
【学习笔记】可视化工具Superset
prague6695的博客
04-27 2490
可视化工具Superset第1章 Superset入门1.1 Superset概述1.2 Superset应用场景第2章 Superset安装及使用2.1 安装Python环境2.1.1 安装Miniconda2.1.2 创建Python3.7环境2.2 Superset部署2.2.1 安装依赖2.2.2 安装Superset2.2.3 启动Supterset2.2.4 superset启停脚本第3章 Superset使用3.1 对接MySQL数据源3.1.1 安装依赖3.1.2 重启Superset3
主流开源 BI 产品对比---------2020开源BI工具都有哪些,哪个好用
热门推荐
terry_chengq的博客
10-19 1万+
现在市场上开源 BI 产品比较多,各个产品的侧重点不同,有的以报表为主、有的以可视化为主、有的以查询分析为主。这里我们选取了一些主流的开源 BI 产品,从产品功能、可视化能力、数据源支持以及使用文档等方面进行对比,希望对你有帮助。 Superset 由Airbnb贡献的轻量级BI产品,目前在GitHub上有3万多颗星,其受欢迎程度可见一斑。Superset提供了Dashboard和多维分析两大类功能,后者可以将制作的结果发布到Dashboard上也可以单独使用。 数据源方面,Superset支持C
开源免费的中文BI工具
05-21
MOLAP已成为中小企业管理决策的首选工具软件,与excel结合使用大大节省企业在IT方面的投入,而且简单易学,容易在公司内普及。 如对软件感兴趣,欢迎与我联系。 邮件:wormbus#163.com (请把#换成@)
零门槛!人人可用的开源 BI 工具
最新发布
weixin_43400476的博客
09-05 1745
DataEase —— 开源数据可视化分析工具,支持丰富的数据源连接,能够通过拖拉拽方式快速制作图表,并可以方便的与他人分享。
【转帖】四种BI 开源工具介绍-SpagoBI,openI,JasperSoft,Pentaho
weixin_34381687的博客
06-02 1038
四种BI 开源工具介绍-SpagoBI,openI,JasperSoft,Pentaho 1 BI系统的简述 从技术角度来说 BI 包含了 ETL、DW、OLAP、DM等多环节。简单的说就是把交易系统已经发生过的数据,通过ETL工具抽取到主题明确的数据仓库中,OLAP后生成Cube或报表,透过Portal展现给用户,用户 利用这些经过分类、聚集、描述和可视化的数据,支持业务决策...
开源BI系统简述(转载)
csy542339419的博客
12-20 208
文章来源:JavaEye 本文介绍了ETL工具、报表工具、OLAP工具的各项开源资源情况,有一定的普及和参考价值。这些众多的BI项目从规模和对BI系统支撑的完善程度上来说,大体可以分为Framework、Stand-alo...
开源BI系统简述
weixin_33712987的博客
09-26 173
开源BI系统简述   1.   概述 开源BI项目在在2005年之前并没有太大的发展,到了2005年才开始呈现繁荣之势,并在2006年蓬勃发展。这些众多的BI项目从规模和对BI系统支撑的完善程度上来说,大体可以分为Framework、Stand-alone Tools和BI Suit三种类型。 l         Framework 开源框架,这是在商业BI系统中所没有的。我们可以使用...
开源BI工具 - Superset
jayxiaoxionger的博客
11-07 764
开源BI工具superset
三大开源bi工具_Superset,基于web的开源BI工具,github三万star
weixin_39702316的博客
10-24 3973
BI工具是数据分析的得力武器,目前市场上有很多BI软件,众所周知的有Tableau、PowerBI、Qlikview、帆软等,其中大部分是收费软件或者部分功能收费。这些工具一通百通,用好一个就够了,重要的是分析思维。我一直用的Tableau,不过实在太贵,一年小一万。之前在github接触到一个基于浏览器的开源BI应用,名叫Superset,是Airbnb团队开发的。于是想试下,在安装配置阶段用了...
数据可视化】三款主流开源数据可视化工具对比:Superset、DataEase、MetaBase
菜鸟叔叔的博客
06-16 1万+
现在市场上开源 BI 产品比较多,各个产品的侧重点不同,有的以报表为主、有的以可视化为主、有的以查询分析为主。这里我们选取了一些主流的开源 BI 产品,从产品功能、可视化能力、数据源支持以及使用文档等方面进行对比,希望对你有帮助。由Airbnb贡献的轻量级BI产品,目前在GitHub上有3万多颗星,其受欢迎程度可见一斑。Superset提供了Dashboard和多维分析两大类功能,后者可以将制作的结果发布到Dashboard上也可以单独使用。在这里插入图片描述数据源方面,Superset支持CSV、MySQ
数据仓库之电商数仓-- 4、可视化报表Superset
FunnyPrince_的博客
10-26 1038
目录一、Superset入门1.1 Superset概述1.2 Superset应用场景二、Superset安装及使用2.1 安装Python环境2.1.1 安装Miniconda2.1.2 创建Python3.7环境2.2 Superset部署 一、Superset入门 1.1 Superset概述 Apache Superset是一个开源的、现代的、轻量级BI分析工具,能够对接多种数据源、拥有丰富的图表展示形式、支持自定义仪表盘,且拥有友好的用户界面,十分易用。 1.2 Superset应用场景 由于S
metabase,一款开源BI分析工具
05-24
metabase,一款开源BI分析工具
Superset【部署 01】在线安装数据可视化图表工具 Superset(Python虚拟环境部署+问题解决+WEB登录配置+官方图表展示)
シ風
09-28 1464
Superset【部署 01】在线安装数据可视化图表工具 Superset(Python虚拟环境部署+问题解决+WEB登录配置+官方图表展示)20220429更新
有哪些开源BI 工具
cainiao_M的博客
06-15 2888
开源软件目前还是国外工具比较多,比如现在比较常用的 Pentaho、Superset、Jaspersoft、Spagobi、Poli 等,这里简单总结下他们的优缺点。 优点:开源软件,给开发者带来很大便利。 做为前端数据分析工具来说,功能比较丰富,页面效果不错。 开源工具工具成本低。 缺点:产品文档比较少,国外软件汉化不完全,支持不到位,很少有专业的支持人员,有问题一般都是在论坛上发帖解决,如果有底层核心需求或者 bug 基本没办法解决。 BI 产品侧重于数据的多维度分析,但是在处理国内的复杂报
Superset
ContactWei的博客
06-21 346
This project was originally named Panoramix, was renamed to Caravel in March 2016, and is currently named Superset as of November 2016ImportantDisclaimer: Apache Superset is an effort undergoing incub...
Superset,基于浏览器的开源BI工具
分享Python、数据分析、人工智能前沿知识
05-19 561
BI工具是数据分析的得力武器,目前市场上有很多BI软件,众所周知的有Tableau、PowerBI、Qlikview、帆软等,其中大部分是收费软件或者部分功能收费。这些工具一通百通,用好一个就够了,重要的是分析思维。相比较集成好的软件,Superset是有些使用门槛的,对新手没那么友好,不过它免费呀,免费真香。Superset安装的python依赖库比较多,建议先安装Anaconda,避免不必要的麻烦。有一个亮点,Superset支持sql查询,这太方便了,Tableau似乎不可以。
开源可视化bi工具有哪些,干货推荐
hualalalalali的博客
07-18 6520
主打自助分析,主要针对业务人员使用,让业务人员直接进行可视化分析克服现阶段各行各业在使用数据进行查询分析基本都是通过前端业务人员需要与信息部IT人员沟通导致的沟通成本大,灵活性差,不能及时响应的弊端。支持复杂的权限管理,一键实现数据共享与管控,细致精准的数据权限管控,数据和报告可在全公司内分享,分享结果实时更新。工具,这几个开源可视化bi工具都是非常合适的,像finebi是提供个人版免费使用的,大家可以积极使用看看。图表可视化选项少,例如,数据格式选项偏少,如需添加,需要修改配置文件。...
写文章

热门文章

  • Telnet详解及命令使用 211621
  • 什么是汇编语言 129008
  • 4款最好用的虚拟机软件简介及对比 123515
  • Java Bean详解 103902
  • netstat查看端口状态 96830

最新评论

  • electron打包:electron-packager及electron-builder两种方式实现(for Windows)

    Yokeiz: 为什么我会报错ENOENT: no such file or directory, rename 'C:\Users\EDY\Desktop\electron\OpenFunds-Trade\app\win-unpacked\electron.exe呢

  • 在windows系统使用3proxy安装socks5代理服务

    冬天的爱人是雪花: win10 双击就闪退表情包

  • 5G网络架构(接入网,传输网,核心网)

    远书☆: 很少评论,太厉害了

  • 国内主流高端核心交换机

    2401_87313253: 文章结尾,说你们懂得。 谁能解释一下?

  • 卷积神经网络(CNN)

    顺其自然~: 多看几遍就好了

大家在看

  • 酒吧收银系统解决方案——未来之窗行业应用跨平台架构 528
  • 足浴店+闸机+智能衣柜+门票系统一体化管理系统解决方案——未来之窗行业应用跨平台架构 319

最新文章

  • ISV介绍
  • 如何让 ChatGPT(LLMs) 学习更多的私有数据知识
  • RAG 为什么需要文本分割(Chunking)
2024
10月 25篇
09月 57篇
08月 47篇
07月 77篇
06月 41篇
05月 15篇
04月 32篇
03月 53篇
02月 12篇
01月 74篇
2023年1005篇
2022年501篇
2021年317篇
2020年328篇
2019年101篇
2018年164篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家湛江市玻璃钢雕塑制作玻璃钢酒店人物雕塑报价杭州玻璃钢人物雕塑优惠廊坊玻璃钢卡通雕塑价格淮阴玻璃钢花盆花器绍兴玻璃钢雕塑摆件价钱济源镜面玻璃钢仿铜雕塑厂家河北抽象玻璃钢雕塑设计凤泉玻璃钢雕塑设计长沙户内玻璃钢雕塑销售厂家南京抽象玻璃钢雕塑定做价格昆明仿铜玻璃钢雕塑价格合肥景区玻璃钢雕塑供应商玻璃钢雕塑人物设计公司贵州商场美陈布展北京景区玻璃钢雕塑公司唐山玻璃钢卡通雕塑玻璃钢陶瓷雕塑企业内蒙玻璃钢雕塑定制厂家金华特色玻璃钢雕塑市场商场玻璃钢花盆市场东营玻璃钢雕塑制作洛阳做玻璃钢花盆玻璃钢人物铜雕塑常州球形玻璃钢花盆女人玻璃钢雕塑镂空校园玻璃钢雕塑定做厂家上海广场玻璃钢雕塑价格福建节庆商场美陈供应商玻璃钢雕塑保护方法香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化