【大数据】可视化仪表板 - Superset的安装和使用

47 篇文章 17 订阅
订阅专栏
3 篇文章 0 订阅
订阅专栏
本文介绍了ApacheSuperset,一个用于数据探索和可视化的平台,支持多种数据库和大数据组件。详细阐述了在Ubuntu环境下安装Superset的步骤,包括前置环境、安装配置、启动访问,以及如何配置PostgreSQL、MySQL和Hive等数据源。此外,文章还强调了软件的特点,如丰富的可视化组件、SQLLab和数据权限管理功能。
摘要由CSDN通过智能技术生成

写在前面:博主是一只经过实战开发历练后投身培训事业的“小山猪”,昵称取自动画片《狮子王》中的“彭彭”,总是以乐观、积极的心态对待周边的事物。本人的技术路线从Java全栈工程师一路奔向大数据开发、数据挖掘领域,如今终有小成,愿将昔日所获与大家交流一二,希望对学习路上的你有所助益。同时,博主也想通过此次尝试打造一个完善的技术图书馆,任何与文章技术点有关的异常、错误、注意事项均会在末尾列出,欢迎大家通过各种方式提供素材。

  • 对于文章中出现的任何错误请大家批评指出,一定及时修改。
  • 有任何想要讨论和学习的问题可联系我:zhuyc@vip.163.com。
  • 发布文章的风格因专栏而异,均自成体系,不足之处请大家指正。

可视化仪表板 - Superset的安装和使用

本文关键字:superset、可视化、Ubuntu、安装

文章目录

  • 可视化仪表板 - Superset的安装和使用
    • 一、Superset简介
      • 1. 软件作用
      • 2. 软件特点
    • 二、Superset安装
      • 1. 前置环境
      • 2. 安装配置
      • 3. 启动访问
    • 三、数据源配置
      • 1. PostgreSQL
      • 2. MySQL
      • 3. Hive
      • 4. 其它说明

一、Superset简介

Apache Superset是一个现代化的、企业级的数据探索和可视化平台,旨在帮助数据工程师和科学家在Web界面上创建和共享各种类型的数据洞察。

1. 软件作用

Apache Superset 的底层是一个 Flask 应用程序,其核心功能包括数据可视化、仪表板制作、数据切片和切块、以及 SQL Lab。在 Superset 的应用结构中,Flask 应用程序处理路由、视图函数和模板渲染,而 SQLAlchemy 提供了对多种数据库的抽象访问。
Apache Superset 支持多种数据源,可以连接到任何 SQL-speaking 数据库或数据引擎(如 MySQL、Postgres、BigQuery、Redshift 等),同时也支持各种 大数据组件 如 Hive、Presto、Druid 等,只需要安装部分组件即可。

2. 软件特点

  • 具有丰富的数据可视化组件库,提供了多种图表类型,可以满足各种数据展示需求
  • 使用SQL Lab可以直接执行SQL查询,方便快捷
  • 采用响应式设计,对移动设备友好
  • 具有强大的数据权限管理功能,可以精细控制每个用户的数据访问权限

二、Superset安装

1. 前置环境

软件需要运行在Python 3.6及以上版本,推荐使用虚拟环境,官方给出的安装步骤: https://superset.apache.org/docs/installation/installing-superset-from-scratch/。

  • virtualenv安装:pip install virtualenv
  • 创建虚拟环境:python3 -m venv superset
  • 激活虚拟环境:. superset/bin/activate
  • 前置环境安装

开始安装前,需要确保系统环境以及python虚拟环境已经安装了以下内容:

sudo apt-get update
sudo apt-get install build-essential
sudo apt-get install python3-dev

pip install wheel

2. 安装配置

  • 安装superset:pip install apache-superset

  • 前置设定
# 推荐添加到环境变量配置文件中
export FLASK_APP=superset
superset fab create-admin


此时会遇到一个警告,我可以可以按照如下步骤来解决:

touch superset_config.py

# 推荐添加到环境变量配置文件中
export SUPERSET_CONFIG_PATH=/home/hadoop/superset/superset_config.py
superset fab create-admin

配置SUPERSET_CONFIG_PATH的路径,指向刚刚创建的config文件,完成后再次进行启动。

  • 报错解决

笔者在执行命令的过程中出现如下报错:

这是由于 sqlparse 不兼容导致的,默认安装了0.4.4,可以通过以下命令确认版本:

pip show sqlparse

此时需要降级到0.4.3,这是由于我目前安装的superset限制版本区间最低为0.4.3,如果大家选择了其它的版本请根据实际情况处理:

pip uninstall sqlparse
pip install sqlparse==0.4.3

3. 启动访问

前面的初始化步骤完成后可以导入一些样例数据,然后进行启动,在执行所有操作前需要先进行初始化。

  • 导入样例数据
# 初始化命令
superset db upgrade
# 加载数据,耗时较长
superset load_examples
  • superset构建

首先需要下载前端项目的源代码,然后确保系统已经安装了Node环境。小编当前使用的版本要求node 16.9.1以上,npm 7.5.4 || 8.1.2 以上,这里以安装node 16.x为例。

git clone https://github.com/apache/superset.git


强烈提醒:请保证NodeJS的大版本一致,否则需要自己想办法解决各种构建问题。如果遇到RpcIpcMessagePortClosedError错误,一般为内存不足导致,请尝试增加内存。

# 安装构建所需环境
sudo apt  install curl
curl -fsSL https://deb.nodesource.com/setup_16.x | sudo -E bash -
sudo apt-get install -y nodejs
sudo npm install -g npm@latest
sudo npm install -g node-gyp
# ARM架构需要手动安装chromium-browser
sudo apt install chromium-browser
# 构建前端项目
npm ci
# 预先解决一些构建中遇到的问题
npx update-browserslist-db@latest
# 该步骤耗时较长 - 需要保证可用内存在4GB以上
npm run build
  • superset启动
# 切换到superset-frontend的上一级目录
cd ..
superset run -p 8088 --with-threads --reload --debugger

  • superset访问

启动后,在浏览器访问8088端口即可,使用此前初始化是设定的密码进行登录:

可以查看到,已经显示了此前导入过的样例:

三、数据源配置

在操作界面右上角,支持多种数据源添加方式,本文将介绍数据库连接方式。

1. PostgreSQL

  • 依赖安装

在连接PostgreSQL时,需要在项目启动之前,先安装相关依赖。激活superset虚拟环境后执行如下命令:

pip install psycopg2-binary
  • 连接配置

在配置界面,默认支持PostgreSQL和SQLite两种直接导入方式:

选择PostgreSQL进入配置界面:

连接成功后,可以开始创建DATASET,或者也可以使用:

点击FINISH后,再次点击右上角的➕,此时Data选单下出现Create dataset

2. MySQL

当已经添加了一个数据库连接后,想要再次添加另外的数据源,可以按照如下步骤操作:

然后在操作界面中可以再次看到添加DATABASE的按钮,如图:

  • 依赖安装

在连接MySQL时,需要在项目启动之前,先安装相关依赖。激活superset虚拟环境后执行如下命令:

sudo apt-get install libmysqlclient-dev
pip install mysqlclient
  • 连接配置

在配置界面,选择Other,通过连接字符串来直接配置:

连接字符串为SQLAlchemy URI格式 -> mysql://username:password@hostname:port/database

3. Hive

  • 依赖安装

在连接Hive时,需要在项目启动之前,先安装相关依赖。激活superset虚拟环境后执行如下命令:

pip install PyMySQL
pip install pyhive
pip install thrift
sudo apt-get install python-dev libsasl2-dev
pip install sasl
pip install thrift_sasl

连接前确保Hive相关服务已经启动,具体步骤可以参考: Hive 3.x的安装部署 - Ubuntu

  • 连接配置

在配置界面,选择Other,通过连接字符串来直接配置:

连接字符串为SQLAlchemy URI格式 -> hive://username:password@hostname:port/database

在连接测试通过后,点击CONNECT按钮可能会出现一个无法连接的异常,但是小编实际测试后发现并没有任何影响。此时连接已经成功创建,我们只要将弹窗关闭,然后刷新页面即可,后续的使用也一切正常。

4. 其它说明

当我们不断的向superset的虚拟环境添加各种连接所需的依赖,并且创建相应类型的连接后,操作界面就会变得越来越丰富:

当我们需要的数据源类型基本稳定后,就可以将superset进程挂在后台运行了,这样我们可以专注于可视化的工作:

# 进入到对应目录后执行
nohup superset run -p 8088 --with-threads --reload --debugger &

扫描下方二维码,加入CSDN官方粉丝微信群,可以与我直接交流,还有更多福利哦~
在这里插入图片描述

博客
ChatGPT到底是个啥 - 它甚至会和狗说话
02-13 3万+
本文关键字:技术前沿、行业热点、ChatGPT、OpenAI、人工智能。本文并非标题党,与狗对话是一个很有意思的使用案例,会在后文中揭示。最近ChatGPT可以说是火爆出圈了,和身边的人聊起这个话题都会饶有兴趣的和你说上几句。但是看了国内一些评论和弹幕,对它的了解可谓参差不齐,所以想来还是写一篇文章来和大家一起交流。
博客
三入职场 - 你可以从我身上学到这些(附毕业Vlog)
06-24 1万+
本文关键字:毕业季、职场、学习、IT、Vlog。这不是一篇标题党的文章,而是博主自身三次从学校踏入职场的亲身经历和心境变化。希望用自己的故事将学习、工作、生活三个方面融合在一起,为大家带去一点方向。.....................
博客
英特尔oneAPI人工智能黑客松 - 活动又来啦
03-17 1253
本文关键字:英特尔、oneAPI、人工智能、机器视觉。活动主办方提供了源码案例以及公开课视频教程,并且整体的实现流程也描述的十分清楚,可以方便大家快速上手。笔者虽然一直在人工智能领域工作,但是在机器视觉方面还是接触的比较少,但是查看了相关资料后也能在比较短的时间内实现自己的构想,并且感觉自己也get了新技能,不得不由衷点个赞!
博客
【亚马逊云科技】自家的AI助手 - Amazon Q
01-04 6675
本文关键字:亚马逊、Amazon、AI、Amazon Q、人工智能。在企业场景中,Amazon Q是第一个基于云资产的AI助手,可以在安全环境下帮助管理云服务、错误排查、辅助开发等等。并且,可以将Amazon Q以应用的形式独立发布和部署,供公司内部使用,整合内部数据存储库,不仅可以自主学习还可以帮助公司人员快速了解业务以及辅助决策。
博客
亚马逊云科技 re:Invent 大会 - ElastiCache Serverless模式来袭
12-15 1万+
回顾最近十年,科技领域的发展逐渐迅猛,技术的更替以及开发模式的变更都越来越快,尽早的了解科技的发展方向是尤为重要的。2023年的 re:Invent 大会上,一口气发布了十余款核心产品的重磅更新,其中包括AI、芯片、对象存储、Serverless、ETL等等。本篇文章就主要来说说工作中常用的 Amazon ElastiCache 数据缓存服务。
博客
亚马逊云科技 re:Invent 大会 - S3 对象存储华丽升级
12-15 1万+
回顾最近十年,科技领域的发展逐渐迅猛,技术的更替以及开发模式的变更都越来越快,尽早的了解科技的发展方向是尤为重要的。2023年的 re:Invent 大会上,一口气发布了十余款核心产品的重磅更新,其中包括AI、芯片、对象存储、Serverless、ETL等等。本篇文章就主要来说说一直在用的 Amazon S3 对象存储。
博客
【亚马逊云科技】使用Amazon Lightsail快速建站
11-15 5027
本文关键字:亚马逊云科技、Amazon Lightsail、快速建站。对于新用户来说,Amazon Lightsail同样支持免费试用,时常是3个月,毕竟相比于EC2性能和功能方面都有所提升,使用不错的话确实可以考虑付费。
博客
【阿里云】函数计算 X 通义千问快速部署
11-12 804
本文关键字:阿里云、函数计算、通义千问、社区活动、快速部署。用户可以根据需要选择不同角色的AI助手开启写作,角色包括职业顾问、小红书写手、心灵导师等,你可以尽情发挥创造力,通过限制提示词、字数、情节等各种条件生成短篇小说。
博客
【DevChat】智能编程助手 - 使用评测
10-30 1585
本文关键字:DevChat、大模型、智能助手、VS插件。DevChat是一款可以直接在VSCode中使用的插件,并且第一次注册还有免费使用额度,重要的是支持GPT-4。
博客
【腾讯云TDSQL-C Serverless产品体验】与云函数一起来一次无服务器体验
10-24 6052
本文关键字:腾讯云、云原生、云数据库、Serverless、云函数。云原生的概念已经出现好一阵了,各大云服务厂商都在争相打磨自己的相关产品,无论是云数据库还是云函数或是其它的功能性产品都在努力的做到Serverless。这样既方便管理,也能节约成本,同时还能提升效率,作为开发者还是有必要了解一下。
博客
我的创作纪念日 - 第四年
10-24 290
不知不觉已经过去了四年了,虽然很早就在CSDN查阅资料,但是真正落笔创作是在4年前。
博客
React项目部署 - Nginx配置
10-06 3497
本文关键字:React、打包、部署、Nginx、配置。本文将介绍React项目部署访问的流程,使用Nginx方式,并列出一些可能会遇到的问题,以Ubuntu系统为例。
博客
【腾讯云】打造未来智能应用的基石:腾讯混元大模型
09-22 1万+
本文关键字:腾讯云、大模型、AIGC、API调用、使用体验。大模型基于深度学习的神经网络技术,通过在大量的文本数据上进行训练而生成的模型。这种模型通常具有数十亿甚至数千亿的参数,可以理解和生成人类语言,用于各种自然语言处理和理解任务,包括但不限于文本分类、情感分析、机器翻译和问答系统。通过持续学习和微调,大模型可以理解和产生越来越高质量的文本,满足各种复杂的语言处理需求。
博客
英特尔oneAPI人工智能黑客松 - 坚果识别实战
08-27 568
本文关键字:英特尔、oneAPI、人工智能、机器视觉。活动主办方提供了源码案例以及公开课视频教程,并且整体的实现流程也描述的十分清楚,可以方便大家快速上手。笔者虽然一直在人工智能领域工作,但是在机器视觉方面还是接触的比较少,但是查看了相关资料后也能在比较短的时间内实现自己的构想,并且感觉自己也get了新技能,不得不由衷点个赞!
博客
【腾讯云 Cloud Studio 实战训练营】一个新的趋势已来
08-10 5796
本文关键字:腾讯云、云IDE、Cloud Studio、数据可视化。其实云IDE并不是最近才有的,最早可以追溯到很多年前,当时就已经有了项目管理以及自动化部署的工具,而云IDE本身的意义也不仅仅是将本地的编译器移动到了网页上。对于初学者而言,他们的起跑线已经不一样了,学习门槛也不一样了,感觉马上就要受到后浪又一轮的鞭挞了,好在对于开发者来说只要有意的去学习和留意,是很容易掌握的,而且并没有太多的学习成本。
博客
React本地测试 - 解决跨域问题
07-19 691
本文关键字:React、测试、跨域。一般对于跨域问题的解决都是在服务端添加相应的配置,这里将介绍如何在React项目中单独解决跨域问题。
博客
我在阴影之中 - InsCode Stable Diffusion 美图活动一期
07-13 661
InsCode是一个集成了在线IDE、在线AI编程、在线算力租赁、在线项目部署以及在线SD 模型使用的综合代码开发平台。不论你是初级软件工程师,还是AI大模型爱好者,InsCode都能帮助你快速编写代码,运行项目。甚至在这里你还可以一键购买算力,训练大模型,开发自己的AI应用程序。
博客
M芯片Mac实现安卓模拟器多开
07-12 8645
本文关键字:M芯片、Mac、Android、模拟器、多开。在使用M1芯片的Mac本之前,可以在苹果系统上运行的安卓模拟器有夜神、MuMu、BlueStacks,对于Intel的x86而言,基本上Windows上能使用的主流安卓模拟器,Mac上都能够运行。但是对于Arm架构的M芯片系列,以上提到的几款模拟器都不支持。目前只找到了两款可用,并且也都支持多开。
博客
PS解决取色器不能粘贴颜色码(重置取色器)
06-30 990
本文关键字:PhotoShop、软件问题、取色器、重置。有时打开PS软件,然后直接打开一个图片或者拖拽进一个图片的时候,会更改一些设置。如果图片是32位的,那么拾色器就会产生变化了。
博客
【Spark】一个例子带你了解Spark运算流程
06-30 696
本文关键字:大数据、Spark、算子、WordCount。Spark的运算机制非常值得深入学习,这里只借助简单例子稍微的扩展一下。Spark的所有基于RDD的方法调用都可以看作一个个算子,因为Spark是基于Scala开发的,当我们使用Scala语言进行程序开发时更能深刻到这一点。也就是我们基本上从一个集合开始,用一连串的方法调用就可以得到最终想要的结果,这也与Spark的延迟计算机制有关。
写文章

热门文章

  • 初次上路如何提问 - 自学必备技能(附直播回放) 78434
  • 从开发角度看羊了个羊 57237
  • ChatGPT到底是个啥 - 它甚至会和狗说话 37341
  • 大数据到底应该如何学? 25518
  • 数据迁移的几种方式 - MySQL数据库 24460

分类专栏

  • 经典算法 付费 9篇
  • 萌新科普 49篇
  • 名词扫盲 7篇
  • 环境搭建 25篇
  • 一应俱全 18篇
  • 学习路上 47篇
  • 微信小程序 2篇
  • Linux基础 5篇
  • CentOS 8篇
  • Java基础 14篇
  • 数据库 7篇
  • MySQL 4篇
  • Hadoop 1篇
  • Hive 1篇
  • Spark 1篇
  • 大数据组件 3篇
  • 手撕算法 2篇
  • 恶补高数 1篇
  • 数据结构 1篇
  • 沙场点兵 2篇
  • 大数据场景 2篇
  • 磨炼升华 13篇
  • 有此一问 5篇
  • 填坑攻略 6篇
  • 面试宝录 2篇
  • 听风随笔 23篇
  • 程序人生 9篇
  • 行业动向 6篇
  • 技术杂谈 8篇
  • 征文联动 38篇
  • 官方活动 20篇
  • 腾讯云 11篇
  • 阿里云 1篇
  • 亚马逊云 4篇
  • 产品评测 6篇

最新评论

  • 【限时】21天学习挑战赛 - 经典算法

    一头小山猪: 这个活动已经结束了呢,感谢小伙伴关注,可以加一下结尾QQ群一起学习哈

  • 【零代码】那些简单好用的零代码平台

    前端零代码: 个人比较喜欢用这款新开源的这个uiotos工具,页面嵌套、逻辑连线。 文档地址:https://www.yuque.com/liuhuo-nc809/uiotos?# 《UIOTOS 帮助手册》

  • Apple芯片Mac安装ARM版Win10完美教程(结尾附视频)

    2401_86449769: win10系统里的用户账户控制为了对电脑进行(保护,已经阳止此应用。管理员已阻止你运行此应用。有关详细信息,请与管理员联系。mmc.exe。是不是内部版本缺陷,处理不了

  • 【限时】21天学习挑战赛 - 经典算法

    2402_83690813: 博主,咱的21天学习群在哪呀

  • Apple芯片Mac安装ARM版Win10完美教程(结尾附视频)

    m0_74031953: 已成功,多谢🙏,自己搞了一下午,之前就看别人win10直接自动装好,自己老是刚开始装就蓝屏

最新文章

  • 英特尔oneAPI人工智能黑客松 - 活动又来啦
  • 【亚马逊云科技】自家的AI助手 - Amazon Q
  • 亚马逊云科技 re:Invent 大会 - ElastiCache Serverless模式来袭
2024年2篇
2023年39篇
2022年39篇
2021年31篇
2020年50篇
2019年24篇

目录

目录

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家定做蓝色玻璃钢花盆济源玻璃钢花盆花器石首玻璃钢浮雕人物山水雕塑河源自发光动物玻璃钢雕塑供应商泉州玻璃钢园林雕塑澄海玻璃钢花盆花器许昌人物玻璃钢雕塑泡沫玻璃钢人物雕塑制造辽阳卡通玻璃钢雕塑生产厂家济宁欧式玻璃钢雕塑邯郸玻璃钢雕塑厂家玻璃钢树脂雕塑制作玻璃钢雕塑 租用 报价柳州玻璃钢泡沫雕塑公司枣庄玻璃钢雕塑玻璃钢花盆种植运城玻璃钢广场雕塑厂家常见商场美陈报价汕尾玻璃钢人像雕塑新密玻璃钢动物雕塑张家口玻璃钢雕塑设计深圳弧形玻璃钢花盆南昌水果玻璃钢雕塑制作玻璃钢雕塑适用于什么商丘玻璃钢卡通雕塑定做价格江苏专业玻璃钢雕塑哪家好深圳多边形玻璃钢花盆浙江秋季商场美陈销售厂家广州南沙玻璃钢雕塑厂浙江玻璃钢卡通雕塑厂家香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化