利用大数据分析工具,实现多场景可视化数据管理

这篇具有很好参考价值的文章主要介绍了利用大数据分析工具,实现多场景可视化数据管理。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

官方使用文档

https://yanhuang.yuque.com/staff-sbytbc/rb5rur?

准备服务器环境

购买服务器

购买腾讯云服务器,1300 元新人价,一年时间

●4核16G内存

●CentOS 6.7

(补充说明:最新的 2.7.1 GA 版本,8G 内存也是可以跑的,可以先使用8G,不够再做升级)。

安装docker环境

安装docker,速度还挺快的,大概3~5分钟内

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

下载鸿鹄体验版本安装包

1、注册鸿鹄账号,获取下载地址

●https://www.yanhuangdata.com/auth/register?redirect_url=%2Fapi%2Fproducts%2Fhonghu%2F2.7.0%2Fdownload%3Fos%3Dlinux

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

注册完成点击首页的【免费社区版】

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

点击下载安装包即可。

安装鸿鹄

上传压缩包

现将安装包上传到服务器,scp或者ftp都可以,这里用scp(好像不需要端口)

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

Tips:如果遇到Permission denied的情形,登录服务器,开启root权限,编辑文件 /etc/ssh/sshd_config

去掉#

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

安装

官方教程比较详细,参考操作即可:https://yanhuang.yuque.com/staff-sbytbc/rb5rur/auwfm3?#EveRG

将鸿鹄安装包解压缩到 /opt 目录。解压完成之后,所有的鸿鹄相关文件位于 /opt/honghu目录下。

后续文档中,以HONGHU_HOME指代鸿鹄的安装目录。在上面的例子中,HONGHU_HOME 就是 /opt/honghu目录。

启动

问题:如果遇到 “Resource exhausted on 1 nodes”错误,可以考虑重启docker daemon解决

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

重启 docker daemon,重新启动鸿鹄,解决了问题。

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

成功

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

这个密码可以在登录后的账号管理中去修改,如下图

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

登录

输入控制台安装完成后的提示的用户名、密码就可以登录了。

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

示例体验

版本2.7.1之后,鸿鹄新增了【主应用】->【Yanhuang Product Showroom】

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

场景一:shopify后台登录日志记录,进行可视化查询管理和报警

需求痛点

目前的 shopify 用户操作日志记录很不直观,只有一行行记录,很难查,需要主屏不断拉取加载才行。而且信息不结构化,看不出有效信息。当遇到某个出错问题时,想去查询相关的操作记录,很难定位。

目标

●结构化信息,方便搜索查询

●定义某类异常操作,进行报警

●统计各用户使用频率,输出数据报表

导入数据

第一步:上传文件

当前用的是 csv 格式文件的数据,直接导入

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

第二步:预览数据,有1000条数据

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

【小提示】

点击另存为,可以为 shopifiy 数据新建一个数据源类型。

点击【另存为】

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

第三步:导入数据

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

导入完成

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

查询数据

导入后,查看数据,默认显示如下视图

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

sql的查询语句如下:

收藏查询语句

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

下次进入的时候可以直接在右边点击【展开】,再点击【已收藏查询】,查看收藏过的查询语句列表,并加载。这样复杂的查询语句,就不用每次去手写了,一键即可加载。

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

重新筛选需要的字段

点击【显示字段栏】

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

默认会罗列出原始数据,并帮助组织字段

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

以上内容是原始数据,但对我来说还是混乱的。我比较关心三个内容:谁、在哪天、干了什么。

在查询结果左边栏的【已选字段】和【剩余字段】,是鸿鹄自动处理,帮助筛选的,我们可以点击对应字段的名字,会有鸿鹄抽取出来的该字段对应的具体数据条目内容,来帮助我们确认应该保留哪些字段。

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

根据自己的需求,确认了如下字段

●操作者:author

●操作内容:description

●时间:created_at

点击【查看详情】

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

选择刚才确认的字段,并保存。

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

新建展示图表

以成员的操作频率对比图为示例

点击字段,选中author,我们想用弹窗中的数值来构建图表

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

在顶部的查询框中录入如下查询:

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

得到结果如下

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

点击【新建图表】,选中【柱状图】,在右边的属性配置栏稍微调整下显示,顺利拿到图表。发现对系统更改最多的是【Upsell】这个角色,很直观!

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

导出查询结果

对于查询的表格结果,也可以过滤不想要的字段后,导出为新表格,这个功能可以用于额外的数据处理

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

<a href="" https

<a href="" https导出后的结果为 csv,如下

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

自定义内容抽取功能体验

针对一段系统没有解析好的日志文本,我们可以用鸿鹄自己去定义解析字段。点击字段最下方的【抽取新字段】可以进行操作

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

进入抽取新字段页面后,例如下面这个_message字段,我想把里面的内容拆的更结构化。

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

选取的是【正则抽取】,方法是对于原始文本,鼠标选中认为是一个字段的字符串,选中后,会有一个弹窗,对这个字段进行命名。

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

拆完以后,得到的数据如下图,下面的【字段抽取预览】可以比较方便的实时看到拆完后的结果。

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

继续下一步

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

完成!

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

点击【查询刚才创建的字段】,回到查询数据界面,我们在左侧可以看到刚刚自定义的一系列字段,这些新字段,可以按照上面的步骤,继续去创建图标,或者导出为表格内容。不得不说,鸿鹄在抽象杂乱文本的,结构化建模相当高效!

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

新建查询图表

这次的日志场景,我比较关心的核心内容为:谁、在哪天、干了什么。

怎么才能快速的基于鸿鹄建立可查询的内容?例如下面的形式:

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

这次的 shopify 后台登录日志里的场景就是:

1、大量日志数据经过鸿鹄读时建模处理成可抽取字段的结构化数据。

2、筛选需要的字段,author、description、created_at,生成表格。

3、基于表格,我们可以快速筛选具体某一天的操作日志,用于排查当天发生的操作行为,辅助营销动作定位问题。

【建议点】

目前鸿鹄图表,暂时还不支持这种表格查询的生成,由于我们的日志量比较大,可能一段时间能累积 > 5000条,逐行去翻阅会比较困难,基于鸿鹄的读时建模,快速筛选有效字段,并组织成可查询的表格,对于混乱数据的有序定位,是比较好的一个功能。

不过如果数据量不大,SQL查询,过滤数据之后,再把结果集保存成一个Table,加入到仪表板是可以满足这个需求的。

场景二:生成 API 功能

场景描述:由于个人经常在做一些查询类的小工具,例如【深圳二手房指导价】,甚至是之前炎凰有演示过的全国疫情数据地图,这些数据通常有如下这些文件形式:

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

我之前的操作步骤是

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

这其中,【人工清理处理数据】、【定义字段录入数据库】、【开发api接口】可以说是最核心也是费时间的大头。

了解鸿鹄以后,我发现基于鸿鹄可以很大的简化这个过程,操作流程变为如下:

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

由于鸿鹄具备数据读取,实时建模,字段任意定义等核心功能,那么是否可以顺势支持api接口的对外提供?简化 API 生成环节,同时具备数据管理功能。例如生成一条如下 API。

利用大数据分析工具,实现多场景可视化数据管理,数据分析,java,数据挖掘

当然,是基于鸿鹄目前核心能力的一种扩展建议。

其他工具使用体验对比反馈

由于工作内容性质,目前接触了一些市面上的数据工具,例如 Tableau 和神策。

Tableau

其中 Tableau 偏向于数据报表的呈现,他的优势点是,基于数据呈现的自定义灵活性较高。Tableau 更像应用层。

而鸿鹄的核心是数据读时处理,但由于鸿鹄处理的是数据最复杂的环节,很有潜力向上延展,补齐【数据展示层】,形成一体化数据应用。

与鸿鹄的官方人员沟通,当前鸿鹄或者商业版本的炎凰,都支持 Restful 标准 API,也能让数据开发者通过鸿鹄提供的 API 接口与 Tableau 做数据对接,预留了扩展接口。

神策

神策主要基于数据的埋点、上报,进而构建一套完整的数据分析路径:【数据池-数据分析-数据展示】。

体验下来的优点是相对闭环,数据实时性较高;但对外暴露的扩展性,相对没有鸿鹄高。当然两者目前的定位也不算一致。文章来源地址https://www.toymoban.com/news/detail-624018.html

到了这里,关于利用大数据分析工具,实现多场景可视化数据管理的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 大数据可视化BI分析工具Apache Superset实现公网远程访问

    Superset是一款由中国知名科技公司开源的“现代化的企业级BI(商业智能)Web应用程序”,其通过创建和分享dashboard,为数据分析提供了轻量级的数据查询和可视化方案。Superset在数据处理和可视化方面具有强大的功能,能够满足企业级的数据分析需求,并为用户提供直观、灵

    2024年02月08日
    浏览(42)
  • 大数据可视化BI分析工具Apache Superset结合内网穿透实现远程访问

    Superset是一款由中国知名科技公司开源的“现代化的企业级BI(商业智能)Web应用程序”,其通过创建和分享dashboard,为数据分析提供了轻量级的数据查询和可视化方案。Superset在数据处理和可视化方面具有强大的功能,能够满足企业级的数据分析需求,并为用户提供直观、灵

    2024年02月04日
    浏览(42)
  • CentOS部署Apache Superset大数据可视化BI分析工具并实现无公网IP远程访问

    Superset是一款由中国知名科技公司开源的“现代化的企业级BI(商业智能)Web应用程序”,其通过创建和分享dashboard,为数据分析提供了轻量级的数据查询和可视化方案。Superset在数据处理和可视化方面具有强大的功能,能够满足企业级的数据分析需求,并为用户提供直观、灵

    2024年04月09日
    浏览(42)
  • 【数据分析与可视化】利用Python对学生成绩进行可视化分析实战(附源码)

    需要源码和数据集请点赞关注收藏后评论区留言私信~~~ 下面对学生成句和表现等数据可视化分析 1:导入模块 2:获取数据 并打印前四行  属性列表对应含义如下 Gender  性别 Nationality  国籍 PlaceofBirth 出生地 Stageid 学校级别 Gradeid 年级 Sectionid  班级 Topic 科目 semester 学期 ra

    2024年02月03日
    浏览(39)
  • python金融数据分析和可视化--03利用Akshare获取股票数据

    AKShare 是基于 Python 的财经数据接口库,目的是实现对股票、期货、期权、基金、外汇、债券、指数、加密货币等金融产品的基本面数据、实时和历史行情数据、衍生数据从数据采集、数据清洗到数据落地的一套工具,主要用于学术研究目的。 AKShare 的特点是获取的是相对权威

    2024年02月05日
    浏览(32)
  • 微博数据可视化分析:利用Python构建信息图表展示话题热度

    1. 引言 随着社交媒体的迅速发展,微博已成为人们交流观点、表达情感的重要平台之一。微博评论数据蕴含着丰富的信息,通过对这些数据进行分析和可视化,我们可以深入了解用户对特定话题的关注程度和情感倾向。本文将介绍如何利用Python进行微博评论数据的准备、探索

    2024年02月20日
    浏览(44)
  • Python利用线性回归、随机森林等对红酒数据进行分析与可视化实战(附源码和数据集 超详细)

    需要源码和数据集请点赞关注收藏后评论区留言私信~~~ 下面对天池项目中的红酒数据集进行分析与挖掘 1:导入模块 2:颜色和打印精度设置 3:获取数据并显示数据维度 字段中英文对照表如下   然后利用describe函数显示数值属性的统计描述值  显示quality取值的相关信息 显示

    2023年04月13日
    浏览(44)
  • 人人可用的开源数据可视化分析工具

    DataEase 人人可用的开源数据可视化分析工具。 DataEase 是开源的数据可视化分析工具,帮助用户快速分析数据并洞察业务趋势,从而实现业务的改进与优化。DataEase 支持丰富的数据源连接,能够通过拖拉拽方式快速制作图表,并可以方便的与他人分享。 DataEase 的功能包括: 图

    2024年02月10日
    浏览(34)
  • 人人可用的开源数据可视化分析工具-DataEase

    DataEase是一种开源的关系型数据库管理系统,旨在帮助用户创建和管理各种类型的数据。它是一种易于使用的工具,适用于各种规模的企业和组织,从个人使用到大型公司使用。 Github 地址:GitHub - dataease/dataease: 人人可用的开源数据可视化分析工具。   DataEase的主要功能包括

    2023年04月23日
    浏览(27)
  • 【使用DataEase数据可视化分析工具访问cpolar】

    DataEase 是开源的数据可视化分析工具,帮助用户快速分析数据并洞察业务趋势,从而实现业务的改进与优化。是开源的数据可视化分析工具,帮助用户快速分析数据并洞察业务趋势,从而实现业务的改进与优化。 在本地搭建后,借助cpolar 内网穿透实现远程公网地址即可访问

    2024年02月10日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包