educoder中Hive综合应用案例 — 用户搜索日志分析

这篇具有很好参考价值的文章主要介绍了educoder中Hive综合应用案例 — 用户搜索日志分析。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

第1关:2018年点击量最高的10个网站域名

---------- 禁止修改 ----------
 drop database if exists mydb cascade;
---------- 禁止修改 ----------


---------- begin ----------
---创建mydb数据库
create database mydb;

---使用mydb数据库
use mydb;

---创建表db_search
create table db_search(
id   string comment '用户编号',
key  string comment '搜索关键词',
ranking string comment '该URL在返回结果中的排名',
or_der string comment '点击顺序',
url string comment '域名',
time string comment '时间'
)row format delimited fields terminated by ' ';




---导入数据:/root/data.txt
load data local inpath '/root/data.txt' into table db_search;

--查询2018年点击量最多的10个网站域名
select url,count(*) cnt from db_search where year(time)='2018' 
group by url order by cnt desc limit 10;




---------- end ----------

第2关:同一种搜索词,哪个网站域名被用户访问最多文章来源地址https://www.toymoban.com/news/detail-789067.html

---------- 禁止修改 ----------
 drop database if exi

到了这里,关于educoder中Hive综合应用案例 — 用户搜索日志分析的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Spark+Hadoop+Hive+MySQL+Presto+SpringBoot+Echarts】基于大数据技术的用户日志数据分析及可视化平台搭建项目

    点我获取项目数据集及代码 随着我国科学技术水平的不断发展,计算机网络技术的广泛应用,我国已经步入了大数据时代。在大数据背景下,各种繁杂的数据层出不穷,一时难以掌握其基本特征及一般规律,这也给企业的运营数据分析工作增添了不小的难度。在大数据的背景

    2024年02月10日
    浏览(57)
  • 大数据框架之Hive: 第7章 综合案例练习(初级)

    (1)创建/opt/module/data目录 (2)将如下4个文件放到/opt/module/data目录下 (3)数据样式说明 (1)插入数据 (2)验证插入数据情况 2.1.1 查询姓名中带“冰”的学生名单 code 结果 2.1.2 查询姓“王”老师的个数 code 结果 2.1.3 检索课程编号为“04”且分数小于60的学生的课程信息,

    2024年02月12日
    浏览(40)
  • 【Vue3】2-12 : 【案例】搜索关键词加筛选条件的综合

    本书目录:点击进入 一、【案例】搜索加筛选条件的综合 1.1、逻辑 1.2、效果 1.3、json数据 - 02-data.json 1.4、代码 计算属性 - 绑定list,并过滤 input  双向绑定 - 当input改变时,计算属性过滤name button组 双向绑定  - 当input改变时,计算属性过滤性别

    2024年01月20日
    浏览(43)
  • python数据分析案例——天猫订单综合分析

    前言 大家早好、午好、晚好吖 ❤ ~欢迎光临本文章 什么是数据分析 明确目的–获得数据(爬虫,现有,公开的数据)–数据预处理——数据可视化——结论 准备 环境使用: 在开始写我们的代码之前,我们要准备好运行代码的程序 Anaconda (python3.9) – 识别我们写的代码 开发工

    2024年02月03日
    浏览(46)
  • 大数据综合项目--网站流量日志数据分析系统(详细步骤和代码)

    提示:这里简述我使用的版本情况: ubuntu16.04 hbase1.1.5 hive1.2.1 sqoop1.4.6 flume1.7.0 项目所使用的参考文档和代码资源和部分数据 网盘链接:链接:https://pan.baidu.com/s/1TIKHMBmEFPiOv48pxBKn2w 提取码:0830 为更好的理解项目架构,对项目使用的一些服务补充一些基本概述: 什么是Sqoop

    2023年04月08日
    浏览(45)
  • Python综合数据分析_RFM用户分层模型

    参考资料:开课吧

    2024年02月01日
    浏览(111)
  • 第11章综合案例2影评大数据分析

    实验目的及要求 (1)现有电影、影评和用户信息3个数据文件,将对其进行大数据分析。 实验系统环境及版本 Linux Ubuntu 20.04 JDK1.8 Hadoop3.1.0 MySQL8.0.28 Hive3.1.2 实验任务 评分次数最多的10部电影; 性别当中评分最高的10部电影; 一部电影各年龄段的平均影评; 评分最高的10部电

    2024年02月07日
    浏览(42)
  • 模糊综合评价在实际问题中的应用(案例)

    目录 一、概述 二、一级模糊综合评价模型 三、多级模糊综合评价模型         模糊综合评价问题 是要 把论域中的对象对应评语集中一个指定的评语 或者 将方案作为评语集并选择一个最优的方案 。(两个角度)         在模糊综合评价中,引入了三个集合:      

    2024年02月06日
    浏览(80)
  • 第1关:MapReduce综合应用案例 — 电信数据清洗

    根据提示,在右侧编辑器补充代码,对数据按照一定规则进行清洗。 数据说明如下: a.txt 数据切分方式: , 数据所在位置: /user/test/input/a.txt 15733218050,15778423030,1542457633,1542457678,450000,530000 15733218050 15778423030 1542457633 1542457678 450000 530000 呼叫者手机号 接受者手机号 开始时间戳(

    2024年02月03日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包