读SQL学习指南(第3版)笔记12_时间函数和分析函数

这篇具有很好参考价值的文章主要介绍了读SQL学习指南(第3版)笔记12_时间函数和分析函数。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

读SQL学习指南(第3版)笔记12_时间函数和分析函数文章来源地址https://www.toymoban.com/news/detail-695052.html

1. 时区

1.1. 大航海时代伊始就在和时差打交道,而计算机时代的到来加剧了这一问题

1.2. 世界各地的人们都喜欢将太阳直射本地的时间作为正午

1.3. 无法强制所有人使用统一的时钟

1.4. 世界被划分为24个时区,同一时区内的所有人都认同当前时间,而其他时区的人则不然

1.5. 为了确保有一个共同的计时参考点,十五世纪的航海家们将他们的时钟设定为英国格林尼治时间,也就是后来所称的格林尼治标准时(Greenwich mean time,GMT)

1.6. 协调世界时(coordinated universal time,UTC)

1.6.1. GMT的一种变体

1.6.2. 原子钟为基础(或者更准确地说,是分布在全世界50个位置的200个原子钟的平均时间,称为“世界时”)

1.6.3. SQL Server和MySQL都提供了可以返回当前的UTC时间戳的函数

1.6.3.1. SQL Server的getutcdate()

1.6.3.2. MySQL的utc_timestamp()

1.7. 大多数数据库服务器根据当前所在地区设置默认时区,并提供工具以便在需要的时候修改时区

1.7.1. 用于存储全球股票交易的数据库通常会配置为使用UTC

1.7.2. 用于存储特定零售企业销售数据的数据库则可能使用服务器所在时区

1.8. MySQL提供两种不同的时区设置

1.8.1. 全局时区

1.8.2. 会话时区

1.8.2.1. 对于每个登录的用户可能有所不同

1.8.2.2. 改变当前会话的时区设置

1.8.2.3. mysql> SET time_zone = 'Europe/Zurich';

1.9. Oracle Database用户修改会话的时区设置

1.9.1. ALTER SESSION TIMEZONE = 'Europe/Zurich'

2. 生成时间型数据

2.1. 从已有的date、datetime或time列复制数据

2.2. 执行能够返回date、datetime或time类型数据的内建函数

2.3. 构建可以被服务器评估的时间型数据的字符串表示

2.4. 日期格式的组成部分

2.4.1. YYYY

2.4.1.1. 年份,包括世纪

2.4.1.2. 1000--9999

2.4.2. MM

2.4.2.1. 月份

2.4.2.2. 01 (1月)~12 (12月)

2.4.3. DD

2.4.3.1. 日

2.4.3.2. 01~31

2.4.4. HH

2.4.4.1. 小时

2.4.4.2. 00~23

2.4.5. HHH

2.4.5.1. 小时

2.4.5.2. -838~838

2.4.6. MI

2.4.6.1. 分钟

2.4.6.2. 00~59

2.4.7. SS

2.4.7.1. 分钟

2.4.7.2. 00~59

2.5. 所需的日期组成部分

2.5.1. date

2.5.1.1. YYYYMM-DD

2.5.2. datetime

2.5.2.1. YYYY-MM-DD HH:MISS

2.5.3. timestamp

2.5.3.1. YYYY-MM-DD HH:MSS

2.5.4. time

2.5.4.1. HHH:M:SS

2.6. cast()函数

2.6.1. 字符串到日期的转换

2.6.1.1. 返回datetime类型的值

2.6.2. mysql> SELECT CAST('2019-09-17 15:30:00' AS DATETIME);

2.6.3. mysql

-> SELECT CAST('2019-09-17' AS DATE) date_field,
    -> CAST('108:17:57' AS TIME) time_field;

2.7. str_to_date()

2.7.1. 日期生成函数

2.7.2. sql

UPDATE rental
SET return_date = STR_TO_DATE('September 17, 2019', '%M %d, %Y')
WHERE rental_id = 99999;

2.7.3. 第2个参数定义了日期字符串的格式

2.7.3.1. %a 星期几的简写,比如Sun、Mon、...

2.7.3.2. %b 月份名称的简写,比如Jan、Feb、...

2.7.3.3. %c 月份的数字形式(0…12)

2.7.3.4. %d 月份中的天数(00…31)

2.7.3.5. %f 微秒数(000000…999999)

2.7.3.6. %H 24小时制中的小时(00…23)

2.7.3.7. %h 12小时制中的小时(01…12)

2.7.3.8. %i 小时中的分钟数(00…59)

2.7.3.9. %j 一年中的天数(001…366)

2.7.3.10. %M 月份的全称(January…December)

2.7.3.11. %m 月份的数值形式

2.7.3.12. %p AM或PM

2.7.3.13. %s 秒数(00…59)

2.7.3.14. %W 星期几的全称(Sunday…Saturday)

2.7.3.15. %w 一星期中的天数(0=周日;6=周六)

2.7.3.16. %Y 4位数字表示的年份

2.7.4. Oracle Database用户可以使用to_date()函数,其用法与MySQL的str_to_date()函数相同

2.8. 访问系统时钟

2.8.1. mysql> SELECT CURRENT_DATE(), CURRENT_TIME(), CURRENT_TIMESTAMP();

2.8.2. Oracle Database提供了函数current_date()和current_timestamp(),但没有提供current_time()

2.8.3. Microsoft SQL Server只提供了current_timestamp()函数

2.9. 返回日期的时间型函数

2.9.1. date_add()函数

2.9.1.1. 允许对指定日期添加各种间隔期(比如,日、月、年),以生成另一个日期

2.9.1.2. mysql> SELECT DATE_ADD(CURRENT_DATE(), INTERVAL 5 DAY);

2.9.2. 常用的间隔类型

2.9.2.1. second

2.9.2.1.1. 秒数

2.9.2.2. minute

2.9.2.2.1. 分钟数

2.9.2.3. hour

2.9.2.3.1. 小时数

2.9.2.4. day

2.9.2.4.1. 天数

2.9.2.5. month

2.9.2.5.1. 月份

2.9.2.6. year

2.9.2.6.1. 年数

2.9.2.7. minute_second

2.9.2.7.1. 分钟数和秒数,之间以”.”分隔

2.9.2.8. hour_second

2.9.2.8.1. 小时数、分钟数和秒效,之间以”.*分隔

2.9.2.9. year_month

2.9.2.9.1. 分钟数和秒数,之间以”.”分隔

2.9.3. last_day()函数

2.9.3.1. 求得当前的月份并计算到月底所剩的天数

2.9.3.1.1. 会返回date类型
2.9.3.1.2. 底层逻辑很复杂,比如在要找出二月的最后一天时必须首先确定当前年份是否为闰年

2.9.3.2. MySQL和Oracle Database都提供了

2.9.3.3. SQL Server没有提供与之功能接近的函数

2.9.3.4. mysql> SELECT LAST_DAY('2019-09-17');

2.10. 返回字符串的时间型函数

2.10.1. dayname()函数

2.10.1.1. 确定某一天是星期几

2.10.1.2. mysql> SELECT DAYNAME('2019-09-18');

2.10.2. extract()函数

2.10.2.1. SQL:2003标准的一部分

2.10.2.2. Oracle Database中也同样得到了实现

2.10.2.3. 记住一个函数的数种变体比记住一堆不同的函数更容易

2.10.2.4. mysql> SELECT EXTRACT(YEAR FROM '2019-09-18 22:19:05');

2.10.2.5. SQL Server没有提供extract()函数的实现,但是提供了datepart()函数

2.10.2.5.1. SELECT DATEPART(YEAR, GETDATE())

2.11. 返回数值的时间型函数

2.11.1. datediff()

2.11.1.1. 返回两个日期之间的天数

2.11.1.2. mysql> SELECT DATEDIFF('2019-09-03', '2019-06-21');

2.11.1.3. SQL Server也提供了datediff()函数,但比MySQL的实现更为灵活,可以为其指定间隔类型(年、月、日、小时等)

2.11.1.3.1. SELECT DATEDIFF(DAY, '2019-06-21', '2019-09-03')

3. 转换函数

3.1. cast()函数

3.1.1. SQL:2003标准

3.1.2. MySQL、Oracle和Microsoft SQL Server中均已实现

3.1.3. mysql> SELECT CAST('1456328' AS SIGNED INTEGER);

3.1.4. cast()函数不接受格式化字符串

3.1.5. 如果待转换的日期字符串并非默认格式(比如datetime类型的YYYY-MM-DD HH:MI:SS),需要先使用其他函数进行调整

4. 分析函数

4.1. 分析函数只能在SELECT子句中使用,所以如果需要根据分析函数的结果进行过滤或分组,通常需要使用嵌套查询

4.2. 排名函数

4.2.1. row_number

4.2.1.1. 为每一行返回一个唯一的排名,如果出现并列的情况,则任意分配排名

4.2.2. rank

4.2.2.1. 在出现并列的情况下,返回相同的排名,会在排名中产生空隙

4.2.2.2. 在很多情况下,rank函数也许是最好的选择

4.2.3. dense_rank

4.2.3.1. 在出现并列的情况下,返回相同的排名,不会在排名中产生空隙

4.2.4. mysql

-> SELECT customer_id, count(*) num_rentals,
    ->   row_number() over (order by count(*) desc) row_number_rnk,
    ->   rank() over (order by count(*) desc) rank_rnk,
    ->   dense_rank() over (order by count(*) desc) dense_rank_rnk
    -> FROM rental
    -> GROUP BY customer_id
    -> ORDER BY 2 desc;

4.2.5. 生成多个排名

4.2.5.1. 通过在over子句中加入partition by子句来实现

4.2.5.2. sql

SELECT customer_id, rental_month, num_rentals,
  rank_rnk ranking
FROM
 (SELECT customer_id,
    monthname(rental_date) rental_month,
    count(*) num_rentals,
    rank() over (partition by monthname(rental_date)
      order by count(*) desc) rank_rnk
 FROM rental
 GROUP BY customer_id, monthname(rental_date)
) cust_rankings
WHERE rank_rnk <= 5
ORDER BY rental_month, num_rentals desc, rank_rnk;

4.3. 报表函数

4.3.1. 找出离群值(outlier)

4.3.2. 生成整个数据集的汇总值/平均值

4.3.3. 可以使用聚合函数(min、max、avg、sum和count),但不是将其与group by子句并用,而是搭配over子句

4.3.4. mysql

-> SELECT monthname(payment_date) payment_month,
    ->   amount,
    ->   sum(amount)
    ->     over (partition by monthname(payment_date)) monthly_total,
    ->   sum(amount) over () grand_total
    -> FROM payment
    -> WHERE amount >= 10
    -> ORDER BY 1;

4.3.5. mysql

-> SELECT monthname(payment_date) payment_month,
    ->   sum(amount) month_total,
    ->   round(sum(amount) / sum(sum(amount)) over ()
    ->     * 100, 2) pct_of_total
    -> FROM payment
    -> GROUP BY monthname(payment_date);

4.3.6. mysql

 -> SELECT monthname(payment_date) payment_month,
    ->   sum(amount) month_total,
    ->   CASE sum(amount)
    ->     WHEN max(sum(amount)) over () THEN 'Highest'
    ->     WHEN min(sum(amount)) over () THEN 'Lowest'
    ->     ELSE 'Middle'
    ->   END descriptor
    -> FROM payment
    -> GROUP BY monthname(payment_date);

4.3.7. 使用partition by子句来为分析函数定义数据窗口,允许按照公共值对行进行分组

4.3.8. 流水式总和

4.3.8.1. mysql

-> SELECT yearweek(payment_date) payment_week,
    ->   sum(amount) week_total,
    ->   sum(sum(amount))
    ->     over (order by yearweek(payment_date)
    ->       rows unbounded preceding) rolling_sum
    -> FROM payment
    -> GROUP BY yearweek(payment_date)
    -> ORDER BY 1;

4.3.9. 流水式平均值

4.3.9.1. mysql

-> SELECT yearweek(payment_date) payment_week,
    ->   sum(amount) week_total,
    ->   avg(sum(amount))
    ->     over (order by yearweek(payment_date)
    ->       rows between 1 preceding and 1 following) rolling_3wk_avg
    -> FROM payment
    -> GROUP BY yearweek(payment_date)
    -> ORDER BY 1;

4.3.10. lag和lead

4.3.10.1. 涉及将一行中的值与另一行进行比较

4.3.10.2. mysql

-> SELECT yearweek(payment_date) payment_week,
    ->   sum(amount) week_total,
    ->   lag(sum(amount), 1)
    ->     over (order by yearweek(payment_date)) prev_wk_tot,
    ->   lead(sum(amount), 1)
    ->     over (order by yearweek(payment_date)) next_wk_tot
    -> FROM payment
    -> GROUP BY yearweek(payment_date)
    -> ORDER BY 1;

4.3.10.3. mysql

-> SELECT yearweek(payment_date) payment_week,
    ->   sum(amount) week_total,
    ->   round((sum(amount) - lag(sum(amount), 1)
    ->     over (order by yearweek(payment_date)))
    ->     / lag(sum(amount), 1)
    ->       over (order by yearweek(payment_date))
    ->     * 100, 1) pct_diff
    -> FROM payment
    -> GROUP BY yearweek(payment_date)
    -> ORDER BY 1;

5. 列值拼接

5.1. 处理数据窗口中的行组

5.2. group_concat函数

5.2.1. 用于将一组列值转换为单个分隔字符串

5.2.2. 一种将结果集反规范化(denormalize)以生成XML或JSON文档的便捷方法

5.2.3. mysql

-> SELECT f.title,
    ->   group_concat(a.last_name order by a.last_name
    ->     separator ', ') actors
    -> FROM actor a
    ->   INNER JOIN film_actor fa
    ->   ON a.actor_id = fa.actor_id
    ->   INNER JOIN film f
    ->   ON fa.film_id = f.film_id
    -> GROUP BY f.title
    -> HAVING count(*) = 3;

5.2.4. SQL Server,可以通过string_agg函数

5.2.5. Oracle用户则可以使用listagg函数

到了这里,关于读SQL学习指南(第3版)笔记12_时间函数和分析函数的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 读SQL学习指南(第3版)笔记01_背景知识

    2.1.3.1. 单根层次结构 2.1.5.1. Microsoft的Active Directory 2.1.5.2. 开源的Apache Directory Server 3.1.3.1. 大型共享数据银行的数据关系模型 3.2.2.1. 不用操心跟踪已分配的数字 3.2.4.1. 由两个或多于两个列组成的主键 4.4.1.1. 用于定义存储在数据库中的数据结构 4.4.1.2. 通过SQL模式语句所创

    2024年02月12日
    浏览(37)
  • 读SQL学习指南(第3版)笔记08_视图和索引

    3.1.3.1. Oracle Database用户另一种选择可以保护数据表的行列数据安全 3.1.3.2. VPD允许用户对数据表施加策略,服务器据此对用户的查询进行修改 5.10.4.1. sql 5.12.1.1. 平衡树索引(balanced-tree index) 5.12.1.1.1. B树索引(B-tree index) 5.12.1.2. MySQL、Oracle Database和SQL Server均默认采用B树

    2024年02月10日
    浏览(33)
  • 读SQL学习指南(第3版)笔记06_连接和集合

    1.1.2.1. 两个数据表的所有排列组合 1.1.3.1. 使用频率并不高 1.1.5.1. 涉及交叉连接、外连接、日期函数、分组、集合运算(union all)和聚合函数(count()) 1.1.5.2. sql 1.1.5.3. mysql 1.1.5.4. 如果生成{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}、{0, 10, 20, 30, 40, 50, 60, 70, 80, 90}和{0,100, 200, 300}这3个集合的

    2024年02月11日
    浏览(23)
  • 读SQL学习指南(第3版)笔记09_条件逻辑与事务

    1.3.1.1. Oracle的decode()函数 1.3.1.2. MySQL的if()函数 1.3.1.3. SQL Server的coalesce()函数 1.3.2.1. 在Oracle Database、SQL Server、MySQL、PostgreSQL、IBM UDB等数据库中实现 1.3.3.1. 用于select、insert、update和delete语句 1.3.4.1. sql 1.3.4.2. mysql 1.3.5.1. simple case expression 1.3.5.2. 类似于搜索型case表达式,但

    2024年02月10日
    浏览(32)
  • 读SQL学习指南(第3版)笔记07_分组和子查询

    2.1.1.1. 查询返回的每个值都是由聚合函数生成的 2.1.1.2. 没有使用group by子句 2.1.1.3. 只有一个隐式分组 2.1.1.3.1. payment数据表中的所有行 2.2.1.1. 添加一个group by子句来指定聚合函数应该应用于哪个分组 2.6.2.1. 因为在评估where子句时,分组尚未生成,因而必须将分组过滤条件

    2024年02月11日
    浏览(31)
  • 读SQL学习指南(第3版)笔记03_创建和填充数据库

    3.2.3.1. ALTER TABLE person MODIFY person_id SMALLINT UNSIGNED AUTO_INCREMENT; 5.4.3.1. sql 5.4.3.2. %a 星期几的简写,比如Sun、Mon、... 5.4.3.3. %b 月份名称的简写,比如Jan、Feb、... 5.4.3.4. %c 月份的数字形式(0…12) 5.4.3.5. %d 月份中的天数(00…31) 5.4.3.6. %f 微秒数(000000…999999) 5.4.3.7. %H 24小

    2024年02月11日
    浏览(37)
  • 读SQL学习指南(第3版)笔记10_元数据与大数据

    1.3.19.1. system catalog 5.7.2.1. 服务器会检查数据表的元数据,以确定实际需要包含哪些分区 5.7.3.1. 只有那些包含查询所需数据的分区才会被包含在内 5.7.4.1. 财务数据可能需要在线保存7年,如果数据表已根据事务日期进行分区,就可以撤销数据保存时长超过7年的分区 5.9.1.1. 

    2024年02月10日
    浏览(32)
  • 2023 年如何学习 SQL:初学者终极指南

    什么是 SQL,它的用途是什么? SQL 在 2023 年仍然适用吗? 你应该学习 SQL 吗? 学习 SQL 的不同方法 SQL 入门 SQL初学者可能害怕问的问题 学习 SQL 的先决条件是什么,我需要有任何编码经验吗? SQL 有哪些实际应用,哪些行业依赖于此技能? 学习SQL需要多长时间,我应该投入多

    2024年02月03日
    浏览(92)
  • 从零开始学习 Java:简单易懂的入门指南之时间类(十七)

    java.util.Date`类 表示特定的瞬间,精确到毫秒。 继续查阅Date类的描述,发现Date拥有多个构造函数,只是部分已经过时,我们重点看以下两个构造函数 public Date() :从运行程序的此时此刻到时间原点经历的毫秒值,转换成Date对象,分配Date对象并初始化此对象,以表示分配它的时

    2024年02月11日
    浏览(42)
  • Redis学习指南(2)-Redis与传统SQL数据库的差异

    在数据库领域,Redis和SQL数据库是两种不同的存储解决方案,各自具有一系列优势和劣势。本文将对Redis和SQL数据库进行对比分析,以帮助读者更好地了解它们的特点和适用场景。 1. 高性能 Redis以其出色的性能而闻名,主要因为它是一个基于内存的键值存储系统。这意味着数

    2024年01月21日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包