spark sql如何行转列

10月前作者：大模型大数据攻城狮分类：Toy博客阅读(44) 违法举报

这篇具有很好参考价值的文章主要介绍了spark sql如何行转列。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

在数据仓库中，行转列通常称为”变形”(Pivoting) 或 “透视”(Pivoting)，可使用Spark SQL的pivot语句实现。下面是一个简单的示例：

假设我们有如下表格：

+-------+-------+------+
| name  | brand | year |
+-------+-------+------+
| Alice | BMW   | 2017 |
| Bob   | Tesla | 2018 |
| Alice | Tesla | 2019 |
| Bob   | BMW   | 2020 |
+-------+-------+------+

我们想要把该表中的品牌列转换为4列，分别表示不同的品牌，而值则为对应品牌的年份。具体操作如下：

SELECT name, 
       COALESCE(BMW, 0) AS BMW, 
       COALESCE(Tesla, 0) AS Tesla 
FROM (
  SELECT name,
         brand,
         year 
  FROM my_table
) T
PIVOT (
  MAX(year) 
  FOR brand IN ('BMW', 'Tesla')
)

运行上面的代码，得到的结果如下所示：

+-------+------+------+
| name  | BMW  | Tesla|
+-------+------+------+
| Alice | 2017 | 2019 |
| Bob   | 2020 | 2018 |
+-------+------+------+

可以看到，原本的品牌列已经被转换成了两个新的列，并且对于每个人名，都有对应的品牌年份信息填充其中。这就是典型的行转列操作。其中，COALESCE函数用于处理可能存在的空值情况。

文章来源地址https://www.toymoban.com/news/detail-725444.html

到了这里，关于spark sql如何行转列的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

PostgreSQL如何行转列

PostgreSQL如何行转列方法一： group by + sum + case when 方法二：用postgresql的crosstab交叉函数方法三： group by + string_agg + split_part(分组，行转列，字符切割) group by + string_agg

2024年02月11日
浏览(52)
Hive数据仓库行转列

查了很多资料发现网上很多文章都是转发和抄袭，有些问题。这里分享一个自己项目中使用的行转列例子，供大家参考。代码如下：如果是在SparkSQL或Presto平台，或者阿里云的MaxCompute平台，还可使用如下方式：

2024年02月21日
浏览(58)
【SQL开发实战技巧】系列（三十七）：数仓报表场景☞从表内始终只有近两年的数据，要求用两列分别显示其中一年的数据聊行转列隐含信息的重要性

【SQL开发实战技巧】系列（一）:关于SQL不得不说的那些事【SQL开发实战技巧】系列（二）：简单单表查询【SQL开发实战技巧】系列（三）：SQL排序的那些事【SQL开发实战技巧】系列（四）：从执行计划讨论UNION ALL与空字符串UNION与OR的使用注意事项【SQL开发实战技巧】系列

2023年04月18日
浏览(48)
行转列--将多行数据转成多行多列的Table结构

21年做的一个功能，涉及到将行数据转化成列数据。边查边做，一点一点的尝试着做好。当时感觉有点吃力。完成之后本想记录，但一直拖延至今。最近再次接手与这个功能相关的业务，整理了之前写的代码，趁此机会记录下来。界面中是一个三级结构：L1级【Test Sample】,

2024年02月05日
浏览(54)
Mysql行转列函数

group_concat() 例： select oid from Test; select group_concat( oid ) from Test;

2024年02月14日
浏览(40)
greenplum行转列

项目中需要将150w的数据转为1500列的大宽表数据。最开始尝试了网上提供的两种方法：实际业务中10行*1500列数据查询并插入需要25秒左右（测试服务器性能比较差） case when的问题是每个case when的语句都会把分组后的数据判断一下，时间复杂度为O²（O为行转列后的列数），非

2024年02月03日
浏览(40)
SqlServer行转列方法

数据库建表 1 使用聚合函数巧妙解决，可以用max、sum等 2 使用pivot函数 3.行转列，多列，参考

2024年02月15日
浏览(68)
mysql 行转列

以下是其中比较常见的几种方法：使用GROUP_CONCAT函数可以使用GROUP_CONCAT函数将多行数据合并为一行，并以逗号或其他分隔符进行分隔。通过SELECT语句和GROUP BY子句，可以将数据行转换为列。具体语法如下：其中，id表示非透视列，status表示需要转换为列的字段，value表示需要

2024年02月16日
浏览(52)
5分钟搞懂MySQL - 行转列

小伙伴想精准查找自己想看的MySQL文章？喏 → MySQL专栏目录 | 点击这里 MySQL 行转列，对经常处理数据的同学们来说，一定是不陌生的，甚至是印象深刻，因为它大概率困扰过你，让你为之一愣~ 但当你看到本文后，这个问题就不在是问题，及时收藏，以后谁再问你这个问

2023年04月08日
浏览(57)
Oracle——行转列与列转行

把某一个字段的值作为唯一值，然后另外一个字段的行值转换成它的列值。转换过程大致如下所示：通常情况下，采取 group by 唯一字段进行分组，然后依据不同的列进行判断输出就能转换。建表语句和增加测试数据sql如下所示：执行完毕后，数据库中当前的数据结构如

2024年02月15日
浏览(63)