想要精通算法和SQL的成长之路 - 滑动窗口和大小根堆

这篇具有很好参考价值的文章主要介绍了想要精通算法和SQL的成长之路 - 滑动窗口和大小根堆。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

想要精通算法和SQL的成长之路 - 系列导航

一. 大小根堆

先来说下大小根堆是什么:
想要精通算法和SQL的成长之路 - 滑动窗口和大小根堆,精通算法和SQL之路,算法,sql

  • 大根堆:栈顶元素最大(上图左侧部分),栈底至栈顶元素值递增。
  • 小根堆:栈顶元素最小(上图右侧部分),栈底至栈顶元素值递减。

Java当中,可以用什么来表示大小根堆?

小根堆:

Queue<Integer> small = new PriorityQueue<>();
// 或者 x - y 是计算,在特殊情况下可能造成精度越界的情况
Queue<Integer> small = new PriorityQueue<>((x, y) -> x - y);
// 或者,Integer.compare 是纯比较,不会出现精度越界
Queue<Integer> small = new PriorityQueue<>((x, y) -> Integer.compare(x, y));
// 或者
Queue<Integer> small = new PriorityQueue<>(Integer::compare);

大根堆:

Queue<Integer> big = new PriorityQueue<>((x, y) -> y - x);

大小根堆的常规操作:

  • 获取栈顶元素:peek();
  • 栈顶元素移除:poll();

二. 数据流的中位数

原题链接
想要精通算法和SQL的成长之路 - 滑动窗口和大小根堆,精通算法和SQL之路,算法,sql
想要精通算法和SQL的成长之路 - 滑动窗口和大小根堆,精通算法和SQL之路,算法,sql

再说下我们的思路:

  1. 同时维护大小根堆,并且约定小根堆的元素个数总是 >= 大根堆元素个数(最多个数多一个)。
  2. 如果元素个数是奇数,那么中位数就是小根堆堆顶元素。
  3. 如果元素个数是偶数,那么中位数就是(大根堆堆顶 + 小根堆堆顶) / 2。

1.1 初始化

Queue<Integer> big, small;

/**
 * big                      small
 * 最小值 ---> 大根堆顶 中位数 小根堆顶 ---> 最大值
 */
public MedianFinder() {
    small = new PriorityQueue<>();// 小根堆,堆顶元素最小(存储比中位数大的部分)
    big = new PriorityQueue<>((x, y) -> y - x);// 大根堆,堆顶元素最大(存储比中位数小的部分)
}

1.2 插入操作

插入的时候,我们考虑到两种情况:

  • 如果大小根堆的元素个数相等,我们优先把新元素加入到小根堆。
  • 否则,将元素加入到大根堆。

但是,我们并不知道以下三者的关系:

  • 大根堆堆顶元素值。
  • 当前待加入元素值。
  • 小根堆堆顶元素值。

而我们需要去维护他们,一定满足:大根堆堆顶元素值 < 小根堆堆顶元素值。

咋办呢?以第一种情况为例,我们可以:

  • 先把元素加入到大根堆。那么经过排序后,大根堆的堆顶元素就是最大的那个(可能是当前元素,也可能不是)。此时大根堆Size > 小根堆Size
  • 把大根堆堆顶元素移除,加入到小根堆。小根堆经过排序后,这样就能保证大根堆堆顶元素值 < 小根堆堆顶元素值。

写成代码就是:

public void addNum(int num) {
    // 如果大小根堆 的 大小 一样,我们往小根堆放元素。让小根堆size >= 大根堆size
    if (big.size() == small.size()) {
        // 方式一定是先让放大根堆,再把大根堆的堆顶元素移除到小根堆
        big.add(num);
        small.add(big.poll());
    } else {
        small.add(num);
        big.add(small.poll());
    }
}

1.3 完整代码

那么查询函数就更简单了,结合上面的思路,我们得到完整代码如下:

public class MedianFinder {
    Queue<Integer> big, small;

    /**
     * big                      small
     * 最小值 ---> 大根堆顶 中位数 小根堆顶 ---> 最大值
     */
    public MedianFinder() {
        small = new PriorityQueue<>();// 小根堆,堆顶元素最小(存储比中位数大的部分)
        big = new PriorityQueue<>((x, y) -> y - x);// 大根堆,堆顶元素最大(存储比中位数小的部分)
    }

    public void addNum(int num) {
        // 如果大小根堆 的 大小 一样,我们往小根堆放元素。让小根堆size >= 大根堆size
        if (big.size() == small.size()) {
            // 方式一定是先让放大根堆,再把大根堆的堆顶元素移除到小根堆
            big.add(num);
            small.add(big.poll());
        } else {
            small.add(num);
            big.add(small.poll());
        }
    }

    public double findMedian() {
        return small.size() == big.size() ? (small.peek() + big.peek()) / 2.0 : small.peek();
    }
}

三. 滑动窗口中位数

原题链接
想要精通算法和SQL的成长之路 - 滑动窗口和大小根堆,精通算法和SQL之路,算法,sql
思路如下:

  1. 我们先创建一个窗口,把前k个数字通过大小根堆的方式去维护(题目一的思路)。
  2. 后续每次滑动窗口的移动,都带来两个变数:一个旧元素会从窗口出移除(但是从大根堆移除还是小根堆移除?),一个新元素会加入到窗口中(加入到大根堆还是小根堆?)
  3. 由于第二步的变数,可能导致大小根堆的Size不均衡。我们的目的:让小根堆的Size >= 大根堆Size,最多多一个元素。
  4. 因此每次滑动窗口的移动,我们还需要维护大小根堆。

3.1 在第一题的基础上改造

首先考虑到精度的问题,我们的大小根堆不能在根据差值来比较了,而是:

right = new PriorityQueue<>((x, y) -> Integer.compare(x, y));// 小根堆,堆顶元素最小(存储比中位数大的部分)
left = new PriorityQueue<>((x, y) -> Integer.compare(y, x));// 大根堆,堆顶元素最大(存储比中位数小的部分)

其次,求中位数的时候,也需要大小根堆的堆顶元素,先除以2,再和相加:

if (left.size() == right.size()) {
   return (left.peek() / 2.0) + (right.peek() / 2.0);

最终代码如下:

public class Test480 {
    Queue<Integer> left, right;

    public double[] medianSlidingWindow(int[] nums, int k) {
        right = new PriorityQueue<>((x, y) -> Integer.compare(x, y));// 小根堆,堆顶元素最小(存储比中位数大的部分)
        left = new PriorityQueue<>((x, y) -> Integer.compare(y, x));// 大根堆,堆顶元素最大(存储比中位数小的部分)
        int len = nums.length;
        // 结果集
        double[] res = new double[len - k + 1];
        // 创建大小根堆
        for (int i = 0; i < k; i++) {
            right.add(nums[i]);
        }
        for (int i = 0; i < k / 2; i++) {
            left.add(right.poll());
        }
        // 初始化第一个中位数
        res[0] = findMedian();
        for (int i = k; i < len; i++) {
            // 滑动窗口长度固定,每次移动,都有一个元素要删除和一个元素要新加入
            int del = nums[i - k], add = nums[i];
            if (add >= right.peek()) {
                right.add(add);
            } else {
                left.add(add);
            }
            // 如果待删除元素在小根堆,在小根堆处删除,否则在大根堆中删除
            if (del >= right.peek()) {
                right.remove(del);
            } else {
                left.remove(del);
            }
            // 维护大小根堆的元素个数
            adjust();
            res[i - k + 1] = findMedian();
        }
        return res;
    }

    void adjust() {
        while (left.size() > right.size()) {
            right.add(left.poll());
        }
        while (right.size() - left.size() > 1) {
            left.add(right.poll());
        }
    }

    public double findMedian() {
        if (left.size() == right.size()) {
            return (left.peek() / 2.0) + (right.peek() / 2.0);
        } else {
            return right.peek() * 1.0;
        }
    }
}

这个写法其实是没问题的,但是在元素个数非常大的情况下,就容易超时:
想要精通算法和SQL的成长之路 - 滑动窗口和大小根堆,精通算法和SQL之路,算法,sql

3.2 栈的remove操作

问题处在优先队列的的一个元素remove操作:
想要精通算法和SQL的成长之路 - 滑动窗口和大小根堆,精通算法和SQL之路,算法,sql
它是先查找(复杂度O(N)),再进行删除(复杂度O(logN)),所以会超时。因此我们这里可以引入红黑树来进行替代。

有这么几个需要注意的地方:

  1. 我们用TreeSet存储元素的时候,不再是元素值,而是元素的下标。 因为题目中同一个窗口的元素可能重复。元素值相等的时候,根据下标大小来比较。
Comparator<Integer> comparator = (x, y) -> nums[x] != nums[y] ? Integer.compare(nums[x], nums[y]) : x - y;
right = new TreeSet<>(comparator);// 小根堆,堆顶元素最小(存储比中位数大的部分)
left = new TreeSet<>(comparator.reversed());// 大根堆,堆顶元素最大(存储比中位数小的部分)
  1. 滑动窗口移动的时候。需要删除对应的元素下标 ,由于存在重复值,我们需要大小根堆都把这个下标给剔除。
  2. peek函数替代为first函数。poll函数替代为pollFirst函数。

完整代码如下:文章来源地址https://www.toymoban.com/news/detail-725429.html

public class Test480 {
    TreeSet<Integer> left, right;
    int[] nums;

    public double[] medianSlidingWindow(int[] nums, int k) {
        this.nums = nums;
        Comparator<Integer> comparator = (x, y) -> nums[x] != nums[y] ? Integer.compare(nums[x], nums[y]) : x - y;
        right = new TreeSet<>(comparator);// 小根堆,堆顶元素最小(存储比中位数大的部分)
        left = new TreeSet<>(comparator.reversed());// 大根堆,堆顶元素最大(存储比中位数小的部分)
        int len = nums.length;
        // 结果集
        double[] res = new double[len - k + 1];
        // 创建大小根堆
        for (int i = 0; i < k; i++) {
            addToWindow(i);
        }
        res[0] = findMedian();
        for (int i = k; i < len; i++) {
            // 滑动窗口长度固定,每次移动,都有一个元素要删除和一个元素要新加入
            left.remove(i - k);
            right.remove(i - k);
            addToWindow(i);
            res[i - k + 1] = findMedian();
        }
        return res;
    }

    void addToWindow(int index) {
        // 我们总是把新元素先统一加入到大根堆。
        right.add(index);
        left.add(right.pollFirst());
        // 然后再维护大小
        while (left.size() > right.size()) {
            right.add(left.pollFirst());
        }
    }

    public double findMedian() {
        if (left.size() == right.size()) {
            return (nums[left.first()] / 2.0) + (nums[right.first()] / 2.0);
        } else {
            return nums[right.first()] * 1.0;
        }
    }
}

到了这里,关于想要精通算法和SQL的成长之路 - 滑动窗口和大小根堆的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 想要精通算法和SQL的成长之路 - 分割数组的最大值

    想要精通算法和SQL的成长之路 - 系列导航 原题链接 首先面对这个题目,我们可以捕获几个: 非负整数。 非空连续子数组。 那么我们假设分割后的子数组,和的最大值是 M ,对应分割的子数组个数为 N 。他们之间必然存在以下关系: 分割的子数组个数 N 越多,对应的

    2024年02月07日
    浏览(42)
  • 想要精通算法和SQL的成长之路 - 二叉树的序列化和反序列化问题

    想要精通算法和SQL的成长之路 - 系列导航 二叉树的层序遍历 像这种从上至下并且按层打印的,可以称之为 二叉树的广度优先搜索( BFS ) 。而这类算法往往借助 队列的一个先入先出特性 来实现。 那么有这么几个步骤: 1.特殊处理还有初始化动作。 2. BFS 循环: 最终完整代

    2024年02月07日
    浏览(50)
  • 【leetcode刷题之路】面试经典150题(2)——双指针+滑动窗口+矩阵

    2 双指针 2.1 【双指针】验证回文串 题目地址:https://leetcode.cn/problems/valid-palindrome/description/?envType=study-plan-v2envId=top-interview-150   详见代码。 2.2 【双指针】判断子序列 题目地址:https://leetcode.cn/problems/is-subsequence/description/?envType=study-plan-v2envId=top-interview-150   双指针挨个遍

    2024年02月19日
    浏览(50)
  • 斗破苍穹算法——萧炎的成长之路(二)

    「作者主页」 :雪碧有白泡泡 「个人网站」 :雪碧的个人网站 「推荐专栏」 : ★ java一站式服务 ★ ★ 前端炫酷代码分享 ★ ★ uniapp-从构建到提升 ★ ★ 从0到英雄,vue成神之路 ★ ★ 解决算法,一个专栏就够了 ★ ★ 架构咱们从0说 ★ ★ 数据流通的精妙之道★ 萧炎是一

    2024年02月14日
    浏览(37)
  • 斗破苍穹算法版—萧炎的成长之路

    「作者主页」 :雪碧有白泡泡 「个人网站」 :雪碧的个人网站 「推荐专栏」 : ★ java一站式服务 ★ ★ 前端炫酷代码分享 ★ ★ uniapp-从构建到提升 ★ ★ 从0到英雄,vue成神之路 ★ ★ 解决算法,一个专栏就够了 ★ ★ 架构咱们从0说 ★ ★ 数据流通的精妙之道★ 萧炎是一

    2024年02月16日
    浏览(37)
  • 斗破苍穹算法版—萧炎的成长之路(一)

    「作者主页」 :雪碧有白泡泡 「个人网站」 :雪碧的个人网站 「推荐专栏」 : ★ java一站式服务 ★ ★ 前端炫酷代码分享 ★ ★ uniapp-从构建到提升 ★ ★ 从0到英雄,vue成神之路 ★ ★ 解决算法,一个专栏就够了 ★ ★ 架构咱们从0说 ★ ★ 数据流通的精妙之道★ 萧炎是一

    2024年02月16日
    浏览(42)
  • Flink系列Table API和SQL之:滚动窗口、滑动窗口、累计窗口、分组聚合

    有了时间属性,接下来就可以定义窗口进行计算了。窗口可以将无界流切割成大小有限的桶(bucket)来做计算,通过截取有限数据集来处理无限的流数据。在DataStream API中提供了对不同类型的窗口进行定义和处理的接口,而在Table API和SQL中,类似的功能也都可以实现。 在Flink 1

    2023年04月27日
    浏览(58)
  • 大数据Flink(七十四):SQL的滑动窗口(HOP)

    文章目录 SQL的滑动窗口(HOP) 滑动窗口定义 :滑动窗口也是将元素指定给固定长度的窗口。与滚动窗口功能一样,也有窗口大小的概念。不一样的地方在于,滑动窗口有另一个参数控制窗口计算的频率(滑动窗口滑动的步长)。因此,如果滑动的步长小于窗口大小,则滑动

    2024年02月09日
    浏览(39)
  • 【算法】基础算法002之滑动窗口(一)

    👀 樊梓慕: 个人主页  🎥 个人专栏: 《C语言》 《数据结构》 《蓝桥杯试题》 《LeetCode刷题笔记》 《实训项目》 《C++》 《Linux》《算法》 🌝 每一个不曾起舞的日子,都是对生命的辜负 目录 前言 1.长度最小的子数组 滑动窗口类问题解题思路大纲: 2.无重复字符的最长

    2024年02月19日
    浏览(46)
  • 【算法】基础算法002之滑动窗口(二)

    👀 樊梓慕: 个人主页  🎥 个人专栏: 《C语言》 《数据结构》 《蓝桥杯试题》 《LeetCode刷题笔记》 《实训项目》 《C++》 《Linux》 《算法》 🌝 每一个不曾起舞的日子,都是对生命的辜负 目录 前言  5.水果成篮(medium)  6.找到字符串中所有字母异位词 7.串联所有单词的

    2024年02月20日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包