中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。

例如,

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。

示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2

进阶:
如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
基数排序的思想,使用长度101的int数组记录每个值的个数。

如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?
使用长度102的数组。

思路

采用大根堆(降序优先级队列)和小根堆(升序优先级队列)存放数列,数据流向 左->右[->左]。
时间复杂度O(nlgn),空间复杂度O(n)。

代码

class MedianFinder {
    private int size;
    private PriorityQueue<Integer> minheap;
    private PriorityQueue<Integer> maxheap;

    /** initialize your data structure here. */
    public MedianFinder() {
        size = 0;
        minheap = new PriorityQueue<>();
        maxheap = new PriorityQueue<>((x,y) -> y-x);
    }
    
    public void addNum(int num) {
        size++;
        maxheap.add(num);
        minheap.add(maxheap.poll());
        if((size & 1) == 1) {
            maxheap.add(minheap.poll());
        }
    }
    
    public double findMedian() {
        if((size & 1) == 1) {
            return maxheap.peek();
        }
        return (double)(maxheap.peek() + minheap.peek()) / 2;
    }
}

/**
 * Your MedianFinder object will be instantiated and called as such:
 * MedianFinder obj = new MedianFinder();
 * obj.addNum(num);
 * double param_2 = obj.findMedian();
 */

笔记

size++放置的位置

链接:https://leetcode-cn.com/problems/find-median-from-data-stream

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄