第一期讲义-二分法
二分查找又称折半搜索算法。 狭义地来讲,二分查找是一种在有序数组查找某一特定元 素的搜索算法。这同时也是大多数人所知道的一种说法。实际上, 广义的二分查找是将问 题的规模缩小到原有的一半。类似的,三分法就是将问题规模缩小为原来的 1/3。
本文给大家带来的内容则是狭义地二分查找,如果想了解其他广义上的二分查找可以查看 我之前写的一篇博文 从老鼠试毒问题来看二分法
尽管二分查找的基本思想相对简单,但细节可以令人难以招架 ... — 高德纳
当乔恩·本特利将二分搜索问题布置给专业编程课的学生时,百分之 90 的学生在花费数小 时后还是无法给出正确的解答,主要因为这些错误程序在面对边界值的时候无法运行,或返 回错误结果。1988 年开展的一项研究显示,20 本教科书里只有 5 本正确实现了二分搜索 。不仅如此,本特利自己 1986 年出版的《编程珠玑》一书中的二分搜索算法存在整数溢出 的问题,二十多年来无人发现。Java 语言的库所实现的二分搜索算法中同样的溢出问题存 在了九年多才被修复。
可见二分查找并不简单, 本文就试图带你走近 ta,明白 ta 的底层逻辑,并提供模板帮助 大家写书 bug free 的二分查找代码。
大家可以看完讲义结合 LeetCode Book 二分查找练习一下

问题定义

给定一个由数字组成的有序数组 nums,并给你一个数字 target。问 nums 中是否存在 target。如果存在, 则返回其在 nums 中的索引。如果不存在,则返回 - 1。
这是二分查找中最简单的一种形式。当然二分查找也有很多的变形,这也是二分查找容易出 错,难以掌握的原因。
常见变体有:
  • 如果存在多个满足条件的元素,返回最左边满足条件的索引。
  • 如果存在多个满足条件的元素,返回最右边满足条件的索引。
  • 数组不是整体有序的。 比如先升序再降序,或者先降序再升序。
  • 将一维数组变成二维数组。
  • 。。。
接下来,我们逐个进行查看。

前提

  • 数组是有序的(如果无序,我们也可以考虑排序,不过要注意排序的复杂度)

术语

二分查找中使用的术语:
  • target —— 要查找的值
  • index —— 当前位置
  • l 和 r —— 左右指针
  • mid —— 左右指针的中点,用来确定我们应该向左查找还是向右查找的索引

常见题型

查找一个数

算法描述:
  • 先从数组的中间元素开始,如果中间元素正好是要查找的元素,则搜索过程结束;
  • 如果目标元素大于中间元素,则在数组大于中间元素的那一半中查找,而且跟开始一样从 中间元素开始比较。
  • 如果目标元素小于中间元素,则在数组小于中间元素的那一半中查找,而且跟开始一样从 中间元素开始比较。
  • 如果在某一步骤数组为空,则代表找不到。
复杂度分析
  • 平均时间复杂度: $O(logN)$
  • 最坏时间复杂度: $O(logN)$
  • 最优时间复杂度: $O(1)$
  • 空间复杂度
    • 迭代: $O(1)$
    • 递归: $O(logN)$(无尾调用消除)
后面的复杂度也是类似的,不再赘述。
这种搜索算法每一次比较都使搜索范围缩小一半,是典型的二分查找。
这个是二分查找中最简答的一种类型了,我们先来搞定它。 我们来一个具体的例子, 这样 方便大家增加代入感。假设 nums 为 [1,3,4,6,7,8,10,13,14], target 为 4·。
  • 刚开始数组中间的元素为 7
  • 7 > 4 ,由于 7 右边的数字都大于 7 ,因此不可能是答案。我们将范围缩写到了 7 的 左侧。
  • 此时中间元素为 3
  • 3 < 4,由于 3 左边的数字都小于 3 ,因此不可能是答案。我们将范围缩写到了 3 的右 侧。
  • 此时中间元素为 4,正好是我们要找的,返回其索引 2 即可。
如何将上面的算法转换为容易理解的可执行代码呢?就算是这样一个简简单单,朴实无华的 二分查找, 不同的人写出来的差别也是很大的。 如果没有一个思维框架指导你,那么你在 不同的时间可能会写出差异很大的代码。这样的话,你犯错的几率会大大增加。
这里给大家介绍一个我经常使用的思维框架和代码模板。

思维框架

** 首先定义搜索区间为 [left, right],注意是左右都闭合,之后会用到这个点 **
你可以定义别的搜索区间形式,不过后面的代码也相应要调整,感兴趣的可以试试别的搜 索区间。
  • 由于定义的搜索区间为 [left, right],因此当 left <= right 的时候,搜索区间都不 为空,此时我们都需要继续搜索。 也就是说终止搜索条件应该为 left <= right。
举个例子容易明白一点。 比如对于区间 [4,4],其包含了一个元素 4,因此搜索区间不 为空,需要继续搜索(试想 4 恰好是我们要找的 target,如果不继续搜索, 会错过正 确答案)。而当搜索区间为 [left, right) 的时候,同样对于 [4,4],这个时候搜索区 间却是空的,因为这样的一个区间不存在任何数字·。
  • 循环体内,我们不断计算 mid ,并将 nums[mid] 与 目标值比对。
    • 如果 nums[mid] 等于目标值, 则提前返回 mid(只需要找到一个满足条件的即可)
    • 如果 nums[mid] 小于目标值, 说明目标值在 mid 右侧,这个时候搜索区间可缩小为 [mid + 1, right] (mid 以及 mid 左侧的数字被我们排除在外)
    • 如果 nums[mid] 大于目标值, 说明目标值在 mid 左侧,这个时候搜索区间可缩小为 [left, mid - 1] (mid 以及 mid 右侧的数字被我们排除在外)
  • 循环结束都没有找到,则说明找不到,返回 -1 表示未找到。

代码模板

Java
1
public int binarySearch(int[] nums, int target) {
2
// 左右都闭合的区间 [l, r]
3
int left = 0;
4
int right = nums.length - 1;
5
6
while(left <= right) {
7
int mid = left + (right - left) / 2;
8
if(nums[mid] == target)
9
return mid;
10
if (nums[mid] < target)
11
// 搜索区间变为 [mid+1, right]
12
left = mid + 1;
13
if (nums[mid] > target)
14
// 搜索区间变为 [left, mid - 1]
15
right = mid - 1;
16
}
17
return -1;
18
}
Copied!
Python
1
def binarySearch(nums, target):
2
# 左右都闭合的区间 [l, r]
3
l, r = 0, len(nums) - 1
4
while l <= r:
5
mid = (left + right) >> 1
6
if nums[mid] == target: return mid
7
# 搜索区间变为 [mid+1, right]
8
if nums[mid] < target: l = mid + 1
9
# 搜索区间变为 [left, mid - 1]
10
if nums[mid] > target: r = mid - 1
11
return -1
Copied!
JavaScript
1
function binarySearch(nums, target) {
2
let left = 0;
3
let right = nums.length - 1;
4
while (left <= right) {
5
const mid = Math.floor(left + (right - left) / 2);
6
if (nums[mid] == target) return mid;
7
if (nums[mid] < target)
8
// 搜索区间变为 [mid+1, right]
9
left = mid + 1;
10
if (nums[mid] > target)
11
// 搜索区间变为 [left, mid - 1]
12
right = mid - 1;
13
}
14
return -1;
15
}
Copied!
C++
1
int binarySearch(vector<int>& nums, int target){
2
if(nums.size() == 0)
3
return -1;
4
5
int left = 0, right = nums.size() - 1;
6
while(left <= right){
7
int mid = left + ((right - left) >> 1);
8
if(nums[mid] == target){ return mid; }
9
// 搜索区间变为 [mid+1, right]
10
else if(nums[mid] < target)
11
left = mid + 1;
12
// 搜索区间变为 [left, mid - 1]
13
else
14
right = mid - 1;
15
}
16
return -1;
17
}
Copied!

寻找最左边的满足条件的值

查找一个数类似, 我们仍然套用查找一个数的思维框架和代码模板。

思维框架

  • 首先定义搜索区间为 [left, right],注意是左右都闭合,之后会用到这个点。
  • 终止搜索条件为 left <= right。
  • 循环体内,我们不断计算 mid ,并将 nums[mid] 与 目标值比对。
    • 如果 nums[mid] 等于目标值, 则收缩右边界,我们找到了一个备胎,继续看看左边还 有没有了(注意这里不一样
    • 如果 nums[mid] 小于目标值, 说明目标值在 mid 右侧,这个时候搜索区间可缩小为 [mid + 1, right]
    • 如果 nums[mid] 大于目标值, 说明目标值在 mid 左侧,这个时候搜索区间可缩小为 [left, mid - 1]
  • 由于不会提前返回,因此我们需要检查最终的 left,看 nums[left]是否等于 target。
    • 如果不等于 target,或者 left 出了右边边界了,说明至死都没有找到一个备胎,则 返回 -1.
    • 否则返回 left 即可,备胎转正。

代码模板

实际上 nums[mid] > target 和 nums[mid] == target 是可以合并的。我这里为了清晰 ,就没有合并,大家熟悉之后合并起来即可。
Java
1
public int binarySearchLeft(int[] nums, int target) {
2
// 搜索区间为 [left, right]
3
int left = 0;
4
int right = nums.length - 1;
5
while (left <= right) {
6
int mid = left + (right - left) / 2;
7
if (nums[mid] < target) {
8
// 搜索区间变为 [mid+1, right]
9
left = mid + 1;
10
}
11
if (nums[mid] > target) {
12
// 搜索区间变为 [left, mid-1]
13
right = mid - 1;
14
}
15
if (nums[mid] == target) {
16
// 收缩右边界
17
right = mid - 1;
18
}
19
}
20
// 检查是否越界
21
if (left >= nums.length || nums[left] != target)
22
return -1;
23
return left;
24
}
Copied!
Python
1
def binarySearchLeft(nums, target):
2
# 左右都闭合的区间 [l, r]
3
l, r = 0, len(nums) - 1
4
while l <= r:
5
mid = (l + r) >> 1
6
if nums[mid] == target:
7
# 收缩右边界
8
r = mid - 1;
9
# 搜索区间变为 [mid+1, right]
10
if nums[mid] < target: l = mid + 1
11
# 搜索区间变为 [left, mid - 1]
12
if nums[mid] > target: r = mid - 1
13
if l >= len(nums) or nums[l] != target: return -1
14
return l
Copied!
JavaScript
1
function binarySearchLeft(nums, target) {
2
let left = 0;
3
let right = nums.length - 1;
4
while (left <= right) {
5
const mid = Math.floor(left + (right - left) / 2);
6
if (nums[mid] == target)
7
// 收缩右边界
8
right = mid - 1;
9
if (nums[mid] < target)
10
// 搜索区间变为 [mid+1, right]
11
left = mid + 1;
12
if (nums[mid] > target)
13
// 搜索区间变为 [left, mid - 1]
14
right = mid - 1;
15
}
16
// 检查是否越界
17
if (left >= nums.length || nums[left] != target) return -1;
18
return left;
19
}
Copied!
C++
1
int binarySearchLeft(vector<int>& nums, int target) {
2
// 搜索区间为 [left, right]
3
int left = 0, right = nums.size() - 1;
4
while (left <= right) {
5
int mid = left + ((right - left) >> 1);
6
if (nums[mid] == target) {
7
// 收缩右边界
8
right = mid - 1;
9
}
10
if (nums[mid] < target) {
11
// 搜索区间变为 [mid+1, right]
12
left = mid + 1;
13
}
14
if (nums[mid] > target) {
15
// 搜索区间变为 [left, mid-1]
16
right = mid - 1;
17
}
18
}
19
// 检查是否越界
20
if (left >= nums.size() || nums[left] != target)
21
return -1;
22
return left;
23
}
Copied!

例题解析

给你一个严格递增的数组 nums ,让你找到第一个满足 nums[i] == i 的索引,如果没有这 样的索引,返回 -1。(你的算法需要有 logN 的复杂度)。
首先我们做一个小小的变换,将原数组 nums 转换为 A,其中 A[i] = nums[i] - i。这样 新的数组 A 就是一个不严格递增的数组。这样原问题转换为 在一个不严格递增的数组 A 中找第一个等于 0 的索引。接下来,我们就可以使用最左满足模板,找到最左满足 nums[i] == i 的索引。
代码:
1
class Solution:
2
def solve(self, nums):
3
l, r = 0, len(nums) - 1
4
while l <= r:
5
mid = (l + r) // 2
6
if nums[mid] >= mid:
7
r = mid - 1
8
else:
9
l = mid + 1
10
return l if l < len(nums) and nums[l] == l else -1
Copied!

寻找最右边的满足条件的值

查找一个数类似, 我们仍然套用查找一个数的思维框架和代码模板。
有没有感受到框架和模板的力量?

思维框架

  • 首先定义搜索区间为 [left, right],注意是左右都闭合,之后会用到这个点。
你可以定义别的搜索区间形式,不过后面的代码也相应要调整,感兴趣的可以试试别的搜 索区间。
  • 由于我们定义的搜索区间为 [left, right],因此当 left <= right 的时候,搜索区间 都不为空。 也就是说我们的终止搜索条件为 left <= right。
举个例子容易明白一点。 比如对于区间 [4,4],其包含了一个元素 4,因此搜索区间不 为空。而当搜索区间为 [left, right) 的时候,同样对于 [4,4],这个时候搜索区间却 是空的。
  • 循环体内,我们不断计算 mid ,并将 nums[mid] 与 目标值比对。
    • 如果 nums[mid] 等于目标值, 则收缩左边界,我们找到了一个备胎,继续看看右边还 有没有了
    • 如果 nums[mid] 小于目标值, 说明目标值在 mid 右侧,这个时候搜索区间可缩小为 [mid + 1, right]
    • 如果 nums[mid] 大于目标值, 说明目标值在 mid 左侧,这个时候搜索区间可缩小为 [left, mid - 1]
  • 由于不会提前返回,因此我们需要检查最终的 right,看 nums[right]是否等于 target。
    • 如果不等于 target,或者 right 出了左边边界了,说明至死都没有找到一个备胎,则 返回 -1.
    • 否则返回 right 即可,备胎转正。

代码模板

实际上 nums[mid] < target 和 nums[mid] == target 是可以合并的。我这里为了清晰 ,就没有合并,大家熟悉之后合并起来即可。
Java
1
public int binarySearchRight(int[] nums, int target) {
2
// 搜索区间为 [left, right]
3
int left = 0
4
int right = nums.length - 1;
5
while (left <= right) {
6
int mid = left + (right - left) / 2;
7
if (nums[mid] < target) {
8
// 搜索区间变为 [mid+1, right]
9
left = mid + 1;
10
}
11
if (nums[mid] > target) {
12
// 搜索区间变为 [left, mid-1]
13
right = mid - 1;
14
}
15
if (nums[mid] == target) {
16
// 收缩左边界
17
left = mid + 1;
18
}
19
}
20
// 检查是否越界
21
if (right < 0 || nums[right] != target)
22
return -1;
23
return right;
24
}
Copied!
Python
1
def binarySearchRight(nums, target):
2
# 左右都闭合的区间 [l, r]
3
l, r = 0, len(nums) - 1
4
while l <= r:
5
mid = (l + r) >> 1
6
if nums[mid] == target:
7
# 收缩左边界
8
l = mid + 1;
9
# 搜索区间变为 [mid+1, right]
10
if nums[mid] < target: l = mid + 1
11
# 搜索区间变为 [left, mid - 1]
12
if nums[mid] > target: r = mid - 1
13
if r < 0 or nums[r] != target: return -1
14
return r
Copied!
JavaScript
1
function binarySearchRight(nums, target) {
2
let left = 0;
3
let right = nums.length - 1;
4
while (left <= right) {
5
const mid = Math.floor(left + (right - left) / 2);
6
if (nums[mid] == target)
7
// 收缩左边界
8
left = mid + 1;
9
if (nums[mid] < target)
10
// 搜索区间变为 [mid+1, right]
11
left = mid + 1;
12
if (nums[mid] > target)
13
// 搜索区间变为 [left, mid - 1]
14
right = mid - 1;
15
}
16
// 检查是否越界
17
if (right < 0 || nums[right] != target) return -1;
18
return right;
19
}
Copied!
C++
1
int binarySearchRight(vector<int>& nums, int target) {
2
// 搜索区间为 [left, right]
3
int left = 0, right = nums.size() - 1;
4
while (left <= right) {
5
int mid = left + ((right - left) >> 1);
6
if (nums[mid] == target) {
7
// 收缩左边界
8
left = mid + 1;
9
}
10
if (nums[mid] < target) {
11
// 搜索区间变为 [mid+1, right]
12
left = mid + 1;
13
}
14
if (nums[mid] > target) {
15
// 搜索区间变为 [left, mid-1]
16
right = mid - 1;
17
}
18
}
19
// 检查是否越界
20
if (right < 0 || nums[right] != target)
21
return -1;
22
return right;
23
}
Copied!

寻找最左插入位置

上面我们讲了寻找最左满足条件的值。如果找不到,就返回 -1。那如果我想让你找不到 不是返回 -1,而是应该插入的位置,使得插入之后列表仍然有序呢?
比如一个数组 nums: [1,3,4],target 是 2。我们应该将其插入(注意不是真的插入)的 位置是索引 1 的位置,即 [1,2,3,4]。因此寻找最左插入位置应该返回 1, 而寻找最左满足条件 应该返回-1。
另外如果有多个满足条件的值,我们返回最左侧的。 比如一个数组 nums: [1,2,2,2,3,4],target 是 2,我们应该插入的位置是 1。

思维框架

如果你将寻找最左插入位置看成是寻找最左满足大于等于 x 的值,那就可以和前 面的知识产生联系,使得代码更加统一。唯一的区别点在于前面是最左满足等于 x,这 里是最左满足大于等于 x
具体算法:
  • 首先定义搜索区间为 [left, right],注意是左右都闭合,之后会用到这个点。
你可以定义别的搜索区间形式,不过后面的代码也相应要调整,感兴趣的可以试试别的搜 索区间。
  • 由于我们定义的搜索区间为 [left, right],因此当 left <= right 的时候,搜索区间 都不为空。 也就是说我们的终止搜索条件为 left <= right。
  • 当 A[mid] >= x,说明找到一个备胎,我们令 r = mid - 1 将 mid 从搜索区间排除,继 续看看有没有更好的备胎。
  • 当 A[mid] < x,说明 mid 根本就不是答案,直接更新 l = mid + 1,从而将 mid 从搜 索区间排除。
  • 最后搜索区间的 l 就是最好的备胎,备胎转正。

代码模板

Python
1
def bisect_left(A, x):
2
# 内置 api
3
bisect.bisect_left(A, x)
4
# 手写
5
l, r = 0, len(A) - 1
6
while l <= r:
7
mid = (l + r) // 2
8
if A[mid] >= x: r = mid - 1
9
else: l = mid + 1
10
return l
Copied!
其他语言暂时空缺,欢迎 PR

寻找最右插入位置

思维框架

如果你将寻找最右插入位置看成是寻找最右满足大于 x 的值,那就可以和前面的 知识产生联系,使得代码更加统一。唯一的区别点在于前面是最左满足等于 x,这里 是最左满足大于 x
具体算法:
  • 首先定义搜索区间为 [left, right],注意是左右都闭合,之后会用到这个点。
你可以定义别的搜索区间形式,不过后面的代码也相应要调整,感兴趣的可以试试别的搜 索区间。
  • 由于我们定义的搜索区间为 [left, right],因此当 left <= right 的时候,搜索区间 都不为空。 也就是说我们的终止搜索条件为 left <= right。
  • 当 A[mid] > x,说明找到一个备胎,我们令 r = mid - 1 将 mid 从搜索区间排除,继 续看看有没有更好的备胎。
  • 当 A[mid] <= x,说明 mid 根本就不是答案,直接更新 l = mid + 1,从而将 mid 从搜 索区间排除。
  • 最后搜索区间的 l 就是最好的备胎,备胎转正。

代码模板

Python
1
def bisect_right(A, x):
2
# 内置 api
3
bisect.bisect_right(A, x)
4
# 手写
5
l, r = 0, len(A) - 1
6
while l <= r:
7
mid = (l + r) // 2
8
if A[mid] <= x: l = mid + 1
9
else: r = mid - 1
10
return l # 或者返回 r + 1
Copied!
其他语言暂时空缺,欢迎 PR

局部有序(先降后升或先升后降)

LeetCode 有原题 33. 搜索旋转排序数组81. 搜索旋转排序数组 II, 我们直接拿过来讲解好了。
其中 81 题是在 33 题的基础上增加了包含重复元素的可能,实际上 33 题的进阶就是 81 题。通过这道题,大家可以感受到”包含重复与否对我们算法的影响“。 我们直接上最复 杂的 81 题,这个会了,可以直接 AC 第 33 题。

81. 搜索旋转排序数组 II

题目描述
1
假设按照升序排序的数组在预先未知的某个点上进行了旋转。
2
3
( 例如,数组 [0,0,1,2,2,5,6] 可能变为 [2,5,6,0,0,1,2] )。
4
5
编写一个函数来判断给定的目标值是否存在于数组中。若存在返回 true,否则返回 false。
6
7
示例 1:
8
9
输入: nums = [2,5,6,0,0,1,2], target = 0
10
输出: true
11
示例 2:
12
13
输入: nums = [2,5,6,0,0,1,2], target = 3
14
输出: false
15
进阶:
16
17
这是 搜索旋转排序数组 的延伸题目,本题中的 nums 可能包含重复元素。
18
这会影响到程序的时间复杂度吗?会有怎样的影响,为什么?
Copied!
思路
这是一个我在网上看到的前端头条技术终面的一个算法题。我们先不考虑重复元素。
题目要求时间复杂度为 logn,因此基本就是二分法了。 这道题目不是直接的有序数组,不 然就是 easy 了。
首先要知道,我们随便选择一个点,将数组分为前后两部分,其中一部分一定是有序的。
具体步骤:
  • 我们可以先找出 mid,然后根据 mid 来判断,mid 是在有序的部分还是无序的部分
假如 mid 小于 start,则 mid 一定在右边有序部分,即 [mid,end] 部分有序。假如 mid 大于 start,则 mid 一定在左边有序部分,即 [start,mid]部分有序。这是这类题目的 突破口。
注意我没有考虑等号,之后我会讲。
  • 然后我们继续判断 target 在哪一部分, 就可以舍弃另一部分了。
也就是说只需要比较 target 和有序部分的边界关系就行了。 比如 mid 在右侧有序部 分,即[mid,end] 有序。那么我们只需要判断 target >= mid && target <= end 就能知道 target 在右侧有序部分,我们就可以舍弃左边部分了(通过 start = mid + 1 实现), 反 之亦然。
我们以([6,7,8,1,2,3,4,5], 4)为例讲解一下:
接下来,我们考虑重复元素的问题。如果存在重复数字,就可能会发生 nums[mid] == nums[start] 了,比如 30333 。这个时候可以选择舍弃 start,也就是 start 右移一位。 有的同学会担心”会不会错失目标元素?“。其实这个担心是多余的,前面我们已经介绍了” 搜索区间“。由于搜索区间同时包含 start 和 mid ,因此去除一个 start ,我们还有 mid。假如 3 是我们要找的元素, 这样进行下去绝对不会错过,而是收缩”搜索区间“到一 个元素 3 ,我们就可以心安理得地返回 3 了。
代码(Python)
1
class Solution:
2
def search(self, nums, target):
3
l, r = 0, len(nums)-1
4
while l <= r:
5
mid = l + (r-l)//2
6
if nums[mid] == target:
7
return True
8
while l < mid and nums[l] == nums[mid]: # tricky part
9
l += 1
10
# the first half is ordered
11
if nums[l] <= nums[mid]:
12
# target is in the first half
13
if nums[l] <= target < nums[mid]:
14
r = mid - 1
15
else:
16
l = mid + 1
17
# the second half is ordered
18
else:
19
# target is in the second half
20
if nums[mid] < target <= nums[r]:
21
l = mid + 1
22
else:
23
r = mid - 1
24
return False
Copied!
复杂度分析
  • 时间复杂度:$O(log N)$
  • 空间复杂度:$O(1)$
扩展
如果题目不是让你返回 true 和 false,而是返回最左/最右等于 targrt 的索引呢?这不 就又和前面的知识建立联系了么?比如我让你在一个旋转数组中找最左等于 target 的索引 ,其实就是 面试题 10.03. 搜索旋转数组
思路和前面的最左满足类似,仍然是通过压缩区间,更新备胎,最后返回备胎的方式来实现 。 具体看代码吧。
Python Code:
1
class Solution:
2
def search(self, nums: List[int], target: int) -> int:
3
l, r = 0, len(nums) - 1
4
while l <= r:
5
mid = l + (r - l) // 2
6
# # the first half is ordered
7
if nums[l] < nums[mid]:
8
# target is in the first half
9
if nums[l] <= target <= nums[mid]:
10
r = mid - 1
11
else:
12
l = mid + 1
13
# # the second half is ordered
14
elif nums[l] > nums[mid]:
15
# target is in the second half
16
if nums[l] <= target or target <= nums[mid]:
17
r = mid - 1
18
else:
19
l = mid + 1
20
elif nums[l] == nums[mid]:
21
if nums[l] != target:
22
l += 1
23
else:
24
# l 是一个备胎
25
r = l - 1
26
return l if l < len(nums) and nums[l] == target else -1
Copied!

二维数组

二维数组的二分查找和一维没有本质区别, 我们通过两个题来进行说明。

74. 搜索二维矩阵

题目地址
https://leetcode-cn.com/problems/search-a-2d-matrix/
题目描述
1
编写一个高效的算法来判断 m x n 矩阵中,是否存在一个目标值。该矩阵具有如下特性:
2
3
每行中的整数从左到右按升序排列。
4
每行的第一个整数大于前一行的最后一个整数。
5
示例 1:
6
7
输入:
8
matrix = [
9
[1, 3, 5, 7],
10
[10, 11, 16, 20],
11
[23, 30, 34, 50]
12
]
13
target = 3
14
输出: true
15
示例 2:
16
17
输入:
18
matrix = [
19
[1, 3, 5, 7],
20
[10, 11, 16, 20],
21
[23, 30, 34, 50]
22
]
23
target = 13
24
输出: false
Copied!
思路
简单来说就是将一个一维有序数组切成若干长度相同的段,然后将这些段拼接成一个二维数 组。你的任务就是在这个拼接成的二维数组中找到 target。
需要注意的是,数组是不存在重复元素的。
如果有重复元素,我们该怎么办?
算法:
  • 选择矩阵左下角作为起始元素 Q
  • 如果 Q > target,右方和下方的元素没有必要看了(相对于一维数组的右边元素)
  • 如果 Q < target,左方和上方的元素没有必要看了(相对于一维数组的左边元素)
  • 如果 Q == target ,直接 返回 True
  • 交回了都找不到,返回 False
代码(Python)
1
2
class Solution:
3
def searchMatrix(self, matrix: List[List[int]], target: int) -> bool:
4
m = len(matrix)
5
if m == 0:
6
return False
7
n = len(matrix[0])
8
9
x = m - 1
10
y = 0
11
while x >= 0 and y < n:
12
if matrix[x][y] > target:
13
x -= 1
14
elif matrix[x][y] < target:
15
y += 1
16
else:
17
return True
18
return False
Copied!
复杂度分析
  • 时间复杂度:最坏的情况是只有一行或者只有一列,此时时间复杂度为 $O(M * N)$。更 多的情况下时间复杂度为 $O(M + N)$
  • 空间复杂度:$O(1)$
力扣 240. 搜索二维矩阵 II 发生了一点变化,不再是每行的第一个整数大于前一行的最后一个整数,而是 每列的元素从上到下升序排列。我们仍然可以选择左下进行二分。

寻找最值(改进的二分)

上面全部都是找到给定值,这次我们试图寻找最值(最小或者最大)。我们以最小为例,讲 解一下这种题如何切入。
153. 寻找旋转排序数组中的最小值
题目地址
https://leetcode-cn.com/problems/find-minimum-in-rotated-sorted-array/
题目描述
1
假设按照升序排序的数组在预先未知的某个点上进行了旋转。
2
3
( 例如,数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。
4
5
请找出其中最小的元素。
6
7
你可以假设数组中不存在重复元素。
8
9
示例 1:
10
11
输入: [3,4,5,1,2]
12
输出: 1
13
示例 2:
14
15
输入: [4,5,6,7,0,1,2]
16
输出: 0
Copied!
二分法
思路
和查找指定值得思路一样。我们还是:
  • 初始化首尾指针 l 和 r
  • 如果 nums[mid] 大于 nums[r],说明 mid 在左侧有序部分,由于最小的一定在右侧,因 此可以收缩左区间,即 l = mid + 1
  • 否则收缩右侧,即 r = mid(不可以 r = mid - 1)
这里多判断等号没有意义,因为题目没有让我们找指定值
  • 当 l >= r 或者 nums[l] < nums[r] 的时候退出循环
nums[l] < nums[r],说明区间 [l, r] 已经是整体有序了,因此 nums[l] 就是我们想要 找的
代码(Python)
1
2
class Solution:
3
def findMin(self, nums: List[int]) -> int:
4
l, r = 0, len(nums) - 1
5
6
while l < r:
7
# important
8
if nums[l] < nums[r]:
9
return nums[l]
10
mid = (l + r) // 2
11
# left part
12
if nums[mid] > nums[r]:
13
l = mid + 1
14
else:
15
# right part
16
r = mid
17
# l or r is not important
18
return nums[l]
Copied!
复杂度分析
  • 时间复杂度:$O(log N)$
  • 空间复杂度:$O(1)$
另一种二分法
思路
我们当然也也可以和 nums[l] 比较,而不是上面的 nums[r],我们发现:
  • 旋转点左侧元素都大于数组第一个元素
  • 旋转点右侧元素都小于数组第一个元素
这样就建立了 nums[mid] 和 nums[0] 的联系。
具体算法:
  1. 1.
    找到数组的中间元素 mid。
  2. 2.
    如果中间元素 > 数组第一个元素,我们需要在 mid 右边搜索。
  • 如果中间元素 <= 数组第一个元素,我们需要在 mid 左边搜索。
上面的例子中,中间元素 6 比第一个元素 4 大,因此在中间点右侧继续搜索。
  1. 1.
    当我们找到旋转点时停止搜索,当以下条件满足任意一个即可:
  • nums[mid] > nums[mid + 1],因此 mid+1 是最小值。
  • nums[mid - 1] > nums[mid],因此 mid 是最小值。
代码(Python)
1
class Solution:
2
def findMin(self, nums):
3
# If the list has just one element then return that element.
4
if len(nums) == 1:
5
return nums[0]
6
7
# left pointer
8
left = 0
9
# right pointer
10
right = len(nums) - 1
11
12
# if the last element is greater than the first element then there is no rotation.
13
# e.g. 1 < 2 < 3 < 4 < 5 < 7. Already sorted array.
14
# Hence the smallest element is first element. A[0]
15
if nums[right] > nums[0]:
16
return nums[0]
17
18
# Binary search way
19
while right >= left:
20
# Find the mid element
21
mid = left + (right - left) / 2
22
# if the mid element is greater than its next element then mid+1 element is the smallest
23
# This point would be the point of change. From higher to lower value.
24
if nums[mid] > nums[mid + 1]:
25
return nums[mid + 1]
26
# if the mid element is lesser than its previous element then mid element is the smallest
27
if nums[mid - 1] > nums[mid]:
28
return nums[mid]
29
30
# if the mid elements value is greater than the 0th element this means
31
# the least value is still somewhere to the right as we are still dealing with elements greater than nums[0]
32
if nums[mid] > nums[0]:
33
left = mid + 1
34
# if nums[0] is greater than the mid value then this means the smallest value is somewhere to the left
35
else:
36
right = mid - 1
Copied!
复杂度分析
  • 时间复杂度:$O(log N)$
  • 空间复杂度:$O(1)$

二叉树

对于一个给定的二叉树,其任意节点最多只有两个子节点。 从这个定义,我们似乎可以嗅 出一点二分法的味道, 但是这并不是二分。但是,二叉树中却和二分有很多联系,我们来 看一下。
最简单的,如果这个二叉树是一个二叉搜索树(BST)。 那么实际上,在一个二叉搜索树种 进行搜索的过程就是二分法。
如上图,我们需要在这样一个二叉搜索树中搜索 7。那么我们的搜索路径则会是 8 -> 3 -> 6 -> 7,这也是一种二分法。只不过相比于普通的有序序列查找给定值二分, 其时间 复杂度的下界更差,原因在于二叉搜索树并不一定是二叉平衡树。
上面讲了二叉搜索树,我们再来看一种同样特殊的树 - 完全二叉树。 如果我们给一颗完全 二叉树的所有节点进行编号(二进制),依次为 01,10,11, ...。
那么实际上,最后一行的编号就是从根节点到该节点的路径。 其中 0 表示向左, 1 表示 向右。(第一位数字不用)。 我们以最后一行的 101 为例,我们需要执行一次左,然后一次 右。
其实原理也不难,如果你用数组表示过完全二叉树,那么就很容易理解。 我们可以发现,左节点的编号都是父节点的二倍,并且右节点都是父节点的二倍 + 1。从二进制的角度来看就是:父节点的编号左移一位就是左节点的编号,左移一位 + 1 就是右节点的编号。 因此反过来, 知道了子节点的最后一位,我们就能知道它是父节点的左节点还是右节点啦。

题目推荐

后面三个题建议一起做

总结

二分查找是一种非常重要且难以掌握的核心算法,大家一定要好好领会。有的题目直接二分 就可以了,有的题目二分只是其中一个环节。不管是哪种,都需要我们对二分的思想和代码 模板非常熟悉才可以。
二分查找的基本题型有:
  • 查找满足条件的元素,返回对应索引
  • 如果存在多个满足条件的元素,返回最左边满足条件的索引。
  • 如果存在多个满足条件的元素,返回最右边满足条件的索引。
  • 数组不是整体有序的。 比如先升序再降序,或者先降序再升序。
  • 将一维数组变成二维数组。
  • 局部有序查找最大(最小)元素
  • 。。。
不管是哪一种类型,我们的思维框架都是类似的,都是:
  • 先定义搜索区间(非常重要)
  • 根据搜索区间定义循环结束条件
  • 取中间元素和目标元素做对比(目标元素可能是需要找的元素或者是数组第一个,最后一 个元素等)(非常重要)
  • 根据比较的结果收缩区间,舍弃非法解(也就是二分)
如果是整体有序通常只需要 nums[mid] 和 target 比较即可。如果是局部有序,则可能 需要与其周围的特定元素进行比较。
大家可以使用这个思维框架并结合本文介绍的几种题型进行练习,必要的情况可以使用我提 供的解题模板,提供解题速度的同时,有效地降低出错的概率。
特别需要注意的是有无重复元素对二分算法影响很大,我们需要小心对待。