Redian新闻
>
进阶分享|做算法题的特别技巧及思路

进阶分享|做算法题的特别技巧及思路

公众号新闻

前言

众所周知,算法题主要有两大难点。

一是「实现」,即算法本身的难度。

二是「思路」,代表你能否想到使用这个算法来解决题目。

并且对于有一定刷题基础的同学来说,力扣上大部分简单、中等题所涉及的算法都是非常常见的算法,即算法本身不存在难度,最大的难点在于「思路」,即如何想到适合本题的算法。

而解决「思路」问题,除了大量刷题积累经验之外,还可以采用一定的「巧劲」,从时间复杂度这个角度入手筛选出合适的算法。本文的主要目的就是向大家介绍这种「巧劲」是如何在具体解题过程中发挥作用的,会分成三个部分带大家介绍~(码住收藏吧)

如何判断时间复杂度

如何确定一道题合适的时间复杂度?最简单、快捷的方式就是通过观察题目中的数据范围来确定。

不过你可能马上会反驳,力扣上并不是所有题目都有数据范围,那又该如何确定?在没有数据范围的情况下也可以采用这种方式来思考,我们会在后续「练习」部分进行详细说明。

言归正传,如何通过数据范围来确定合适的时间复杂度?

通常来说,在力扣上,Python 可以支持到 10*7 的时间复杂度;C++ 会稍微多一点,大概 10*7 - 10*8 之间。因此我们可以得到如下表所示的,数据范围与算法大致时间复杂度的对应表。

复杂度总结

此处有两点需要注意:

1. 上图仅列出了时间复杂度较为固定的常见算法,而类似于动态规划、贪心、暴力等时间复杂度百变多样的算法并未列出。

2. O(logn) 的算法通常与 O(n) 的算法组合在一起,用于实现 O(nlogn) 要求的题目。

练习

在讲解具体题目之前,我们先明确下根据时间复杂度做题的具体流程:

1. 根据数据范围选择时间复杂度

2. 根据时间复杂度选择对应的常见算法集合

3. 思考题目特征,从集合中选出合适的算法

4. 根据选出的算法求解题目

例如下道题解

👉 1248. 统计「优美子数组」

题目描述:

给你一个整数数组 nums 和一个整数 k。如果某个连续子数组中恰好有 k 个奇数数字,我们就认为这个子数组是「优美子数组」。请返回这个数组中 「优美子数组」 的数目。

示例 1:

输入:nums = [1,1,2,1,1], k = 3输出:2解释:包含 3 个奇数的子数组是 [1,1,2,1][1,2,1,1]


示例 2:

输入:nums = [2,4,6], k = 1输出:0解释:数列中不包含任何奇数,所以不存在优美子数组。

示例 3:

输入:nums = [2,2,2,1,2,2,1,2,2,2], k = 2输出:16

数据范围

1 <= nums.length <= 500001 <= nums[i] <= 10^51 <= k <= nums.length

解决过程:

  • 数据范围 => 时间复杂度

本题的数据范围到达了 50000,因此我们将时间复杂度划定在 O(n) 的范围内。

  • 时间复杂度 => 常见算法集合

根据上述「常见算法 & 时间复杂度」图,我们可以划定本题的算法集合。由于此题明显是数组上操作的问题,因此我们仅列出 O(n) 范围内关于数组的算法。
差分、前缀和、双指针、桶排序、单调栈、单调队列
  • 思考题目特征 => 从集合中选出合适算法
仔细观察题干,可以发现本题有两大关键特征:

1. 连续子数组

2. 子数组内恰好有 k 个奇数数字

如果对「前缀和」算法有所掌握的话,凭借这两大特征不难确定此题可以用「前缀和」求解。

令 sum[i] 表示数组第 0 个数到第 i 个数中奇数的个数,因此区间 [l, r] 符合题意,当且仅当下式成立:
sum[r]−sum[l−1]=k
由此我们可以令 mp[x] 表示有多少个节点 i 满足 sum[i] = x。然后从左向右枚举,当求得第 i 个点的 sum 值后,更新 mp[sum[i]] 数组,并计算有多少个 l 满足区间 [l, i] 符合题意。累加答案即可得到最终结果,具体实现可参看下述代码。

C++ 代码实现

class Solution {    vector<int> mp;public:    int numberOfSubarrays(vector<int>& nums, int k) {        int sum = 0, ans = 0, n = nums.size();        mp.resize(n + 2, 0);        mp[0] = 1;        for(auto y:nums){            if(y % 2) sum++;            mp[sum]++;            if(sum-k >= 0) ans += mp[sum-k];        }        return ans;    }};

例题 2:

👉 面试题 08.11. 硬币

题目描述

硬币。给定数量不限的硬币,币值为 25 分、10 分、5 分和 1 分,编写代码计算n分有几种表示法。(结果可能会很大,你需要将结果模上1000000007)。

示例 1

输入: n = 5输出:2解释: 有两种方式可以凑成总金额:5=55=1+1+1+1+1


示例 2

输入: n = 10输出:4解释: 有四种方式可以凑成总金额:10=1010=5+510=5+1+1+1+1+110=1+1+1+1+1+1+1+1+1+1


数据范围

0 <= n (总金额) <= 1000000

解决过程

  • 数据范围 => 时间复杂度

本题的数据范围到达了 1000000,因此我们将时间复杂度划定在 O(n) 的范围内。再仔细观察一下「常见算法 & 时间复杂度」图,可以发现由于只有 4 种面值的硬币,因此 O(nm) 的背包也是可行的。

  • 时间复杂度 => 常见算法集合

根据时间复杂度与「常见算法 & 时间复杂度」图,我们可以划定本题的算法集合。由于此题明显与图论、字符串等算法无关,因此我们仅列出 O(n) 、 O(nm) 范围内有一定可能性的算法。

差分、前缀和、双指针、桶排序、单调栈、单调队列、背包问题

思考题目特征 => 从集合中选出合适算法

仔细观察此题,可以发现如下几个特征:

1. 四类硬币

2. 每类硬币数量不限

3. 求组成 n 的方案数

如果对「动态规划」有一定熟悉度的话,基本可以确定此题就是「动态规划问题」,因此本题具有很明显的「子结构」性质。

然后再根据之前确定的时间复杂度 O(n) 、 O(nm) ,以及我们选出的算法,基本可以确定该动态规划问题的状态,只有如下两种:

1. f[i] 表示用四种硬币组成 i 分的方案数,属于典型线性 DP。

2. f[i][j] 表示用前 i 种硬币组成 j 分的方案数,属于背包问题。
再仔细思考两种状态的转移方程,可以发现第二种采用背包思路的 DP 状态更适合解决本题,且由于硬币个数不限,因此是经典的「完全背包」问题。所以我们可以直接列出如下的转移方程( coin[i] 表示第 i 类硬币的面值):
f[i][j] = f[i-1][j]f[i][j] = f[i][j] + f[i][j-coin[i]]

可以发现, f[i][j] 的数值主要由 f [i−1][j] 与 f[i][j−coin[j]] 得到,因此我们可以压缩掉第一维,即采用滚动数组的方法,得到如下方程:

f[j] = f[j] + f[j-coin[i]]

由于「完全背包」是背包问题中的经典模型,因此更具体的细节,大家可以参考下述代码。

C++代码实现

class Solution {    vector<int> f;    int coin[4] = {25, 10, 5, 1}, mod = 1e9+7;public:    int waysToChange(int n) {        f.resize(n + 2, 0);        f[0] = 1;        for(int i = 0; i < 4; i++)            for(int j = coin[i]; j <= n; j++)                f[j] = (f[j] + f[j-coin[i]]) % mod;        return f[n];    }};


总结
最后,我们来总结一下「数据范围」=> 「最终算法」的总体过程,如下图所示。
除此之外,还需注意,从「数据范围」入手思考「最终算法」只是获取题目思路的手段之一,并且在上述流程图中,「根据题目特征,筛选算法」是最为关键的步骤,这不仅要求做题者具有「挖掘题目特征」的能力,更要求做题者对于「常见算法」要有一定的熟悉度。
也正是因为这个原因,「常见算法 & 时间复杂度」对应图是具有个人特征的。每个人由于掌握的算法不同,「常见算法 & 时间复杂度」图也各不相同,因此希望大家能够有意识地构建属于自己的「常见算法 & 时间复杂度」图,并在刷题的过程中,不断更新,不断完善。力求能够在遇到自己掌握范围内的算法题时,一举击破。如果还是没有头绪,不妨试下下面的方法:
  • 学习一些更加复杂的算法

大家在做算法题时需要循序渐进,上来如果直接就做 hard 题有些耗时间,但并不是不能做,只是性价比很低,先做熟练较低难度的题目,熟练掌握所有算法之后相当于掌握了各种工具,当算法如臂使指时,做起 hard 题来就会得心应手。

如果对 DP、DFS、BFS,二分法很熟悉,我建议可以先从简单的数据结构开始,从队列、堆,二叉树到更复杂的红黑树、线段树,尽可能都可掌握。

这里推荐一本书 👉《图解算法数据结构》,这本书是由力扣平台知名创作者「Krahets」倾心打造,面向算法零基础学习者,以图文并茂的方式讲解算法基础知识与求职热门算法题。学完你将会掌握:

  1. 数据结构与算法的核心知识点

  2. 熟悉互联网笔面试的主要算法题型
  • 做提前思考时间复杂度

思考时间复杂度可以减少大量试错机会。如果你想出的算法在时间复杂度上无法满足题目给出的数据规模,那就说明算法还是有问题,需要思考更好的算法。有的时候,会有些模糊,比如刚好不过,或者差一点,那说明可能需要进行优化或剪枝。
  • 适当的查看官方题解,不要让自己卡太久

做出思考很久的题目的快感是很爽,但确也浪费时间,我们的建议是平衡好两者,思考一个小时后如果没有结果就看解答。事实上很多时候超过一个小时以后还没想出来最优解,就很难在短时间内想出来了。

总的来说,刷算法题有点像一个模拟经营游戏,要平衡好学习和做题的节奏,不能操之过急,也不能把节奏放的太慢。评论留言少 BUG !点赞转发不脱发!


BY / 

本文作者:力扣

编辑&版式:Janson

声明:本文归“力扣”版权所有,如需转载请联系。


点个在看,少个 bug

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
今日分享|享受过程【科研】手指静脉识别技术研究|收获一作论文与MIT导师推荐信!二十大日本宗教団体《杀戮之神》百老汇当红剧本沉浸式分享|11月拽马周年狂欢月剧本节福利|[11.10-11 周四周五]国内生活充满了政治今日分享|保持浪漫疫苗的副作用!干货分享|万字梳理食品品牌抖音电商数字化增长指南“电子榨菜”为什么下饭?边吃饭边看剧,真的特别香……丨夜听双语利润下降超60%,语音识别技术难成科大讯飞护城河内需问题的背后终究是经济深层体制问题:关于消费内需问题的一些看法告全国同胞书 彭载舟ZT经验分享|我在德国上语言班的一天“我在棺材上做算数...”小时候的社死经历有多离谱!今日分享|倔一点!今日分享|实际行动硬核之下的“温情”表达:公检法题材电视剧创作有哪些叙事转向?分享|香港金融业全面复苏,这些信号值得关注!心理学相关纪录片分享|iWanna资讯喜迎世界杯,乐高IDEAS 21337 桌式足球测评,一起来聊聊套装中一些值得关注的特别细节活动分享|开幕FIRST最佳,闭幕不可说!“特别巨大、特别重大、特别严重!”“硕鼠”徐宝义被公诉,通报中曾现罕见细节今日分享|轻松生活创始人说|做DTC品牌最可怕的事,就是以为自己有护城河咀外文嚼汉字(183)“Bazuru”与“爆紫热”意大利宣布人脸识别技术非法,但用于打击犯罪的除外vv分享|又一份双11囤货清单+好物分享我国发行7500亿元的特别国债真的很重要吗?老夫抖音开播了!100美元的特斯拉值得买入,200美元的特斯拉呢?基于无监督预训练的语音识别技术落地实践 火山语音表示有话要说今日分享|记得投资自己今日分享|延迟满足2023|做有意义的事活动分享|今年最重要的华语纪录影像作者,不容错过!宏景智驾校招:图像算法工程师、决策规划算法工程师、SLAM建图算法工程师等
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。