Redian新闻
>
华为开发者贡献 Linux 内核补丁,将核心内核函数速度提升 715 倍

华为开发者贡献 Linux 内核补丁,将核心内核函数速度提升 715 倍

公众号新闻

推荐关注↓

转自:OSC开源社区(ID:oschina2013)
Linux 6.2 近日合并了一个重要补丁,该补丁能够将一个核心内核函数速度提升 715 倍。
从合并的注释可知,贡献此补丁的维护者 Zhen Lei 来自华为,他将 kallsyms_lookup_name () 的平均查找性能提高了 715 倍,从而使内核里面旧实现的时间复杂度从 O (n) 升级到 O (log (n)),大幅减少查找时间,同时还保留了 /proc/kallsyms 上旧的实现支持。
kallsyms_lookup_name () 函数用于根据名称查找符号的地址,并可用于查找内核符号表中的任何符号。
Zhen Lei 曾在较早的补丁中描述了 kallsyms_lookup_name () 的优化思路:

目前,要搜索一个符号,我们需要将 'kallsyms_names' 中的符号一个一个展开,然后使用展开后的字符串进行比较。这种算法的时间复杂度是 O (n)。

如果我们像地址一样按升序对名称进行排序,则可以使用二分查找。这种算法的时间复杂度是 O (log (n))。

为了不改变 “/proc/kallsyms” 的实现,表 kallsyms_names [] 仍然按照升序与地址一一对应存储。

添加数组 kallsyms_seqs_of_names [],以排序后的 names 序号为索引,对应的内容为排序后的地址序号。例如:假设 NameX 在数组 kallsyms_seqs_of_names [] 中的索引为 'i',kallsyms_seqs_of_names [i] 的内容为 'k',则 NameX 对应的地址为 kallsyms_addresses [k]。kallsyms_names [] 中的偏移量是 get_symbol_offset (k)。

请注意,使用此方法内存使用量将增加 (4 * kallsyms_num_syms) 字节,接下来的两个补丁将减少 (1 * kallsyms_num_syms) 字节并正确处理 CONFIG_LTO_CLANG=y 的情况。

性能测试结果:(x86)

Before:

min=234, max=10364402, avg=5206926

min=267, max=11168517, avg=5207587

After:

min=1016, max=90894, avg=7272

min=1014, max=93470, avg=7293

kallsyms_lookup_name () 的平均查找性能提高了 715 倍。

因此,该补丁带来的唯一缺点是将内存占用量增加 3 * kallsyms_num_syms。
Linux 6.2 的模块代码还包含一个小的启动优化,将启动时间缩短了大约 30 毫秒。
相关链接:https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?id=3ba2c3ff98ea8bfb219288dbacf2a23a902c751b


- EOF -




推荐阅读  点击标题可跳转

0、极客专属:几十款程序员秒懂的卫衣

1、支付宝大整改,花呗、借呗退出江湖

2、从前,有两个卖水果的公司……

3、今年这情况,咱还是留个心眼吧!


关注「程序员的那些事」加星标,不错过圈内事

点赞和在看就是最大的支持❤️

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
硬核观察 #862 调查发现使用 Linux 的开发者比使用 MacOS 的更多从 Rust 调用 C 库函数 | Linux 中国研究了代码质量后,开发速度提高了 2 倍,bug 减少了 15 倍东胜物联发布AIoT开发者计划,将赋能和服务国内10000个网关开发者Linux赢了!2022年开发者使用率已达40%,甩macOS一大截|Stack Overflow文学城,老中们的精神养老院Linux 6.1 内核被批准为长期支持版本 | Linux 中国小米工程师提交优化补丁被批,Linux 内核维护者:太疯狂!Tea 筹集了 890 万美元,推出了一个帮助开源开发者获得报酬的新协议 | Linux 中国在 Mac 上运行 Linux 更进一步,Apple SoC CPUFreq 驱动即将并入 Linux 主线内核从打倒土豪劣绅到人人斗私批修新发!华裔女演员头像银币优化 Kubernetes 中的 Java 无服务器函数 | Linux 中国华为云发布冷启动加速解决方案:助力Serverless计算速度提升90%+JS最流行;Linux比macOS更受开发者喜爱...天赋“易昺(bǐng)”,创造历史!我用Lambda表达式写代码,开发速度提高了10倍!中国AI企业七年融资超7000亿元!美国投资者贡献超1/3平均查找性能提高了 715 倍,Linux 6.2 合并 华为 贡献的代码昨天上课的大妈的不寻常故事中国开发者整体规模 2016.37万,企业服务成为热门“移民”行业| InfoQ《开发者画像洞察研究报告 2022》发布Rosalía 登意大利版《VOGUE》封面!3行代码建模,训练速度提升200%?这款时序开源神器PaddleTS太强了!硬核观察 #848 Linux 6.1 发布,拉开 Rust 进入 Linux 内核的大幕Arch Linux 2023.01.01 版本 ISO 镜像发布:采用 Linux 内核 6.1小米工程师提交优化补丁被批,Linux内核维护者:太疯狂!球场不速客,圆头大尾狸虚函数,C++开发者如何有效利用?100亿参数的语言模型跑不动?MIT华人博士提出SmoothQuant量化,内存需求直降一半,速度提升1.56倍!让PyTorch创始人直呼「Amazing」的视频「脑补」,动态场景NeRF合成速度提升百倍GDC年度开发者调查报告:元宇宙为时尚早,大部分开发者不加班Linux 赢了!2022 年开发者使用率已达 40%,甩 macOS 一大截Linux内核收获一批新的Rust基础设施优化补丁明日直播:第 17 届中国 Linux 内核开发者大会Linux 内核 6.1 发布,包含初始 Rust 支持 | Linux 中国
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。