百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Linux环境下C++代码性能分析方法(linux怎么写c++代码)

myzbx 2025-04-30 18:22 76 浏览

技术背景

在开发C++应用程序时,找出代码中运行缓慢的部分是进行性能优化的关键。在Linux系统上,有多种工具和方法可用于对C++代码进行性能分析,每种方法都有其特点和适用场景。

实现步骤

手动中断调试法

  1. 在调试器(如gdb)中运行代码。
  2. 在代码运行缓慢时手动中断程序,查看调用栈(如使用backtrace命令)。
  3. 多次重复步骤2,若某段代码占用了一定比例的时间,那么在每次采样时就有相应概率捕获到它。
  4. 清理掉一个性能问题后,剩余问题所占比例会增大,更易发现。

使用Valgrind和Callgrind

  1. 编译程序时确保包含调试符号并进行优化:gcc -ggdb3 -O3 -std=c99 -Wall -Wextra -pedantic -o main.out main.c
  2. 使用Valgrind和Callgrind进行性能分析:valgrind --tool=callgrind --dump-instr=yes -v --instr-atstart=no ./binary > tmp
  3. 当程序开始执行需要分析的任务时,在另一个窗口开启性能分析:callgrind_control -i on
  4. 分析完成后,关闭性能分析并停止程序:callgrind_control -k
  5. 使用kcachegrind查看分析结果:kcachegrind callgrind.out.*

使用gprof

  1. 编译时添加-pg选项:gcc -pg -ggdb3 -O3 -std=c99 -Wall -Wextra -pedantic -o main.out main.c
  2. 运行程序:time ./main.out 10000,运行后会生成gmon.out文件。
  3. 可以使用gprof2dot生成图形化报告:
sudo apt install graphviz
python3 -m pip install --user gprof2dot
gprof main.out > main.gprof
gprof2dot < main.gprof | dot -Tsvg -o output.svg
  1. 也可以查看文本输出:gprof -b main.out

使用perf

  1. 安装linux-toolssudo apt install linux-tools-common linux-tools-generic
  2. 设置内核参数:
sudo sysctl kernel.perf_event_paranoid=-1 kernel.kptr_restrict=0
# 或者持久化设置
printf 'kernel.perf_event_paranoid = -1\nkernel.kptr_restrict = 0\n' | sudo tee -a /etc/sysctl.conf
  1. 收集数据:time perf record --call-graph dwarf ./main.out 10000,会生成perf.data文件。
  2. 交互式查看数据:perf report
  3. 还可以使用FlameGraph生成火焰图:
git clone https://github.com/brendangregg/FlameGraph
git -C FlameGraph/ checkout cd9ee4c4449775a2f867acf31c84b7fe4b132ad5
perf script | FlameGraph/stackcollapse-perf.pl | FlameGraph/flamegraph.pl > flamegraph.svg

使用gperftools

  1. 安装gperftoolssudo apt install google-perftools
  2. 运行时启用CPU分析器:
gcc -ggdb3 -O3 -std=c99 -Wall -Wextra -pedantic -o main.out main.c
LD_PRELOAD=/usr/lib/x86_64-linux-gnu/libprofiler.so CPUPROFILE=prof.out ./main.out 10000
  1. 或者在链接时集成:
gcc -Wl,--no-as-needed,-lprofiler,--as-needed -ggdb3 -O3 -std=c99 -Wall -Wextra -pedantic -o main.out main.c
CPUPROFILE=prof.out ./main.out 10000
  1. 使用kcachegrind查看分析结果:
google-pprof --callgrind main.out prof.out  > callgrind.out
kcachegrind callgrind.out
  1. 也可以生成图形化的SVG报告:google-pprof --web main.out prof.out,或者查看文本数据:google-pprof --text main.out prof.out

核心代码

以下是一个简单的测试程序示例,用于性能分析:

#include <inttypes.h>
#include <stdio.h>
#include <stdlib.h>

uint64_t __attribute__ ((noinline)) common(uint64_t n, uint64_t seed) {
    for (uint64_t i = 0; i < n; ++i) {
        seed = (seed * seed) - (3 * seed) + 1;
    }
    return seed;
}

uint64_t __attribute__ ((noinline)) fast(uint64_t n, uint64_t seed) {
    uint64_t max = (n / 10) + 1;
    for (uint64_t i = 0; i < max; ++i) {
        seed = common(n, (seed * seed) - (3 * seed) + 1);
    }
    return seed;
}

uint64_t __attribute__ ((noinline)) maybe_slow(uint64_t n, uint64_t seed, int is_slow) {
    uint64_t max = n;
    if (is_slow) {
        max *= 10;
    }
    for (uint64_t i = 0; i < max; ++i) {
        seed = common(n, (seed * seed) - (3 * seed) + 1);
    }
    return seed;
}

int main(int argc, char **argv) {
    uint64_t n, seed;
    if (argc > 1) {
        n = strtoll(argv[1], NULL, 0);
    } else {
        n = 1;
    }
    if (argc > 2) {
        seed = strtoll(argv[2], NULL, 0);
    } else {
        seed = 0;
    }
    seed += maybe_slow(n, seed, 0);
    seed += fast(n, seed);
    seed += maybe_slow(n, seed, 1);
    seed += fast(n, seed);
    seed += maybe_slow(n, seed, 0);
    seed += fast(n, seed);
    printf("%" PRIX64 "\n", seed);
    return EXIT_SUCCESS;
}

最佳实践

  • 对于简单的性能问题排查,可以先使用手动中断调试法,快速定位可能存在问题的代码段。
  • 对于需要详细分析函数调用关系和时间消耗的情况,可使用gprofValgrind + Callgrindperf
  • 对于多线程程序,perfIntel VTune能更好地处理线程间的交互和调度。
  • 对于大规模项目,可结合多种工具进行全面的性能分析。

常见问题

Valgrind性能分析时程序运行缓慢

Valgrind运行程序时会通过其虚拟机,导致程序运行速度大幅下降,对于大型工作负载,这种影响更为明显。可在程序执行关键任务时再开启性能分析。

gprof输出缺少函数

gprof采用采样和插桩相结合的方式,在优化编译(如-O3)时,某些函数可能因为执行速度过快而未被采样到,导致输出中缺少这些函数。

perf分析出现[unknown]函数

使用DWARF方法时,栈过深可能导致出现[unknown]函数。可参考相关资源进行进一步排查。

相关推荐

如何设计一个优秀的电子商务产品详情页

加入人人都是产品经理【起点学院】产品经理实战训练营,BAT产品总监手把手带你学产品电子商务网站的产品详情页面无疑是设计师和开发人员关注的最重要的网页之一。产品详情页面是客户作出“加入购物车”决定的页面...

怎么在JS中使用Ajax进行异步请求?

大家好,今天我来分享一项JavaScript的实战技巧,即如何在JS中使用Ajax进行异步请求,让你的网页速度瞬间提升。Ajax是一种在不刷新整个网页的情况下与服务器进行数据交互的技术,可以实现异步加...

中小企业如何组建,管理团队_中小企业应当如何开展组织结构设计变革

前言写了太多关于产品的东西觉得应该换换口味.从码农到架构师,从前端到平面再到UI、UE,最后走向了产品这条不归路,其实以前一直再给你们讲.产品经理跟项目经理区别没有特别大,两个岗位之间有很...

前端监控 SDK 开发分享_前端监控系统 开源

一、前言随着前端的发展和被重视,慢慢的行业内对于前端监控系统的重视程度也在增加。这里不对为什么需要监控再做解释。那我们先直接说说需求。对于中小型公司来说,可以直接使用三方的监控,比如自己搭建一套免费的...

Ajax 会被 fetch 取代吗?Axios 怎么办?

大家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发!今天给大家带来的主题是ajax、fetch...

前端面试题《AJAX》_前端面试ajax考点汇总

1.什么是ajax?ajax作用是什么?AJAX=异步JavaScript和XML。AJAX是一种用于创建快速动态网页的技术。通过在后台与服务器进行少量数据交换,AJAX可以使网页实...

Ajax 详细介绍_ajax

1、ajax是什么?asynchronousjavascriptandxml:异步的javascript和xml。ajax是用来改善用户体验的一种技术,其本质是利用浏览器内置的一个特殊的...

6款可替代dreamweaver的工具_替代powerdesigner的工具

dreamweaver对一个web前端工作者来说,再熟悉不过了,像我07年接触web前端开发就是用的dreamweaver,一直用到现在,身边的朋友有跟我推荐过各种更好用的可替代dreamweaver...

我敢保证,全网没有再比这更详细的Java知识点总结了,送你啊

接下来你看到的将是全网最详细的Java知识点总结,全文分为三大部分:Java基础、Java框架、Java+云数据小编将为大家仔细讲解每大部分里面的详细知识点,别眨眼,从小白到大佬、零基础到精通,你绝...

福斯《死侍》发布新剧照 &quot;小贱贱&quot;韦德被改造前造型曝光

时光网讯福斯出品的科幻片《死侍》今天发布新剧照,其中一张是较为罕见的死侍在被改造之前的剧照,其余两张剧照都是死侍在执行任务中的状态。据外媒推测,片方此时发布剧照,预计是为了给不久之后影片发布首款正式预...

2021年超详细的java学习路线总结—纯干货分享

本文整理了java开发的学习路线和相关的学习资源,非常适合零基础入门java的同学,希望大家在学习的时候,能够节省时间。纯干货,良心推荐!第一阶段:Java基础重点知识点:数据类型、核心语法、面向对象...

不用海淘,真黑五来到你身边:亚马逊15件热卖爆款推荐!

Fujifilm富士instaxMini8小黄人拍立得相机(黄色/蓝色)扫二维码进入购物页面黑五是入手一个轻巧可爱的拍立得相机的好时机,此款是mini8的小黄人特别版,除了颜色涂装成小黄人...

2025 年 Python 爬虫四大前沿技术:从异步到 AI

作为互联网大厂的后端Python爬虫开发,你是否也曾遇到过这些痛点:面对海量目标URL,单线程爬虫爬取一周还没完成任务;动态渲染的SPA页面,requests库返回的全是空白代码;好不容易...

最贱超级英雄《死侍》来了!_死侍超燃

死侍Deadpool(2016)导演:蒂姆·米勒编剧:略特·里斯/保罗·沃尼克主演:瑞恩·雷诺兹/莫蕾娜·巴卡林/吉娜·卡拉诺/艾德·斯克林/T·J·米勒类型:动作/...

停止javascript的ajax请求,取消axios请求,取消reactfetch请求

一、Ajax原生里可以通过XMLHttpRequest对象上的abort方法来中断ajax。注意abort方法不能阻止向服务器发送请求,只能停止当前ajax请求。停止javascript的ajax请求...