Python性能分析工具py-spy原理用法解析
Py-Spy介绍
引用官方的介绍:
Py-Spy是Python程序的抽样分析器。 它允许您可视化查看Python程序在哪些地方花了更多时间,整个监控方式无需重新启动程序或以任何方式修改工程代码。 Py-Spy的开销非常低:它是用Rust编写的,速度与编译的Python程序不在同一个进程中运行。 这意味着Py-Spy可以安全地用于生成生产环境中的Python应用调优分析。
github:https://github.com/benfred/py-spy
安装
pip install py-spy
安装后使用py-spy - h可以验证安装,并查看使用帮助。
py-spy从命令行工作,并获取要从中采样的程序的PID或要运行的python程序的命令行。py-spy具有三个子命令record,top和dump:
- record生成火焰图
- top实时查看每个函数运行时间并统计
- dump显示每个python线程的当前调用堆栈
使用py-spy 生成火焰图
"a2c4e.11153940.0.i9.a628d24calxtmA">"12345" 为程序运行的pid,当运行这行命令的时候,py-spy 开始抽样的程序simlple 并且生成火焰图,我们可以等待1分钟左右 ctrl+c 结束,这时候会在运行这行命令的当前目录下生成 profile.svg 火焰图, 如下图:
火焰图的分析非常简单直观,主要是看"平顶",看图中最下方那个峰顶是平的,那么程序的性能问题就可以从这里入手去解决,这里不详细介绍火焰图看法,不明白的同学可以自行百度。
Top功能
这时候要用到py-spy 提供的 top 命令,Top显示了在python程序中花费最多时间的功能的实时视图,类似于unix top命令。
py-spy top --pid 12345
或
py-spy top-python myprogram.py
"text-align: center">"a2c4e.11153940.0.i12.a628d24calxtmA" alt="" src="/UploadFiles/2021-04-08/202007270833054.png">
总结 : 使用py-spy 相对于其他一些python性能分析工具,优势在于使用非常简单,而且无须对代码做任何改动,并且可以在保护现场情况下,直接生成火焰图,还可查看实时程序运行状态。
火焰图怎么看
首先你需要知道:
X方向是采样时间。
Y方向是函数调用栈。
如果给你一个这样的火焰图,你应该得出什么信息:
1.a()是开始的执行函数,但没有消耗cpu,在这个函数里执行了b(),h()。
2.a()的两个分支b()和h(),这表明a()里面可能有一个条件语句,继续可以看到b()分支消耗的 CPU 大大高于h()。
3.h()函数没有消耗cpu,cpu全被i()函数占有。
4.b()函数这条支路继续往上,一直到d(),由d()函数的子函数e()消耗一部分cpu,f()下的g()消耗一部分cpu,你会发现d()的最右边往上缺了一块,这块就是d()执行消耗的cpu。
结论:
消耗cpu的函数为e(),g(),d(),i()。
因此,如果要调查性能问题,首先应该调查g(),其次是i()。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
下一篇:python下载的库包存放路径