深入了解xhprof性能分析工具

前言

这篇文章不是教你如何安装使用xhprof进行性能分析。如果想了解如何安装使用xhprof,网络上文章很多,你也可以看我之前写的两篇文章。
非侵入式监控PHP应用性能监控分析
xhprof gui,让xhprof界面更漂亮,功能更强大

这篇文章主要介绍使用xhprof时的一些常见问题,和xhprof是如何实现性能分析的。

常见问题

多次调用xhprof_enable方法,最后生效的配置是哪个?

当你在一次请求中多次调用xhprof_enable方法,只有第一次调用时进行的设置能生效。在调用xhprof_disable()后,你又可以使用xhprof_enable方法进行设置。

$i = 0;
function good(){
    global $i;
    $i++;
    if ($i < 2) {
        good();
    }
}
function func() {
    good();
}
$start_time = microtime(true);
xhprof_enable(XHPROF_FLAGS_NO_BUILTINS);
xhprof_enable(XHPROF_FLAGS_MEMORY + XHPROF_FLAGS_CPU + XHPROF_FLAGS_NO_BUILTINS);
for ($i = 0; $i < 100; $i++) {
    func();
}
good();
$rst = xhprof_disable();
var_dump($rst);

输出内容为:

array(5) {
  ["good==>good@1"]=>
  array(2) {
    ["ct"]=>
    int(1)
    ["wt"]=>
    int(70)
  }
  ["func==>good"]=>
  array(2) {
    ["ct"]=>
    int(50)
    ["wt"]=>
    int(121)
  }
  ["main()==>func"]=>
  array(2) {
    ["ct"]=>
    int(50)
    ["wt"]=>
    int(135)
  }
  ["main()==>good"]=>
  array(2) {
    ["ct"]=>
    int(1)
    ["wt"]=>
    int(0)
  }
  ["main()"]=>
  array(2) {
    ["ct"]=>
    int(1)
    ["wt"]=>
    int(237)
  }
}

可见,打印的内容,并没有cpu和memory的信息。

输出内容中的ct,wt,cpu,mu, pmu 都代表什么意思

ct 表示 调用的次数
wt 表示 函数方法执行的时间耗时。相当于,在调用前记录一个时间,函数方法调用完毕后,计算时间差。
cpu 表示 函数方法执行消耗的cpu时间。和wt的差别在于,当进程让出cpu使用权后,将不再计算cpu时间。通过调用系统调用getrusage获取进程的占用cpu数据。
mu 表示 函数方法所使用的内存。相当于,在调用前记录一个内存占用,函数方法调用完毕后,计算内存差。调用的是zend_memory_usage获取内存占用情况。
pmu 表示 函数方法所使用的内存峰值。调用的是zend_memory_peak_usage获取内存情况。

输出内容中good==>good@1 是什么意思

==>表示一个调用关系。由于带@,说明是一个递归调用。@后面的数字是递归调用的深度。

如何设置xhprof_enable的参数,减少性能消耗

xhprof_enable提供了三个常量,用于设置你是否需要统计PHP内置函数,都统计那些指标。
三个常量如下:

XHPROF_FLAGS_NO_BUILTINS

设置这个常量后,将不统计PHP内置函数。毕竟PHP的内置函数性能一般都不错。没必要再消耗性能去统计。所以,建议设置。

XHPROF_FLAGS_CPU

设置这个常量后,会统计进程占用CPU时间。由于CPU时间是通过调用系统调用getrusage获取,导致性能比较差。开启这个选项后,大概性能下降一半。因此,如果对cpu耗时不是特别敏感的情况下,建议不要启用这个选项。

XHPROF_FLAGS_MEMORY

设置这个常量后,将会统计内存占用情况。由于获取内存情况,使用的是zend_memory_usage和zend_memory_peak_usage,并不是系统调用。因此,对性能影响不大。如果需要对内存使用情况进行分析的情况下,可以开启。

性能分析原理

如何实现对各个函数方法性能数据记录

目前xhprof会对,加载PHP文件,执行PHP函数方法,和执行eval方法进行性能数据记录。正好,这些在PHP内核中,有对应的函数进行处理。当你调用xhprof_enable方法时,会把默认的方法替换为xhprof的方法。来看看相关代码吧。

static void hp_begin(long level, long xhprof_flags)
{
    if (!hp_globals.enabled)
    {
        int hp_profile_flag = 1;

        hp_globals.enabled = 1;
        hp_globals.xhprof_flags = (uint32) xhprof_flags;

         / Replace zend_compile with our proxy /
                 / 处理加载PHP文件 /
                 / 先把zend引擎默认处理方法保存到_zend_compile_file变量中。/
        _zend_compile_file = zend_compile_file;
                /* 在把xhprof相对应的方法赋值给zend_compile_file。
                   这样,每次加载PHP文件时,就会执行xhprof相应的方法。*/
        zend_compile_file  = hp_compile_file;

        / Replace zend_compile_string with our proxy /
                / 处理eval代码的执行 /
        _zend_compile_string = zend_compile_string;
        zend_compile_string  = hp_compile_string;

        /init the execute pointer/
                / 处理 函数方法的执行 /
        _zend_execute_ex = zend_execute_ex;
        zend_execute_ex  = hp_execute_ex;
              .........
    }
}

/那我们看下,hp_compile_file方法,又是如何实现的/
ZEND_DLEXPORT zend_op_array hp_compile_file(zend_file_handle file_handle, int type)
{
    const char *filename;
    char *func;
    int len;
    zend_op_array *ret;
    int hp_profile_flag = 1;

    filename = hp_get_base_filename(file_handle->filename);
    len = sizeof("load") - 1 + strlen(filename) + 3;
    func = (char *) emalloc(len);
    snprintf(func, len, "load::%s", filename);

        //方法执行前记录当前各项性能如数,如cpu 内存等
    BEGIN_PROFILING(&hp_globals.entries, func, hp_profile_flag);
        //开始zend引擎相应的方法,加载文件
    ret = _zend_compile_file(file_handle, type);
    if (hp_globals.entries)
    {
                //加载文件完毕后,再次记录当前各项性能数据。以便以后计算差值。
        END_PROFILING(&hp_globals.entries, hp_profile_flag);
    }

    efree(func);
    return ret;
}

xhprof在实现的时候,性能方面做了哪些优化

获取时间时,为了性能,使用了汇编来获取时间戳计数器。时间秒 = 时间戳计数器值 / CPU主频。
正是这种实现,导致目前xhprof还只适用于x86架构。此外,因为RDTSC的数据不能在CPU间同步,所以,xhprof会将进程绑定在单个CPU上。
如果SpeedStep技术是打开的,XHProf的基于RDTSC定时器的功能就不能正常工作了。这项技术在某些英特尔处理器上是可用的。[注:苹果台式机和笔记本电脑一般都将SpeedStep技术预设开启。使用XHProf,您需要禁用SpeedStep技术。 ]

inline uint64 cycle_timer()
{
    uint32 __a, __d;
    uint64 val;
    asm volatile("rdtsc" : "=a" (__a), "=d" (__d));
    (val) = ((uint64) __a) | (((uint64) __d) << 32);
    return val;
}
时间: 2024-10-15 04:06:12

深入了解xhprof性能分析工具的相关文章

PHP性能分析工具XHProf安装使用教程

  这篇文章主要介绍了PHP性能分析工具XHProf安装使用教程,本文给出详细安装步骤和配置方法以及使用实例,需要的朋友可以参考下 HProf是facebook开源出来的一个php轻量级的性能分析工具,跟Xdebug类似,但性能开销更低,还可以用在生产环境中,也可以由程序开关来控制是否进行profile.基于浏览 器的性能分析用户界面能更容易查看,或是与同行们分享成果.也能绘制调用关系图.在数据收集阶段,它记录调用次数的追踪和包容性的指标弧在动态callgraph的一个程序. 它独有的数据计算的

php轻量级的性能分析工具xhprof的安装使用_php技巧

一.前言 有用的东西还是记录下来吧,也方便以后的查询:这次记录一下xhprof的安装使用: xhprof是facebook开源出来的一个php轻量级的性能分析工具,跟Xdebug类似,但性能开销更低, 还可以用在生产环境中,也可以由程序开 关来控制是否进行profile. 二.安装 wget http://pecl.php.net/get/xhprof-0.9.3.tgz tar zxf xhprof-0.9.3.tgz cd xhprof-0.9.3/extension /usr/bin/ph

PHP性能分析工具XHProf安装使用教程_php技巧

HProf是facebook开源出来的一个php轻量级的性能分析工具,跟Xdebug类似,但性能开销更低,还可以用在生产环境中,也可以由程序开关来控制是否进行profile.基于浏览 器的性能分析用户界面能更容易查看,或是与同行们分享成果.也能绘制调用关系图.在数据收集阶段,它记录调用次数的追踪和包容性的指标弧在动态callgraph的一个程序. 它独有的数据计算的报告/后处理阶段.在数据收集时,XHProfd通过检测循环来处理递归的函数调用,并通过给递归调用中每个深度的调用一个有用的命名来避开

php性能分析工具XHProf安装配置使用教程

XHProf是facebook 开发的一个测试php性能的扩展. 安装Xhprof扩展 $ wget http://pecl.php.net/get/xhprof-0.9.4.tgz $ tar -zxvf xhprof-0.9.4.tgz $ cd xhprof-0.9.4 $ cd extension/ $ phpize $ ./configure $ make $ sudo make install 修改php.ini [xhprof] extension=xhprof.so xhprof

PhalApi-Xhprof -- Facebook开源的轻量级PHP性能分析工具

PhalApi-Xhprof -- Facebook开源的轻量级PHP性能分析工具 前言 Facebook开源的轻量级PHP性能分析工具,非常爽希望大家喜欢 附上: 官网地址:http://www.phalapi.net/ 开源中国Git地址:http://git.oschina.net/dogstar/PhalApi/tree/release 开源中国拓展Git地址:http://git.oschina.net/dogstar/PhalApi-Library 1. 安装 首先需要安装配置Xhp

YAHOO的性能分析工具YSlow

YSlow 是YAHOO提供的性能分析工具,它会分析页面加载的所有内容,然后根据加速站点的13条军规来给站点页面评分并给出建议.另外还集成了一些小工具.详细请见 YSlow官方站点. 淘宝首页的得分是43,相当低:(.YAHOO.com是98分.虽然YSlow的评分标准未必完全适合淘宝的网络状况或系统配置.但仍然有很大的借鉴价值.建议大家安装测试. YSlow以Firefox Add-on的形式发布,并集成到Firebug中,安装前一定要先安装Firebug. 下载YSlow

Linux系统下常见性能分析工具的使用

在前面的文章中,我简单介绍了影响linux性能的几个方面以及如何解决这些方面的问题,但是如何才能从系统上发现是某个方面或某几个方面出现问题了呢,这就需要使用linux系统提供的几个常用性能分析工具,下面就具体讲述这几个常用性能分析工具的使用. 1.vmstat命令 vmstat是Virtual Meomory Statistics(虚拟内存统计)的缩写,很多linux发行版本都默认安装了此命令工具,利用vmstat命令可以对操作系统的内存信息.进程状态.CPU活动等进行监视,不足之处是无法对某个

IE浏览器性能分析工具

  DynaTrace AJAX是一个运行在IE浏览器下的免费页面性能分析工具,它可以支持主流的IE6.IE7.IE8浏览器.这款工具正是DynaTrace为进入前端性能分析领域而发布的.您可以利用它来分析页面渲染时间.DOM方法执行时间,甚至可以看到JS代码的解析时间.连JQuery的创始者 John Resig 也鼎力推荐了一把. John Resig对其评价到:"我一般不随便写关于性能分析工具的东西,坦率地说,我感觉它们绝大部分都比较烂,根本不能提供任何有价值的信息和分析结果.不过 dyn

Pury — 一个新的 Android App 性能分析工具

本文讲的是Pury - 一个新的 Android App 性能分析工具, 手机应用存在的目的,就是在帮助用户做他们想做的事情的同时,提供最好的用户体验 -- 而用户体验的重中之重是应用的性能.但有时候开发者们却以性能为借口,既没有达到既定目标,又写着低质量并难以维护的代码.在这里我想引用 Michael A. Jackson 的一句话: "程序优化守则第一条:别去做它.程序优化守则第二条(仅限于专业人员):别去做它,现在还不是时候." 在开始任何优化之前,我们要先认清问题的症结所在.