一、应用性能管理(APM)介绍

如今应用系统已经成为企业的业务支撑核心。企业通过应用系统联系客户、构建产品、自动执行后端业务流程、完成几乎所有对业务至关重要的任务,客户访问页面时的体验,直接影响到企业的声望与收入。

APM解决方案以真实的最终用户体验为出发点,贯穿整个应用程序交付链。应用性能管理从技术角度,分为以下三种方式:

模块名称 功能描述
模拟交易监测 人工交易仿真,定时主动探测, 达到检测应用系统可用性的目的, 适用于B/S 和C/S架构没有24小时业务数据,但又被要求7*24小时持续健康运转的系统。
旁路交易监控 基于网络旁路技术的应用性能监控,可帮助运维部快速判断定位故障域,分清运维责任,适用于网络和应用性能问题的粗定位和不允许插入探针的系统。
深度交易分析诊断 Java/ .NET/PHP代码分析诊断,可帮助应用维护人员和开发人员,快速定位问题根源(精确到函数、类、方法、语句、参数层面),大幅提高代码问题的排查效率,改善消除系统瓶颈,优化代码质量,提升客户的访问体验,适用于应用系统根源故障分析(疑难问题、偶发性问题)和有代码质量潜在问题的用户使用。

二、应用性能管理能解决的问题

2.1 企业所面临的现状

  • 近年来业务的快速发展,需要维护的业务系统越来越多、体系越来越庞大;
  • 在业务与新技术的融合过程中,企业的IT应用及业务系统的逻辑日益复杂化;
  • 随着业务的不断变化,已投入生产的IT系统代码更新或版本升级频率很高,在代码更新或版本升级后也有可能出现影响业务的问题。
  • 代码执行效率与性能瓶颈诊断定位难;
  • 对应用系统偶发性故障,追踪分析困难;
  • 通过人工排查问题的手段,时间和人力成本高;
  • 不能提前预知系统代码与性能的风险点;
  • 运维人员水平不一,对出现问题的根本原因分析不透彻,导致故障时长重现;
  • 应用系统供应商开发的代码质量参差不齐,且缺乏检验和判断的标准;
  • 现有的手段已无法高效的支撑快速、敏捷的运维需求。

2.2 应用性能管理可解决的问题

  • 真实的全交易数据储存,实现端到端的交易可视化,当发生问题时可按人、按交易逐笔进行查询与追踪,较好的解决了偶发性故障追踪难的问题;
  • 自动绘制交易的访问流图,帮助运维人员直观了解数据从前端到后台的真实访问情况,并可对导致问题的环节进行深度钻取(定位到代码、方法、参数、语句、性能资源问题等);
  • 提供统一的诊断数据源,使运维、开发和测试人员可在一个平台上统一工作,提高问题诊断和分析的效率;
  • 通过灵活定制的仪表视图,使用户全面掌握当前问题对业务的影响,进而分析影响度产生分级处理方案;
  • 能客观评价第三方应用系统供应商的代码开发质量与执行效率,并为SLA考核评价提供证据;
  • 完整记录前台用户的操作行为(使用的浏览器和操作系统版本,浏览的页面、执行的操作、使用的终端类型、每一次访问的效果等),快速界定故障范围与性质,并可帮助业务部门分析了解用户行为;
  • 通过代码分析诊断功能,建立起研发、测试、运维的循环协作体系,共同改善消除系统瓶颈,优化代码质量,提升客户的访问体验。

 三、方案介绍

3.1 模拟交易监测

  • 通过机器人技术模拟真实客户交易场景
  • 可7×24小时自动执行交易探测
  • 简单易用的交易或者协议可用性诊断
  • 分析不同分支地域的网络带宽情况

apm1

3.2 旁路交易监控

通过交换机旁路与强大的解码技术(支持国内外的多种协议),实现网络层的分析诊断,从传输角度实现应用性能问题的定位与粗诊断,并通过网络抓包工具实现问题数据包的离线分析,由于技术局限其无法了解导致应用缓慢的深层原因,需要配合深度交易分析诊断使用。

apm2

3.3 深度交易分析诊断

通过稳定高效的探针技术,实现对应用系统代码执行情况的深入诊断,使开发、测试人员在不修改业务系统代码的情况下,快速了解定位应用系统(Java、.net、php)的瓶颈与代码缺陷,大幅提升代码问题的诊断与改进效率,消除系统瓶颈,助您快速分析解决代码问题,产品内嵌解码器可以随时查看程序的源代码,并可与开发环境进行集成,便于开发人员快速定位修改代码,系统的主要功能如下:

WEB 请求性能分析 用户浏览端性能分析
前端用户操作情况与行为分析 CPU和I/O开销分析
业务交易流程可视化 线程开销分析
代码级诊断分析 内存使用分析
数据库语句性能分析 内存泄露分析
分析交易方法热点 垃圾回收情况分析
端到端交易关联分析 代码优化前后性能开销对比
异常堆栈跟踪 用户前端操作行为分析

3.4 用户终端交易监控

可获取移动端(支持IOS、Android)、Pad、用户浏览器端的访问信息),使得数据中心人员可快速了解前端每位用户的真实操作与访问感受,自动实现前后端访问信息的自动关联,真正做到前端到后端访问的可视化,系统所获取的数据,可与大数据平台相结合,进行终端用户行为分析,为企业的商业决策提供依据。

 四、用户收益

4.1 性能问题的瓶颈及根源分析

能够监测系统访问的性能和可用性,定位系统出现性能问题的瓶颈,找出症结所在,提高运维效率和服务质量,提高应用质量并加强开发效率。

4.2 实时全方位业务视图

能够进行实时业务视图,并进行数据共享,上至领导下至各部门同事会用共通的数据资料、共同的平台来进行判断,快速发现故障、解决故障,是性能问题还是代码问题,解除IT运维人员工作中百口莫辩的尴尬。

4.3 全应用性能生命周期管理

可涵盖企业IT应用从产品开发、测试、上线到后期运营管理的整个生命周期,真正实现全应用性能周期可视化管理。

apm3

4.4 变被动运维为主动运维

让您能从被动响应的运维工作方式转换为主动运维的工作方式,轻松识别、防范应用问题,在问题影响用户体验前定位系统出现性能问题的瓶颈、快速查找定位并报警通知到责任方,解决性能慢等问题,优化用户体验、提高转化率,一招制胜。

4.5 建立良好的沟通协作模式

能够快速定位捕捉后端的性能问题,建立性能基线,为业务运维提供安全保障, 从各个地点、各种设备对所有用户的用户体验水平进行监测,确保客户满意度和忠诚度,从而全面优化终端用户体验,理顺运维和开发间的关系,建立良好的沟通协作模式。