Dubbo性能优化_dubbo接口发送1m数据需要多久-程序员宅基地

https://my.oschina.net/u/1378920/blog/739399


Dubbo性能优化

背景

dubbo作为一款分布式服务框架,除了提供远程调用的细节封装,还提供了基本的服务治理功能,能够粗略地监控系统性能。

dubbo原理图

上图展示的是dubbo执行流程的原理图,在客户端和服务端都有一个程序去统计调用信息,其中有价值的信息有延迟时间、并发数、调用次数等,完成记录之后,客户端和服务端分别会定时发送到监控平台,监控平台汇总之后,算出平均qps(每秒调用次数)和平均rt(每次调用延时)等数据并展现在监控平台页面上

最近公司用上了dubbo作为dsp引擎和算法平台之间的一个分布式服务框架,目的是解开引擎和算法之间的强耦合。

  • 消费者--客户端--dsp引擎
  • 提供者--服务端--算法平台

现象

根据dubbo监控平台观察到的现象(红线为客户端数据,蓝线为服务端数据)

  • 线上QPS

线上qps

  • 线上RT

线上rt

问题描述

根据dubbo监控平台现象得知,qps较低时,客户端rt并不高,但是qps较大时,客户端rt非常高,并且持续稳定在10ms左右。这对于性能要求很高的广告引擎是无法容忍的。

线上环境

14台客户端,5台服务端,配置信息:24核cpu+64g内存+1000MB/s带宽

优化过程

延迟较高,就得先查看资源使用有没有出现瓶颈的地方。根据监控信息显示,服务端延迟基本为0,客户端延迟很高。所以很有可能是客户端出现了瓶颈,所以重点先放到客户端这一边,先确定一台客户端的机器(10.100.51.175)来分析问题。

  • 整体环境

    由于目前rpc调用中使用到的资源主要有cpu、内存、网络,由于不存在磁盘I/O,所以排除掉这个资源的影响。

    • CPU:

    性能有问题,首先派上用场的工具就是top。top可以粗略检测cpu使用情况。

    top图片

    由此可见总cpu使用率并不高。接着用vmstat查看cpu上等待和正在运行的任务

    vmstat图片

    看到等待的任务并不多,不过这里可以看到cs上下文切换较高,有可能是线程较多导致很多竞争。这个可能会影响到性能,先记录下来。

    上面提到的都是对cpu整体排查的方式,接着也不要漏过对每个cpu进行排查的方式。使用mpstat检查每一个cpu

    mpstat图片

    看到没有一个cpu处于繁忙状态

    • 内存:

    根据上述top工具截图,可以发现64g内存绝大部分都被分配给了应用程序,但是通过进程信息区可以查看到每个进行对内存使用率并不高。

    根据上述vmstat工具截图,可以观察到si(换入的内存)和so(换出的内存)都是0,所以系统不会因为内存换页而产生性能问题。

    • 网络:

    先使用ethtool来检测一下网卡eth0的带宽

    eth0带宽图片

    发现确实是千兆网卡。那么在千兆网卡上面,我们程序的利用率能达到多少呢?可以使用一个叫nicstat的工具来统计利用率

    线上网络利用率

    从上图可以发现,我们的网络利用率很低(%Util),也没有出现丢包(Drops)的情况,说明我们数据传输速度较慢,这个可能是问题所在,暂时先记录下来。

  • 程序环境

    从整体上只能大概有个方向,具体排查还得从程序本身着手。这时就得根据线上环境,模拟一个测试平台,在测试平台来定位问题所在,分析程序到底哪里慢。

    我在10.100.52.164上搭建了测试环境的服务端,和引擎团队在10.100.51.151上搭建的客户端端进行打通,完成对线上环境的模拟。环境搭建好了,接着我使用tcpcopy将线上机器的流量引入到了我的测试环境。流量打通之后,查看监控平台,发现随着流量的扩大,问题马上暴露了出来:目前qps在1w的情况下,客户端rt达到了17ms左右。

    测试环境与线上环境的现象基本一致:qps较大的情况下,客户端rt变得非常高,服务端rt几乎为0。所以瓶颈应该在客户端。接着,我们可以利用火焰图来分析测试环境下客户端哪个步骤比较慢

    测试环境火焰图

    根据火焰图可以定位到统计调用时间的代码处,MonitorFilter类的invoke方法。既然是从这里统计到延迟较高,那么问题肯定出现在invoke调用链里面的某个方法。根据火焰图继续往上分析调用栈,看到左边的DefaultFuture的get方法和右边OneToOneEncoder的doEncode方法各占了很大一部分比例。那么这两个方法到底是干什么的呢?

    • DefaultFuture.get:客户端同步等待服务端响应。由于dubbo协议采用的是netty异步写,然后同步等待服务端响应的一种模式。所以这里相当于客户端等着服务端完成本地调用之后将执行结果返回回来的一个过程。

    • OneToOneEncoder.doEncode:客户端编码。这个步骤主要也就是对参数、方法名、接口名等信息的序列化操作。

    使用btrace分别测出两个方法的执行时间的分布图

    • DefaultFuture.get方法执行时间

    get方法执行时间

    时间大部分集中在16ms,在客户端17ms的延迟表现中占了绝大部分

    • OneToOneEncoder.doEncode方法执行时间

    doEncode方法执行时间

    时间大部分集中在0ms

    发现doEncode虽然对cpu利用的较多,但是不怎么消耗时间。真正消耗时间的是get方法。可以通过一张图来了解get操作等待的时候,后台到底做了哪些操作。

    所以程序很有可能是卡在网络读写上面。

  • 猜测

    文章前部分有一张使用nicstat抓取的网络读写状态,发现网络利用率很低,也就是网络读写速度都很慢。但是使用ping网络发现网络速度并不慢,但是为什么在程序中,qps较大时,网络读写速度就会很慢?

    如果是网络堵塞而导致速度很慢。那么也就是客户端的发送窗口和服务端接口窗口设置的太小,或者客户端TCP发送缓存和服务端TCP接收缓存太小,当客户端发起大量数据请求时,服务端无法及时处理这些数据,那么服务端就会选择性的丢掉一部分包。但是根据上图nicstat截图发现,几乎没有产生丢包现象,而且我自己也尝试过调大这些参数,发现还是没有什么作用。所以这种可能性可以排除。

    翻阅《TCP/IP详解(协议)》之后,查得还有一种可能性会导致网络速度很慢,就是TCP的拥塞控制。为了减少丢包而引发的性能损失,它会先预估线路中的拥挤情况,然后来控制客户端发送的流量。这很可能就是导致网路速度提不起来的一个关键因素。而且,目前使用dubbo协议的默认单一长连接模式,也就是只有一个网络读写通道。当这个通道某个方向的网络传输量大了之后,就容易引起堵塞,TCP协议为了不产生堵塞而丢包,就进而控制了客户端的数据传送速度。

  • 处理

    既然是一条线路的传输量太大而导致被"限速",那么可以试试开辟多条线路。也就是将原来客户端-服务端单一长连接模式改成客户端-服务端多长连接模式

结果

在测试环境下,加大了连接个数之后,测试环境的延迟降低了。而在线上环境,改成多长连接之后,在qps不变的情况下,延迟从平均10ms降到了平均1ms。

下面是稳定之后,监控平台记录的线上环境的qps和rt数据

  • 线上QPS-优化后

线上qps-优化后

  • 线上RT-优化后

线上RT-优化后

发现增加了长连接个数之后,延迟降低了,性能提升了。不过由于目前每台服务端监听14台客户端,客户端每增加一个长连接就会导致服务端长连接增加14个,如果连接过多,就会因为带宽资源不够而出现瓶颈,所以要根据线上实际情况来调整长连接个数。

思考

调用完成了,但是思考还没有停止。通过这次经历,也算发现了dubbo的一些弊端。作为一款致力于提供服务的框架,dubbo的问题发现能力还有待完善。

  • dubbo监控平台只显示了所有服务端、客户端的整体性能指标,缺少单台机器的指标显示
  • dubbo监控平台只能统计平均rt和平均qps,平均值本身就是非常不清晰的指标,采用百分比分布统计的方式会更好
  • dubbo监控平台没有提供报警功能,没有办法及时发现问题

综上所述,dubbo还有值得完善,后续可以对dubbo这些不足做一些扩展




版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/moonpure/article/details/74946596

智能推荐

874计算机科学基础综合,2018年四川大学874计算机科学专业基础综合之计算机操作系统考研仿真模拟五套题...-程序员宅基地

文章浏览阅读1.1k次。一、选择题1. 串行接口是指( )。A. 接口与系统总线之间串行传送,接口与I/0设备之间串行传送B. 接口与系统总线之间串行传送,接口与1/0设备之间并行传送C. 接口与系统总线之间并行传送,接口与I/0设备之间串行传送D. 接口与系统总线之间并行传送,接口与I/0设备之间并行传送【答案】C2. 最容易造成很多小碎片的可变分区分配算法是( )。A. 首次适应算法B. 最佳适应算法..._874 计算机科学专业基础综合题型

XShell连接失败:Could not connect to '192.168.191.128' (port 22): Connection failed._could not connect to '192.168.17.128' (port 22): c-程序员宅基地

文章浏览阅读9.7k次,点赞5次,收藏15次。连接xshell失败,报错如下图,怎么解决呢。1、通过ps -e|grep ssh命令判断是否安装ssh服务2、如果只有客户端安装了,服务器没有安装,则需要安装ssh服务器,命令:apt-get install openssh-server3、安装成功之后,启动ssh服务,命令:/etc/init.d/ssh start4、通过ps -e|grep ssh命令再次判断是否正确启动..._could not connect to '192.168.17.128' (port 22): connection failed.

杰理之KeyPage【篇】_杰理 空白芯片 烧入key文件-程序员宅基地

文章浏览阅读209次。00000000_杰理 空白芯片 烧入key文件

一文读懂ChatGPT,满足你对chatGPT的好奇心_引发对chatgpt兴趣的表述-程序员宅基地

文章浏览阅读475次。2023年初,“ChatGPT”一词在社交媒体上引起了热议,人们纷纷探讨它的本质和对社会的影响。就连央视新闻也对此进行了报道。作为新传专业的前沿人士,我们当然不能忽视这一热点。本文将全面解析ChatGPT,打开“技术黑箱”,探讨它对新闻与传播领域的影响。_引发对chatgpt兴趣的表述

中文字符频率统计python_用Python数据分析方法进行汉字声调频率统计分析-程序员宅基地

文章浏览阅读259次。用Python数据分析方法进行汉字声调频率统计分析木合塔尔·沙地克;布合力齐姑丽·瓦斯力【期刊名称】《电脑知识与技术》【年(卷),期】2017(013)035【摘要】该文首先用Python程序,自动获取基本汉字字符集中的所有汉字,然后用汉字拼音转换工具pypinyin把所有汉字转换成拼音,最后根据所有汉字的拼音声调,统计并可视化拼音声调的占比.【总页数】2页(13-14)【关键词】数据分析;数据可..._汉字声调频率统计

linux输出信息调试信息重定向-程序员宅基地

文章浏览阅读64次。最近在做一个android系统移植的项目,所使用的开发板com1是调试串口,就是说会有uboot和kernel的调试信息打印在com1上(ttySAC0)。因为后期要使用ttySAC0作为上层应用通信串口,所以要把所有的调试信息都给去掉。参考网上的几篇文章,自己做了如下修改,终于把调试信息重定向到ttySAC1上了,在这做下记录。参考文章有:http://blog.csdn.net/longt..._嵌入式rootfs 输出重定向到/dev/console

随便推点

uniapp 引入iconfont图标库彩色symbol教程_uniapp symbol图标-程序员宅基地

文章浏览阅读1.2k次,点赞4次,收藏12次。1,先去iconfont登录,然后选择图标加入购物车 2,点击又上角车车添加进入项目我的项目中就会出现选择的图标 3,点击下载至本地,然后解压文件夹,然后切换到uniapp打开终端运行注:要保证自己电脑有安装node(没有安装node可以去官网下载Node.js 中文网)npm i -g iconfont-tools(mac用户失败的话在前面加个sudo,password就是自己的开机密码吧)4,终端切换到上面解压的文件夹里面,运行iconfont-tools 这些可以默认也可以自己命名(我是自己命名的_uniapp symbol图标

C、C++ 对于char*和char[]的理解_c++ char*-程序员宅基地

文章浏览阅读1.2w次,点赞25次,收藏192次。char*和char[]都是指针,指向第一个字符所在的地址,但char*是常量的指针,char[]是指针的常量_c++ char*

Sublime Text2 使用教程-程序员宅基地

文章浏览阅读930次。代码编辑器或者文本编辑器,对于程序员来说,就像剑与战士一样,谁都想拥有一把可以随心驾驭且锋利无比的宝剑,而每一位程序员,同样会去追求最适合自己的强大、灵活的编辑器,相信你和我一样,都不会例外。我用过的编辑器不少,真不少~ 但却没有哪款让我特别心仪的,直到我遇到了 Sublime Text 2 !如果说“神器”是我能给予一款软件最高的评价,那么我很乐意为它封上这么一个称号。它小巧绿色且速度非

对10个整数进行按照从小到大的顺序排序用选择法和冒泡排序_对十个数进行大小排序java-程序员宅基地

文章浏览阅读4.1k次。一、选择法这是每一个数出来跟后面所有的进行比较。2.冒泡排序法,是两个相邻的进行对比。_对十个数进行大小排序java

物联网开发笔记——使用网络调试助手连接阿里云物联网平台(基于MQTT协议)_网络调试助手连接阿里云连不上-程序员宅基地

文章浏览阅读2.9k次。物联网开发笔记——使用网络调试助手连接阿里云物联网平台(基于MQTT协议)其实作者本意是使用4G模块来实现与阿里云物联网平台的连接过程,但是由于自己用的4G模块自身的限制,使得阿里云连接总是无法建立,已经联系客服返厂检修了,于是我在此使用网络调试助手来演示如何与阿里云物联网平台建立连接。一.准备工作1.MQTT协议说明文档(3.1.1版本)2.网络调试助手(可使用域名与服务器建立连接)PS:与阿里云建立连解释,最好使用域名来完成连接过程,而不是使用IP号。这里我跟阿里云的售后工程师咨询过,表示对应_网络调试助手连接阿里云连不上

<<<零基础C++速成>>>_无c语言基础c++期末速成-程序员宅基地

文章浏览阅读544次,点赞5次,收藏6次。运算符与表达式任何高级程序设计语言中,表达式都是最基本的组成部分,可以说C++中的大部分语句都是由表达式构成的。_无c语言基础c++期末速成