ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

2020 年终总结

2021-01-03 19:32:01  阅读:213  来源: 互联网

标签:偶现 年终总结 接口 问题 排查 2020 监控 服务端


        不平凡 2020 终于过去了,回顾这一年,却也不知道写些什么。注册的个人公众号上一篇是 2019年1月1日,一年都没有更新了。2021 年一定要更新频繁些。附:《2019年终总结》

        2020 年的主要时间一方面花在日常的项目迭代中,另一方面花在框架的开发上。框架的开发主要是程序监控。以前由于没有监控,很多问题的排查只能靠猜,对于许多客户反馈的偶现问题,最后也就不了了之。没有监控,我们面临许许多多问题,主要表现在以下几个方面:

  • 排查线上问题效率低

    当 “消防群” 里出现问题的时候,商户要么找服务端,要么找客户端,服务端和客户端也需要相互沟通,费时费力,对于有些问题,可能是客户端问题,这个时候仍然需要服务端配合。有时候对于特定用户才会出现的问题,我们还需要让商户给我们加员工,进行复现。排查问题链路如下图所示:

图片

 

  • 解决偶现 bug 困难

    当客户反馈偶现问题的时候,我们排查问题就更加困难,偶现 bug 解决率很低。主要原因有:

  1. 对于偶现问题,代理商也不能提供更多的信息。
  2. 客户端、服务端排查问题后,发现导致这个偶现问题的可能性有很多种,无法定位到真正的原因。

举个例子,App 偶尔不打印问题:

图片

如上图所示,导致不打印的情况会有很多种,到底是哪个链路出问题,不好排查,如果是从阿里云下载打印文件出问题,就更难排查,因为自己的服务端感知不到。

 

  • 对线上运行 App 没有感知
  1.  用户的体验如何
  2.  程序的性能如何
  3.  接口的平均响应时间
  4.  接口响应大小

 

于是我们开发了一套 App 的监控框架。为什么不使用开源,一方面有些开源的年久失修,有的不符合要求。另一面自己开发便于定制特殊化需求。

第一个版本的监控主要提供了:链路监控、接口监控、基本的统计功能。

链路回放能力。如用户在某个时间的短内做了哪些操作,请求了哪些接口,成功情况等​,这样对我们排查问题起到很大的帮助:

图片

接口监控​:我们可以统计哪些接口耗时最长、​响应的数据最大(极端情况,有的用户的某个接口 30几万的行的JSON)、接口错误率等等。基于这些数据我们可以提前优化,不用等到用户频繁的爆出问题​再去优化。

页面曝光时间、页面PV:我们可以根据页面曝光时间和页面PV可以得知用户访问的页面最多,停留的时间最长。这样就知道哪些界面使用的最频繁,​哪些页面是可以弱化。

图片

常用的 统计功能:如App版本分布、系统版本分布、​用户网络状态部分等。

 

图片

监控是一个很大的话题,包括数据采集、存储、上报、分析等。第一个版本的监控,还有很多需要完善的地方。这个就要等到  2021 年了。

 

除了监控,还做了一些提高开发效率的小工具,例如使用 Python3 编写脚本来管理多仓库(https://github.com/chiclaim/Repos),Google Repo 还有挺麻烦,很多新来的同事经常忘记还是需要去管理 manifest,也不支持多个 remote。同时也制定了一些开发流程相关的文档。

 

就写到了,2021 加油 ~~~

 

 

标签:偶现,年终总结,接口,问题,排查,2020,监控,服务端
来源: https://blog.csdn.net/johnny901114/article/details/112147089

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有