ICode9

精准搜索请尝试: 精确搜索
  • CISCO SRE实习生面试经历,我是如何拿到offer的。2022-09-10 02:00:34

    CISCO SRE实习生面试经历,我是如何拿到offer的。 我是 Dipto Chakrabarty,是 VIT Vellore 计算机科学领域的一名研究生,专攻信息安全。我的主要兴趣在于 Devops、云计算和后端开发领域。我之前在 Devops 领域做过实习,也为开源做出了贡献。我被 CISCO India 选为站点可靠性实习生和全

  • 活动预约|阿里云如何搭建云服务 SRE 与可观测体系2022-06-22 17:03:28

    近几年随着 DevOps 发展,SRE(Site Reliability Engineering)开始被大家所熟知。随着国内互联网、金融、新零售等行业的飞速发展,SRE 也不再局限于互联网企业大促时的保障与平时的稳定性轮值,并凸显其独特价值:以软件工程的方法论重新定义研发运维,驱动并赋能业务演进。在保障业务高速发展

  • 2.SRE与DevOps的关系2022-04-13 13:02:11

    问题: 1.已知的那些所谓最佳实践方案都高度依赖于环境,无法进行广泛的应用。运维团队的工作该怎样良好的开展,也是一个尚未解决的大问题; 2.业界经常将运维视为一个成本中心,想要取得实质性的改变变的举步维艰; 3.上述原因推动了IT领域的工作改革,解决这些问题的最新方案有了两个独立的称

  • sre之监控报警---当我们监控报警的时候我们应该监控报警什么?2022-03-28 18:02:08

    google有四个黄金信号,分别是 Latency — The time it takes to service a request   Traffic — A measure of how much demand is being placed on your system   Errors — The rate of requests that fail   Saturation — How “full” your service is.   但

  • SLA、SLO 和 SLI2022-01-15 16:32:37

    SLA、SLI 和 SLO 是 SRE 工程实践里非常核心的概念,但是大家在同时提到这些概念的时候,经常容易混淆。 长篇大论的文章反而容易使人更加疑惑,还不如画一张示意图说明一下,帮助大家一次性彻底梳理清楚这些不可以含糊不清的核心概念。说明一下,下图假设所讨论的 SLA 个数为 1,使用了软件

  • SRE运维工程师笔记-Linux基础入门2021-11-02 23:58:01

    SRE运维工程师笔记-Linux基础入门 1. Linux基础1.1 用户类型1.2 终端terminal1.2.1 终端类型1.2.2 查看当前的终端设备 1.3 交互式接口1.3.1 交互式接口类型1.3.2 什么是shell1.3.3 各种shell1.3.4 bash shell 1.4 设置主机名1.5 命令提示符 prompt1.6 执行命令1.6.1 执行

  • EF Core左连接内连接2021-09-01 11:35:01

    内连接查两张表 from oo in query join comany in _companyRepository.GetAll() on oo.OfflineOrder.CompanyId equals comany.Id where comany.IsFamous select oo; Lamad内连接 _storeRepository.GetAllIncluding().Join(_storeSupplierExtRepository.GetAllIncluding(),

  • 阿里数据库SRE2021-08-18 19:03:27

    数据库稳定性治理 数据库是应用的核心命脉,对于ECS管控来说,所有的核心业务全部跑在RDS之上,如果数据库发生故障,对应用的损害无论从管控面或者数据面都是致命的。所以,SRE做的第一件事情就是守住核心命脉,对数据库稳定性进行全面的治理。 首先,我们先来看一下ECS管控在规模化业务下,数据

  • SRE 崩溃2021-07-14 10:01:57

    B站崩溃后,技术总监淡定吃烧烤,网友们的评论乐死我了 https://mp.weixin.qq.com/s/zAQjduY-tHAqfob897oKSA     B站高可用用架构实践 2020-04-22阅读 166.7K0   本文被 50 个清单收录,推荐清单 流量洪峰下的高可用架构 流量洪峰下要做好高服务质量的架构是一件具备

  • 马哥门徒N57-SRE第三周2021-06-20 20:32:51

    redis服务配置文件详解 Redis默认不是以守护进程的方式运行,可以通过该配置项修改,使用yes启用守护进程 daemonize no 当Redis以守护进程方式运行时,Redis默认会把pid写入/var/run/redis.pid文件,可以通过pidfile指定 pidfile /var/run/redis.pid 指定Redis监听端口,默认端口为

  • 什么?你竟然不知道SRE工程师!2021-06-03 22:02:50

    今天,我们来简单聊聊关于SRE工程师的那些事 在正式开始之前,我先跟大家讲一下我的个人经历:今年春招找实习的时候,依稀记得那是一个日暖风和的中午,我坐在电脑前,而网线的另一端是和蔼可亲的面试官——是的,我正在进行一场某企业的技术面试,岗位则是SRE工程师 面试的前半段,我跟面试

  • Linux运维架构师、SRE技术图谱2021-06-01 07:04:19

    Linux运维架构师、SRE技术图谱 Web服务器: apache, tomcat, nginx, lighttpd, varnish 监控: nagios、 ganglia、 cacti、 zabbix、 Prometheus 自动部署: ansible、salt、 puppet、 cobbler 配置管理: puppet、 cfengine、 ansible 负载均衡:lvs、 haproxy、 nginx 高可用: keepal

  • 2019 SRE 调查报告:事故处理是主要工作,SRE 压力山大2021-05-22 10:51:27

    2019 年 1 月,网站监测服务公司 Catchpoint 通过邮件列表和社交媒体进行了一项 SRE 调查。来自不同行业的 188 名 SRE 参与了这项调查,回答了如何管理事故以及事故后压力等一些问题。今年是 Catchpoint 连续第二年调查 SRE 这个新兴的职业角色。去年的调查专注于 SRE 是谁,主要做什么

  • Elastic-Job-Cloud作业云在当当的SRE实践2021-05-19 18:53:04

     高洪涛 分布式实验室本次分享面向对Mesos与SRE感兴趣的听众。随着容器技术在国内的持续流行,关注点已经由容器技术本身向运维方面逐渐过渡,Google一直安利的SRE经验正好契合了这个时代的运维节奏,由此契合SRE概念而衍生的Mesos,Kubernete服务也持续推动着相关理念落地。当当正是在这

  • DevOps适用于小团队吗?2021-05-15 07:01:46

     冯旭松 译 分布式实验室正如我最近在Twitter[1]上写的那样,我最近花了相当多的时间来思考“DevOps”的人员可扩展性。(将DevOps打上引号是因为它有各种不同的定义,在下面将会讲到。)我最终得出的结论是,虽然DevOps可以很好地适用于小型工程组织,但这种做法如果没有仔细考虑和管理的话

  • DevOps适用于小团队吗?2021-05-15 07:01:37

     冯旭松 译 分布式实验室正如我最近在Twitter[1]上写的那样,我最近花了相当多的时间来思考“DevOps”的人员可扩展性。(将DevOps打上引号是因为它有各种不同的定义,在下面将会讲到。)我最终得出的结论是,虽然DevOps可以很好地适用于小型工程组织,但这种做法如果没有仔细考虑和管理的话

  • 云端的SRE发展与实践2021-05-11 23:52:19

    本文根据作者在美团点评第21期技术沙龙的分享记录整理而成。背景SRE(Site Reliability Engineering)是Google于2003年提出的概念,将软件研发引入运维工作。现在渐渐已经成为各大互联网公司技术团队的标配。美团点评作为综合性多业务的互联网+生活服务平台,覆盖“吃住行游购娱”各个领域

  • 我所理解的SRE、PE和应用运维 -- 赵成2021-05-11 17:34:15

    我所理解的SRE、PE和应用运维 SRE这个概念我个人印象中应该14年下半年左右听到的,当时只知道是Google对运维岗位定义,巨牛逼的一个岗位,在网上查到SRE是叫网站稳定工程师,只要是保障稳定为主,其他就没有更深的意识了。15年开始逐渐有更多在Google工作或接触过这个岗位的专家在介绍这个

  • 结束语|聊聊我的SRE落地心路历程2021-05-02 20:03:43

    你好,我是赵成,不知不觉我们已经来到了结束语,非常感谢你的一路陪伴。 学完咱们的专栏,我想对于 SRE 到底是怎么一回事儿这个问题,你应该有一个大致的了解了。就像我们在开篇词中提到的,SRE 真的没有那么神秘,你平时在做的很多事情本身就属于 SRE 的范畴,学到这里,你应该对此深有体会了。

  • 06 | 故障发现:如何建设On-Call机制?2021-05-02 20:03:02

    在上一部分,我们学习了 SRE 的基础,需要掌握的重点是 SLI 和 SLO 以及 Error Budget(错误预算)策略。SLI 是我们选择的衡量系统稳定性的指标,SLO 是每个指标对应的目标,而我们又经常把 SLO 转化为错误预算,因为错误预算的形式更加直观。转化后,我们要做的稳定性提升和保障工作,其实就是想办

  • 01|SRE迷思:无所不能的角色?还是运维的升级?2021-05-02 19:32:14

    有人认为 SRE 就是一个岗位,而且是一个具备全栈能力的岗位, 只要有这么一个人,他就能解决所有稳定性问题。这还只是一种理解,而且这个理解多是站在管理者的角度。 SRE是指Site Reliability Engineer (网站可靠性工程师)。他是软件工程师和系统管理员的结合,一个SRE工程师基本上需要掌

  • Go在Google SRE的工程实践2021-04-17 08:52:42

    原文地址:https://opensource.googleblog.com/2021/04/actuating-google-production-how-googles-sre-team-uses-go.html) 原文作者:Pierre Palatin 本文永久链接:https://github.com/gocn/translator/blob/master/2021/w15-actuating-google-production-how-googles-sre-team-uses-go

  • 读SRE Google运维解密有感(一)2021-03-22 19:52:12

    读SRE Google运维解密有感(一) 360addops团队 360云计算 作者有话说: 这几天打算利用碎片时间读了一下"SRE Google运维解密"这本书,目前读了前几章,感觉收获颇多,结合自己的工作经历和书中的要点,写一些感悟和思考,希望对大家有一点帮助。PS:丰富的一线技术、多元化的表现形式,尽在“HULK一

  • 读SRE Google运维解密有感(一)2021-03-22 19:51:58

    读SRE Google运维解密有感(一) 360addops团队 360云计算 作者有话说: 这几天打算利用碎片时间读了一下"SRE Google运维解密"这本书,目前读了前几章,感觉收获颇多,结合自己的工作经历和书中的要点,写一些感悟和思考,希望对大家有一点帮助。PS:丰富的一线技术、多元化的表现形式,尽在“HULK一

  • 使用开源软件打造类似Google的开发和生产环境2021-03-19 15:01:55

    作者简介:Minghua YeGoogle  SRE 主管2007加入 Google 公司,2009年开始,主要负责 Google 的云计算平台,特别是 Google App Engine。前言如果大家对 App Engine 还不熟悉的话,简单来说 App Engine 就是 Google 提供的 paas,一个开发、托管网络应用程序的平台,使用户的程序能在 Google 的数

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有