打开引擎盖在我们内部AWS开发平台(IDP)

杰米写的银行,
企业产品所有者的AWS & DevOps EDF(英国)

好,在这之前,我们从顶部开始,所以我们在相同的页面上。

什么是国内流离失所者,为什么你应该关心他们吗?

内部开发平台(IDP)是一个关键的工具,公司希望他们的开发实践更一致,方便工程师上班他们的产品和向市场提供更快。今天,所有的公司都存在需要一个数字存在为了竞争。与这种需求,软件景观与日俱增,无论是新语言,工具,或云技术——它是复杂的。

那么,如何得到一组快速启动和运行?初和你如何避免这样的问题“这个工具与那个?”It’s simple - set up an IDP!
一个良好的国内流离失所者很容易和无痛的工程师采用公司的开发实践。

通常,当我开始解释我们的国内流离失所者,我说短语;“一个平台,旨在降低认知负荷和加速投放市场的时间。“但这些好处只是经验如果你做得很好。设计不当和管理国内流离失所者可以产生相反的效果。

在法国电力公司(EDF),我们对待我们作为产品的国内流离失所者。我们注意我们的客户(内部和合作伙伴工程师),不断提高他们说根据他们的反馈,没有让他们如此复杂,以至于没有人能够理解他们。

我们学到了很多东西,发现了一些很棒的资源,把结构在一个平台的概念。例如,内部开发平台
是一个很好的资源对于任何想了解更多关于国内流离失所者。他们大纲5核心组件的一个设计良好的国内流离失所者,这是;

  • 基础设施编排;集成现有的和未来的基础设施
  • 环境管理;使开发人员能够创建新环境时必要的
  • 部署管理;实现一个持续交付,甚至持续部署(CD)的方法
  • 基于角色的访问控制;谁能做一个可伸缩的方式进行管理
  • 应用程序配置管理;管理应用程序配置一个可伸缩的、可靠的方法

除了这些核心组件,我们把安全作为一个一流的公民通过确保安全性和遵从性标准进我们的管道作为一门和安全代表团队。我们发现这适用于我们开发团队及早反馈他们的合规状况并没有隐藏惊喜之后。

这个平台我写现在基本上是一个AWS自动售货机,内置控件限制可以部署和调整常见事情像我我们的中央安全姿势。如果一个工程师需要一个新的帐户或一组账户,他们可以提高公关YAML文件,只要有正确的全部信息,他们可以在30分钟内使用公关的批准。我们有一个中央图书馆的基础设施可以引用的代码模块和一套安全性和遵从性测试运行在CI / CD的过程。
我们尝试了几次来构建我们的AWS平台在法国电力公司(EDF),这可能是许多其他企业一样。我不会去通过我们所有的历史,但是这是一个快速聚集的一路上我们学到了什么:

  • 它是伟大的,当一个IDP行之有效。工程师可以开始工作更快,知道他们可以控制他们的部署和它是安全的,安全的,并符合公司的政策。
  • 另一方面,当一个国内流离失所者不会工作得很好,它会导致很多挫折,减缓发展,打破部门之间的信任,使团队中的每个人都不开心。
  • ClickOps脆弱,使得应用程序平台难以规模。
  • 拥有多个不相关的生产工作负载在同一帐户增加你的风险和爆炸半径的大小。
  • 云平台尺度,那么共同的需要,可重复的过程,团队自主权,改变由代码而不是ClickOps。

ClickOps是什么?ClickOps指通过控制台进行更改。ClickOps并不是最好的方法来管理生产工作负载,因为很难重复在规模,从而导致错误配置和人类的错误,更难以遏制。

爆炸半径是多少?爆炸半径是指多少麻烦你如果坏人进入你的账户。和AWS的方式限制爆炸半径是鼓励您创建多个帐户。这个想法是为每个领域,有一个应用程序,产品等。你懂的。
我们建立的平台是几乎完全存储为代码,所以我们得到所有git的好处,我们可以让它可以访问我们的工程社区。通过这种方法,这意味着我们可以使用一种称为“GitOps”工作。

GitOps是什么?

GitOps只是一组规则运行生产环境中,无论是内部外部客户使用的开发平台或服务。这些规则是基于相同的方法自2006年以来,谷歌一直在使用内部。
然后我们把我们的GitOps方法与服务水平目标(SLOs),以确保我们会议核心平台的目标。

SLOs是什么?

SLOs或服务级别目标,本质上是多久没有恼人的用户你可以失败。网站可靠性工程:谷歌如何生产系统运行,这本书的项行为,广为人知。

把这个离家更近的地方,SLA(服务水平协议)是一个近亲SLO,即不是附加合同。sla是司空见惯的,你看看Amazon Web服务或您是否更喜欢云提供商。弹性Kubernetes服务,例如,提供SLA的99.95%,这意味着如果他们下来在一个月内超过21分54秒,他们付给你,客户,一定比例的服务费用。

SLOs必须内置织物的着陆区,原因很简单:如果你不清楚通过SLOs管理期望,你的客户会下意识地为你设定更高的。

这里是一个列表的例子SLOs我们使用和与他们的学校图书馆:

能力 SLI SLO
账户自动售货 账户是可用在一个工作日内由请求人提交的请求。 80%
用户配置 四个业务小时内用户提供凭证提交的请求。 90%
用户访问 发送请求后,用户可以访问在4营业时间。 90%
IAC合规扫描 合规的完整运行扫描在3分钟内完成。 95%
科协编码 不到3分钟,科协工具成功服务请求。 95%

我们最近的平台是可以使用它的社区,我们平台团队,基于我们对阵SLOs管理它。我们优先考虑工作像其他产品团队与我们的SLO性能好,确保我们不overengineer。

总之

  • 如果你建立一个内部平台,另一些则取决于您需要构建规模,这意味着你必须操作一切的代码。
  • 如果你不把你的平台产品,很有可能你不是听你的客户,你的风险过度设计(精益的反模式)。
  • 无论你做什么,不要让你的平台或任何您的生产服务是由“ClickOps”!
  • SLOs是一个很好的工具,可以帮你操作平台,正确的水平。

你有兴趣加入我们的数据和技术社区?了解更多与我们和申请机会

标记:

法国电力公司发布的

提供信息和文章关于公司活动,包括最新的产品、活动和社区项目。