2000P's Blog

最初のページ

ivan円形インタビュー、principal developer:service mesh and

著者 taddei 時間 2020-03-20
all

SREのテーマ範囲が広いので、イヴァンと彼の同僚Ben Tylerは書店の高級発展会社でSLURM SREになることに同意して、2020年2月3日から5日まで開催します。それはSLI/SLO/error budgetを使用する理論と実践を研究して飛行任務に対する分析((2000 a).graceful degradation、failure-injection、capacity planing:お金を節約して、すぐ予約します。

今は伊万さんに発言してもらいます。

過去二年間に、私は二つのことをしました。一、内部雲Booking.comを作ります。これはKubergnetesに設立されました。この点について、ハイレベルの会議で長い全面的な報告を提出しました。

今のテーマはサービスMeshです。これは実際に話題になっています。以前のビッグデータとKubergnetesのようです。

この考え方は簡単ですが、一方では複雑です。微細構造の中での相互作用はすべてネットを通じて行われます。えっと、これはミクロ一級の構成部分のようです。相互作用自体は複雑な行動であり、間違ったところに行くことができることが多い。これらはすべてコントロールが必要です。その中には制限が含まれています。私たちは一つの機能と二つの機能を持っています。この二つの機能はお互いに信頼できます。ミクロは互いに信用できない。

これは未来の技術だと思いますか?

サービスMeshは成長傾向です。これは私個人の意見です。それは十分に広範です。例えば、Istioがあります。そして雲の中には、同じアマゾンサービスのMeshが現れます。すべての大手メーカーが現れたり、完全なサービスができたりすると思います。

以前のようなブレークスルー技術がありますが、今はKubenetesがありますか?

近いうちにこの技術を開発しますか?

自分で言ってもいいです。私のインフラ。インフラ面では、これは今後数年間の主要なテーマであるKubenetesとサービスMeshです。

彼らは平行に発展しますか?

もちろん、それらは相補的なものですから。クベルnetesはruntimeを運転します。サービスMeshは相互作用を提供します。

より正確に言えば、Kubergnetsにはいくつかの成分があり、サービスのMeshの面をカバーすることができます。しかし、Kubersnetsでは、彼らはあまりにも基本的です。ネットの観点から見れば、Kubergnetesはあなたに低いレベルのネットワーク接続しか与えないという意味です。IPカバンはA時からB時までという意味です。一切。はい、国会のコントローラーがあります。もっと高いルートがあります。ネット接続だけではありません。しかし、Kubergnetsでは、例えば、要求の信頼性を確保するための内部メカニズムがない。これは簡単な例です。Kubergnetsで「下」の場合)デフォルト。これはメカニズムです。retry。しかし、ネットワークのレベルでは、そうではない。つまり、ホームサービスがごみ箱サービスの要求を送れば、何らかの理由で仕事をしないで、重複した要求が発生することはないということです。

サービスMeshはこの面で機能を追加しました。これは許可されています。要求が失敗したら、繰り返してください。他にも、out lier detectionのような仕組みがあります。例えば、「子会社」と「ホームページ」のサービスがあります。「子会社」は「かご」のサービスです。地理的に分離されていると、一部は「炉端」に見え、もう一部は「炉端」に見えます。したがって、サービスMeshにはいくつかの仕組みがあり、誰が利用できるかをダイナミックに描き、彼らの間で切り替えることができます。これらはすべて本当の時間です。その中の一人が「悪者」が大きすぎるなら、それを捨てます。すべての人はすべて決定することができます。私の話はゆっくりです。他のすべての正常なことはゆっくりです。これはどのように動作するかの異常検出機構である。十個の「項目別」があるとき、九つの「項目別」の仕事は間違いなく、十個はいつも間違いがあります。または9つの「子」の答えはlatency 15 msで、一つの答えはlatency 400 msで、サービス部はそれを捨てることにします。

もう一つのサービスのMeshはとてもいいです。統計データを集めているお客様にお願いします。私たちはクライアントとサーバーがあるという意味です。統計データは通常サーバー側に集められます。ええ、一番簡単なものですから。私たちは計量でユーザーとサービスの相互作用を理解したいです。したがって、この考え方によって、サーバー側ではなくクライアント側で測定するべきです。彼らの間には大きな溝があって、ネット接続がいっぱいです。

これらの異なるコンポーネントはすべて破損する可能性があります。

サービスのMeshがとてもいいです。彼は代理をそこに置いて、ここで数字の両端を統計します。可能性がある場合は、サービスサイドのlatencyは20 msで、一方の顧客は2秒である。例えば、サーバー側では、Webサーバから統計を収集していますが、5%のパケットがなくなった原因があります。その結果、retrasmit-sのために、TCPスタックは、私たちの顧客はlatency 2秒を見ています。サーバーの側にいても、私達はまだ良いlatencyを見ることができます。バッファエリアであれ、すべて完了しました。はい、20 ms遅くなりましたが、お客様はどうですか?

どうやって決めましたか?

原則として、これはお客様のツールによって解決されます。統計では、できるだけ取引先に近いものを集めたほうがいいです。しかし、お客様のツールはいつも可能ではなく、いつも便利ではありません。

会社の信頼性と利用性にはどのような度量がありますか?

ユニークな解決策とは何ですか?booking.comで見ましたが、そこで働いていますか?それとも標準ですか?

ありません私たちは変わったところが多いです。なぜ非標準的な引用符なのか説明しましょう。一般的な状況から、非標準性・・・会社が直面する問題以前の市場によって、「標準」の解決策は存在しない。この面では1997年以来ずっと市場で経営してきた会社として、まだ解決していない問題に直面していました。

何のようですか?

工芸のブランド、忠実で、更にon-boardingをやすいです。彼らはとても重要です。

直接数えられません。

ここに帰って、どれぐらい標準的な本と非標準的な本がありますか?そう言います。大多数ではないですが、多いです。市場上はまだ未知の問題を解決しました。他の会社は始めの時だけです。これは簡単で、迅速で安い問題を解決する会社です。

P.S.:SREテーマ全体をカバーすることができない一回の講演。道具だけでなく、哲学の方法もあります。そこで、私たちは2020年2月3日から5日まで行われるSLURM SRE会議でこのテーマについて広く議論しました。このテーマの広報担当者はイヴァンサークルによって、本の中の主な発展パートナーであり、彼の同僚Ben Tylerは、本の中の主要な発展パートナーであり、エドワードメドベージェフ、税関組織はTungsten Labs、イエブロガーvaravva、Googleの幅広い開発者である。