mozilla.orgデータセンターのネットワーク障害

あまりjaで情報が流れてなさそうなので、とりあえずメモ。詳細と対策は、bug-org 423809などを参照のこと。 まだ、微妙に障害が起こってるといううわさもありますので、outageページが見えてしまったら、これが原因ということで。

基本的には、サンジョゼにあるMPTデータセンターでネットワークスイッチの障害が発生し、3/18の20:01PDTから21:25PDTまでの間、パケットストームが起こってコロケーション全体が落ちてしまった、という感じですか。一台のスイッチのソフトウエア上の障害だろうと言われているそうです。二つの対策をスイッチ系に施している、コアからダウンストリームへの接続設定の耐障害性向上、ブロードキャストの許容流量を下げる、という話ですが、詳細は省きます。

いや、最初は定期的なダウンタイムかな、と思ったのですが、そんなアナウンスは流れてなかったし、justdaveとかからのglobal messageも流れてなかったし、ということで、何か変だなと思って。。で、nagiosを見ようとしてもつながらないし。

Leave a Reply »