2つのコロ間でデュアル運用し、段階的な BGP カットオーバーとストレージレプリケーションを実施。ダウンタイムを最小化して計画移行しました。 移設前にネットワークとストレージの切替手順を波ごとに検証し、タイミングとロールバックの所要時間を把握。計画と実行のばらつきを抑えました。
クライアント:首都圏内でのエンタープライズ DC 移設
課題
- データ損失なし、最小ダウンタイムでの重要業務移行
- 移設期間中のサービス継続と、ラック/電力コストの削減
背景
老朽化と電力コスト増、複雑な配線で増設の柔軟性が低下。作業可能なメンテナンス時間も限定的でした。
アプローチ
- 事前にレイテンシ/スループットの基準値を測定し、移設中・移設後の劣化を検知できる閾値を設定。ファシリティ(電源・空調・入退)も事前承認
- 切替のパイロット波でフェイルオーバー手順を検証し、切断/検証/戻しの所要時間を計測して、以降のメンテナンス時間を最適化
2つのコロを並行稼働させ、事前にレプリケーションとネットワーク設計を固めた上で段階的にカットオーバー。ロールバック手順も検証済み。
実施内容
- 並行運用と段階的な L3/BGP カットオーバー
- ラベリングとチェックリストを徹底し、ラック再構築の時間短縮と移設後のトラブルシュートを抑制
- 変更窓はサービス単位で順序化し、関係者コミュニケーションをテンプレート化。バックアウトパスを明示
- 最終デルタ前後は監視閾値を引き締め、異常を早期検知
- 環境監視を前後で比較し、気流/温度分布の改善を確認
- BGP ポリシーと保守窓をサービス別に設計し、移設の波ごとに検証
- ストレージのスナップショット/増分レプリケーション(最終デルタ短縮)
- ホット/コールドアイル、二重電源、8〜9架の新設後に集約
次のステップ
旧設備の廃棄と電源最適化。関連サービス:ITAD、クラウドインフラ。
成果
- データ損失 0 件、トータルダウンタイム <45分(夜間)
- 検証結果(切替時間や事後インシデント率)をナレッジとして蓄積し、次回移設のメンテ窓と容量計画に反映
- ラック台数 6 → 4、電力/保守 OPEX −22%
期間
6週間(入念なフェイルオーバー訓練を実施)
使用技術
BGP、エンタープライズ ストレージレプリケーション、DC ファシリティ
