625 words
3 minutes
絶対にハードウェアの故障だと疑っていた
ハードウェア何も悪くない事件
職場で基幹サーバーのネットワークが調子が悪いとのことでお手伝いに行きました。 計画停電から調子が悪いらしく、自分にできることあるのか?と思いつつも見に行きました。
どうやらサーバーのeth0は正常だがeth1をActiveにするとパケットロスが発生してしまうとのこと。なるほど…となり、検証のためeth0とeth1のSFPと光ケーブルを入れ替えました。 しかし状況は変わらず。つまりSFPの次のNICが物理故障なのでは?という結論を出していました。
そこでふと、eth0を抜いた状態でeth1をActiveにし、その状態で再起動をかけるという方法を思いつきました。この方法の主目的としては、OSは起動時にnetに繋ごうとするのですが、この際の設定が起動時に有効になっているeth0に合わせるようになっている可能性を潰すためでした。
…再起動の結果、eth1でのパケロスが解消されました。 つまりここまで疑っていたハードウェアは何も問題がないことになります。疑ってごめんね。
そこからはベンダーさんに状況報告をして対策を講じてもらうことになりました。
今回の件で疑ってかかるのは良くないというのと、人が多いとそれだけで思いつく対応策も増えるので大事だなと言うことでしょうか…?いやでも絶対ハードウェアが原因だと思ってた。
余談
現職になってから何故か解決策が思いつくと言うのが多くなった気がします。社内SEみたいな仕事なので機器関連の問題対応にあたることが多いのですが、エラーを出さない機器も多いです。手当たり次第思いついた解決法を試しているだけなのですが、この解決方法の幅を広げるにはどうしたらいいのでしょう。やはり機器の原理を知り、経験を積んでいくのが王道なのでしょうか…?
絶対にハードウェアの故障だと疑っていた
https://fuwari.vercel.app/posts/soto/diary/2025/04/2025-04-17/