PR

ネットワーク障害で判明した、Quadroが一度も使われていなかった事実

PC・周辺機器

事務所でPC関連の仕事もしているという話は、このブログでも何度か書いていると思うのだけれど、小さい事務所ながら大体週に1度くらいはトラブルに行き当たる。

大抵は単純なトラブルで終わるんだけど、時々、厄介な出来事に行き当たることもある。

本日はそんな話。

なお、こちらが本日の主役である。

NVIDIA T1000 8GB ワークステーション用 Turingアーキテクチャ

※価格・在庫は各サイトでご確認ください。

そう、Quadro君だ。

スポンサーリンク
カテゴリ別人気記事
<カテゴリ別人気記事>

トラブルがトラブルを呼ぶ展開

スポンサーリンク

唐突に発生するNASトラブル

NAS(Network Attached Storage)に関する記事は、前回書いたよね。

NASの後継機を検討した
ここのところ新しいことに手を出す余裕がないので、社内でNAS導入を検討している話を少し書いていこう。まあ、あまり文章を練…

社内で使っているNASは、ルートHUBにぶら下がっているツールである。

1拠点・1フロアの場合の構成例

イメージ的にはこんな感じだが、実際にはもっと多数のHUBで多段に接続されている。個人的には一度整理したいのだけれど、建て増し旅館的に改造しているので、修正するのが結構大変なんだよね。

さておき、ネットワークにぶら下がっているパソコンのうち1台がネットワークに接続出来なくなった、というのが今回のトラブルの発端である。

トラブルの起きたPCユーザーはCAD担当で、AUTOCAD(2D-CAD)とSOLIDWORKS(3D-CAD)を使っていて、データをNASに保存しようとしたら繋がらないという事態を把握し、トラブル解決を求められたという話。

初手、Ping

この手のネットワークトラブルで、最初にやるのはコマンドプロンプト(今はPowerShellだね)を開いて、Pingを打つ作業である。

ここにPingコマンドで、NASのIPアドレスを打ち込んだが……、タイムアウト。ルーターのIPアドレスを打ち込んだが……、タイムアウト。

こ、これは。

「ping 127.0.0.1」で試す(自分自身にpingを打っているので、一番近いHUBを介して信号が帰ってくる)と、正常に反応が返ってきた。

ふむ。次に「IPconfig」コマンドも試してみたが、問題なく情報が表示される。

そうすると、つまりネットワーク設定に問題がなく、PCに繋がっているLANケーブルにも問題ないという意味になると思う。

隣のPCには問題がない

ここで困ったことに、隣のPCの状況を見るとトラブルは発生していないのである。隣のPCからは、ルーターもNASも見えるしネットワークに繋がるプリンターも見える。

そうすると、トラブルのあるPC本体を疑わねばならなくなる。

現時点で分かっている状況

  • トラブルのあったPC1:NASに接続不能、プリンタに接続不能、ルーターに接続不能
  • 隣のPC2:ネットワーク環境は正常
  • PC1とPC2に一番近いネットワークHUBは正常

話がややこしくなるので、トラブルのあるパソコンをPC1、隣のパソコンをPC2、一番近いHUBをHUB1としておく。

セキュリティソフトを疑う

次にやったのは、セキュリティソフトを疑う作業だ。

使っていたのは ESET の製品で、社内のPCには大抵コレがインストールされている。

ところがこの手のソフトは、セキュリティの観点から簡単に停止できないことがある。しかも、停止や除外設定をしようとしてもパスワードが要求される。

で、設定しているハズのパスワードを入力したのだが……、そのパスワードが通らない。管理者側から設定を見直そうにも、肝心のネットワークに繋がらないので無理。

つまり、切り分けしたいのに切り分けできない。なかなか嫌な状況である。

そこで、セーフモードで起動して、ネットワークとESETを切り離そうという話になった。

セーフモードでの起動とは、パソコンやスマートフォンに問題が発生した際、必要最低限のシステムファイルとドライバー(基本的な機能)だけで端末を起動する診断用の起動方法である。

セーフモード機能不能?!

Windowsには、セーフモードというモードが用意されていて、コレを使うためには幾つか手順が用意されている。一番有名なのはShiftキーを押しながら再起動をする方法なのだが、それを試してみたら画面が真っ暗。

……PCは起動しているみたいだぞ?

画面が表示されないという不具合に出会ってしまった。

ディスプレイの接続問題

慢性的な問題

ここで、PC1に発生していた問題を思い返してみたのだが、幾つか問題があったことを思いだした。

  1. 幾つかのネットワーク系のソフトが使えない
  2. 3D-CADを起動してパーツ数の多いアイテムを表示しようとすると、「メモリ不足警告」が出る。
  3. 2D-CADと3D-CADの両方を起動すると、動作が遅く感じることがある

今回、関係しそうなトラブル原因は、ネットワーク系のソフトが使えない問題。恐らくは、セキュリティソフトが悪さをしているという問題だ。

で、ESETを起動させない為には、不具合の切り分けができるセーフモードでの起動が必要。ここで正常に動けば、原因は「後から入れたアプリやドライバー」だと特定できるわけだ。

この「後から入れたアプリやドライバー」というところが、個人的には「画面が表示されない」という現象に発生の原因になっているのでは?と思い至る。

ディスプレイの接続問題発覚

で、この手のトラブルが発生した場合、最小構成で起動がトラブルの切り分けに必要である。

現状、ディスプレイは2枚繋がれているので、これを1枚にすれば……。

……ん?

違和感が。

どうして、ディスプレイの接続がマザーボード側のコネクタに接続されているのか??

PC1には、3D-CADを動かすために、グラフィックボード(Quadro)を追加して表示機能を強化している。だから、本来なら、グラフィックボードに設けられた出力コネクタにディスプレイケーブルが接続されていなければならない。

ところが、現状はマザーボード側の出力コネクタにディスプレイケーブルが繋がっている。

こ・れ・か!

Quadro搭載なのに

この話、抱えていた問題の2番目と3番目に影響していた可能性が極めて高い。その上、「セーフモードで画面真っ暗」の答えにも繋がるのである。

つまり、「Quadro搭載なのに、その性能をほとんど活かせていなかった」という衝撃の事実が発覚。

ガッカリの展開である。

なお、差し替えればそれで終わると思いきや、実はQuadroのポートはMini MDMIなのでケーブルがない。

Mini DP-DisplayPort 8Kケーブル

※価格・在庫は各サイトでご確認ください。

そこで Amazon で注文し、月曜日到着待ちという展開に。原因は分かったが、部材がないというIT現場ではありがちな、分かってからが長いパターンである。

ネットワークトラブルは別ルートで解決

なお、NASに繋がらなかった件は、別のトラブルから判明。

結局のところ、途中に挟んでいたHUBの電源が落ちていただけだった。しかも、そのHUBにつながる無線LAN機器はLAN給電タイプで、こちらも巻き添えで停止していた。

ネットギア アンマネージプラス スイッチングハブ PoE+対応(全体62W) GS308EP VLAN QoS

※価格・在庫は各サイトでご確認ください。

そのため、無線LANに繋がらないノートPCユーザーからクレームが出て、ようやく発覚したという、なんとも間の抜けた話だった。

では、隣のPC2はなぜ正常に使えていたのか?という話なんだけど……、PC1に繋がるHUB1とは別系統のHUB2に繋がっていたというオチ。これが、原因となったHUB3を介していなかったために、正常作動していたというわけ。

なんとも間抜けな話である。

ようやくQuadroを正しい端子に接続した

そして本日、注文していた mini HDMI ケーブルが到着。Quadro 側へきちんと接続し直して、セーフモードでも無事に画面が表示されることを確認した。

そのうえで、普段使っている人が休みだったため、高負荷の3Dモデルまでは十分に試せなかったが、タスクマネージャーを確認する限り、GPUにもきちんと負荷がかかるようになっていた。
ドライバもこの機に更新している。

結果として、長らく続いていたCADの遅延問題も解消した。部品点数の多い3Dモデルも、動くことを確認。

タスクマネージャーでメモリの占有率を確認

タスクマネージャーで確認してみると、高負荷運転するとGPU側のメモリはおよそ5GB程度使っており、RAM側は3GB程度しか余裕がなかった。つまり、もともとかなりカツカツの構成だったのだろう。

GPUが使えていない状態では、描画や処理の負担がRAM側に寄っていた可能性が高い。それなら、メモリ不足の警告が出る状況が発生していたのも納得がいく。

要するに、

  • NAS障害を調べていた
  • ネットワークの配線ミスが見つかった
  • その流れでセーフモードに入った
  • そこで、Quadroがまったく使われていないことが判明した
  • 接続を直したら、CADの重さも改善した

ということになる。

トラブル対応のはずが、別の問題を解消するきっかけになった。

結果だけ見れば、かなり実りのある障害対応だったのかもしれない。

まとめ

今回の教訓は単純だ。

グラフィックカードを採用したGPU搭載PCでも、ケーブルの挿し先が違えばGPUは動かない。

え?当たり前?

いやそりゃそうなんだけど、今回は画面自体は普通に映っていたので、気づくのが遅れた。さらに、ネットワーク障害のような別件が絡むと、調査はなおさら迷走する。

結局、今回の件は「NAS障害」でもあり、「CADの性能問題」でもあった。そして両方の裏にあったのは、どれもこれも、現場でありがちな“物理層のうっかり”だった。

間抜けな話ではあるんだけど、案外気が付かないんだよね。

コメント

タイトルとURLをコピーしました