We have noticed that you are visiting from North American areas. Would you like to browse the US site (US.DFI.com) for a better experience?

簡単なアンケートにお答えください。

このアンケートにご協力いただきありがとうございます。ご意見は、公式のウェブサイトを改善し、より良いユーザーエクスペリエンスを提供することに役立ちます。

あなたの意見は正常に送信されました。 ご協力に感謝します。

閉じる
成功事例

エッジコンピューティングの高速道路- ICX610-C621Aは、より大きな帯域幅と優れたAI性能をエッジサーバーにもたらす

エッジコンピューティングの高速道路- ICX610-C621Aは、より大きな帯域幅と優れたAI性能をエッジサーバーにもたらす

エッジコンピューティングの性能に対する需要が高まるのに伴い、いかにして端末で大量のデータを効率的に伝送・処理するかが、工業プラントや医療アプリケーションにおける大きなボトルネックになっています。スペースコストが非常に高いこともあり、高性能のエッジサーバーを設置することは、フロアスペースの節約を最大化し、デプロイメント構成を簡素化して、運営及びメンテナンスのコストを削減する効果的な方法です。DFIにIntel Xeonプロセッサが搭載されたICX610-C621A ATXマザーボードは、AIアプリケーションに信頼性の高い性能を提供するとともに、豊富な拡張スロットを通じて十分な帯域幅を提供し、エッジコンピューティングデバイスのデプロイメントを簡素化して、最も俊敏なアーキテクチャで生産性を向上させます。

 

産業:ファクトリーオートメーション/スマート医療
アプリケーション:エッジコンピューティングサーバー
ソリューション:ICX610-C621Aマザーボード (アプリケーションの提案)

 

エッジコンピューティングの優位性

産業及び医療分野において、マシンビジョンはインダストリー4.0の母であり、高い生産性を維持するためのカギです。最も一般的に使用される人工知能のアプリケーションとして、マシンビジョンを担うコンピューティングデバイスは、特に性能に対する要件が厳しく、端末機器から伝送されてきた映像データを遅延なく受信し、迅速かつ正確に分析してフィードバックすると共に結果を保存し、対応する映像を記録する必要があるため、デバイスの外部帯域幅及びコンピューティングコア能力にとって大きな試練となります。

また、エッジコンピューティングのフレームワークでは、これらのデータは可能な限り端末において即座に処理・分析しなければならず、ソフトウェア、ハードウェア、データを含むすべてのデータをクラウドに送り返すことは適さず、エッジに最も近い方法で動作する必要があります。これは、伝送帯域幅を低下させるだけでなく、データの遅延による生産効率の低下を回避し、最速の応答速度で即座に機器と通信することを可能にします。

エッジコンピューティングは、どのようなコンテンツを演算する必要があるのでしょうか?それは、映像、音声、及びさまざまなデバイスからのセンシングデータです。生産効率を追求する生産ライン及び精度を追求する医療アプリケーションにおいて正確な結果を生成できるよう、これらのコンテンツは極めて精密でなければなりません。そして、精密なコンテンツは、処理に必要な大量のデータがあることを意味します。

一言で言えば、クラウドアーキテクチャだけに依存して端末のコンピューティングのニーズを満たすことは困難であり、端末に大量かつ複雑なコンピューティング機器を組み込む場合、スペース及びメンテナンスのコストに問題が生じます。エッジコンピューティングサーバーはこの重要な役割を合理的に担い、データに最も近い場所でデータの受信・処理・返送を行って、複数のタスクを兼務しています。また、アプリケーション全体において、端末機器に最も近いノードと見なすことができます。インターフェースの統合能力、柔軟なソフトウェアサポート及び仮想化機能も重要な考慮すべき事項であり、今回は「性能」に焦点を当てます。

ファクトリーオートメーションにおけるエッジコンピューティングシナリオ

ファクトリーオートメーションアプリケーションにおけるエッジコンピューティングのアーキテクチャ例。端末デバイスは、エッジコンピューティングサーバーと通信し、データを送り返す。サーバーはデータを解析し、対応する制御コマンドを送り返し、ローカルにデータを保存し、必要に応じてクラウドに送り返す。クラウドホストは、通信の遅延を避けるために、リアルタイム分析の必要性を最小限にする必要があります。

 

どのような性能がエッジコンピューティングサーバーの位置付けに相応しいのか

エッジコンピューティングサーバーは、マイクロデータセンター及びエッジクラウドの能力、すなわち処理速度、伝送速度、ストレージ効率を備えている必要があります。コンピューティングは、速度及び精度に重点を置くほか、伝送が低遅延である必要があり、データアクセスにおいて十分な帯域幅及びスペースを有するのは、サーバーレベルのマザーボードの特長です。

DFI ICX610-C621Aを例にすると、マルチコア・マルチスレッドと組み合わせたIntel Xeonプロセッサは、複数の端末機器からのデータ処理ニーズを満たすことができる優れたマルチタスカーであり、驚異的な数の内部/外部伝送ポートにも十分な伝送チャネルを提供するとともに、多数のストレージデバイスを管理でき、これらのエッジサーバーのベンチマークがすべてこのマザーボードで実現可能となります。

ICX610-C621Aは、IntelIce Lakeプラットフォームで第3世代のIntel® Xeon® プロセッサをサポートします。この世代のXeonプロセッサは、AIコンピューティングに非常に優れています。そして、次のような3つのコア機能を有しています。

  • Intel Deep Learning Boost
  • Intel AVX-512
  • PCIe 4.0 対応

 

Intel® Deep Learning Boost 搭載 Intel® AVX-512

Deep Learning Boostは、この世代のXeonプロセッサでは提供されませんでしたが、AVX512 VNNI命令セットに基づく技術は、プロセッサが更新されるにつれてより強力になり、深層学習及び視覚分析の性能においても大幅に向上しています。AIアプリケーションの訓練段階では、性能が約60%向上し、実際の推論時において、第1世代よりも30倍以上高速となりました。

 

Performance Reference - FP32 vs Int8

上のグラフは、最も人気のある物体認識モデルYolo_v3及び医療分野のBrain Tumor SegmentationでAI推論性能を実測したものです。低精度演算(Int8)の最適化により、Yolo_v3のテストでは、FP32との差が約3.5倍、Brain Tumor Segmentationとの差が1.6倍となりました。

 

average performance boost

さらに、厳密なデータで判断・解析した場合、VNNIはAI深層学習及び推論における低精度演算の性能を劇的に向上させました。低精度演算の最適化により、AIアプリケーションを実行する際のプロセッサのデータスループットが大幅に増え、平均で約2.19倍の差異が生じます。そしてこれは、約45%の時間短縮を意味しています。

45%の時間を節約できるということが意味することは何でしょうか?生産ラインで製品の1つの箇所の欠陥を識別するのに25ミリ秒(注1)かかると仮定した場合、約半分の時間を節約すると15ミリ秒未満となります。そのような時間の節約が増えると、同様の時間内で識別できる製品の数も増え、言うまでもなく、大量にデプロイする場合における節約可能な工数及び生産性が向上します。

また、医療アプリケーションにおいても、検査員を不快にさせる可能性のある生理学的スキャンまたは放射線被曝の時間を短縮することもできます。

 

*(注1) 識別速度は、画像の複雑さ及び機器の負荷によって基準が異なる場合があり、ここでの値は、比較のためのものです。

Performance Reference - FP32 vs Int8

スマート交通分野のナンバープレート識別のアプリケーションにおいても、多くの場合、コンピューティングノードとしてのエッジサーバーが必要です。識別速度が速いほど、システムはこれに応じてよりすばやく応答することができ、駐車場のゲート及び駐車スペースの管理がよりスムーズで容易になります。

Int8は、データ容量が少なく、全体的に必要なストレージ容量及び読み取り帯域幅も減少されるため、自然と処理の遅延が減少し、スループットが増えます。この応用例において、Int8のスループットはFP32の6倍となり、遅延はわずか約8分の1となりました。

 

PCIe4.0帯域幅の大躍進

PCIe 4.0は、単一のスロットが伝送できる最大帯域幅を提供します。数量の加算・乗算を組み合わせた場合、伝送できるデータ量を過小評価できません。ICX610-C621Aには、3つのPCIe x16スロット及び8つのPCIex8スロットがあります。単に1つのPCIex16スロットが処理できる非圧縮画像データを計算するだけの場合であれば、1つのスロットで2つのチャネル・8Kの最高のサンプリング周波数画像を処理できます(注2)。これは、最も厳しい基準で計算されているため、圧縮された低トラフィックの4KまたはFull-HDの映像の場合、処理できるストリームの量は驚くべき数字になります。

識別が必要な複数の生産ライン及びマルチチャネルの映像がある産業分野では、十分な拡張スロットにより処理ノードの設置数を減らすことができると同時に、デプロイメント上の簡素化を実現することができます。エッジサーバーが1台あれば、多数の周辺機器を管理できるほか、これらのデバイスによって生成されたデータを一時的に保存する、ローカルクラウドとしても機能することができます。

上記のデータを組み合わせたICX610-C621Aは、周辺ポートの設置にも大艦巨砲の戦略を採用しています。10GbEのイーサネットだけでも2セットあり、PCIeスロットの数が最大化されていることを前提として、6セットのSATA及び1つのNVMeスロットが挿入されています。メモリ部分は4つのチャネル及び8つのモジュールを採用することで、最大容量は512GBに達します。データキャプチャーから演算、さらにはバックストレージまで、すべて最高の帯域幅仕様で直列接続されることで、エッジコンピューティングのハイウェイを打ち出します。

 

ICX610-C621Aのスペック

  • 3rd Gen Intel® Xeon® Scalable Processor Family
  • 8 ECC-RDIMM up to 512GB
  • 2 x 10GbE
  • IPMI OOB Remote Management
  • Single Display: VGA resolution up to 1920x1200 @ 60Hz
  • Multiple Expansion: 3 PCIe x16, 2 PCIe x8, 1 x M.2 M key
  • Rich I/O: 2 Intel GbE, 1 Dedicated IPMI, 2 COM, 5 USB 3.1 Gen1, 5 USB 2.0
  • 15-Year CPU Life Cycle Support Until Q2' 36 (Based on Intel IOTG Roadmap)

 

*(注2) 解像度7680×4320、毎秒60フレーム、色深度16bit、カラーサンプリング4:4:4。

ICX610-C621A Spec

DFIサーバー製品ラインナップは、AIoTアーキテクチャでのエッジコンピューティングノードのデプロイメントを簡素化

IoTのデプロイメントは、日々複雑化しており、受信するデータも多様化するだけでなく、処理する必要のある情報量もこれまでとは異なってきています。DFIサーバー製品ラインナップは、性能、高い信頼性、豊富な帯域幅を出発点として、IoTのデプロイメントを簡素化し、ノードデプロイメントの難易度を軽減させ、コストを節約しながら生産性を向上させます。