We have noticed that you are visiting from North American areas. Would you like to browse the US site (US.DFI.com) for a better experience?

Vielen Dank für Ihre Teilnahme an dieser Umfrage. Ihre Rückmeldung hilft uns bei der Verbesserung unserer offiziellen Website und der Bereitstellung eines besseren Nutzererlebnisses.

Ihre Rückmeldung wurde erfolgreich versendet. Vielen Dank für Ihre Teilnahme.

Schließen
Erfolgsgeschichte

Die Autobahn des Edge-Computing - ICX610-C621A bringt mehr Bandbreite und herausragende KI-Leistung für Edge-Server

Die Autobahn des Edge-Computing - ICX610-C621A bringt mehr Bandbreite und herausragende KI-Leistung für Edge-Server

Mit wachsenden Ansprüchen an Leistung für Edge-Computing, ist die Leistungsfähigkeit bei der Übertragung und Verarbeitung von großen Datenmengen zu einem erheblichen Engpass für Industrieanlagen und medizinische Anwendungen geworden. Darüber hinaus bietet die Installation von Hochleistungs Edge-Servern die Möglichkeit, Platz zu sparen und durch Maximierung der Stellflächen und Vereinfachung der Bereitstellungsstrukturen, Betriebs- und Wartungskosten zu senken. Das ICX610-C621A ATX Motherboard von DFI mit Intel Xeon Prozessoren bietet zuverlässige Leistung für KI-Anwendungen und eine große Anwendungsbandbreite durch eine Fülle von Erweiterungssteckplätzen. Dadurch wird die Bereitstellung von Edge-Computing Geräten vereinfacht und die Produktivität durch optimierte Architektur erhöht.

 

Industrie: Automatisierung/intelligente Medizinanwendungen
Anwendungen: Edge-Computing Server
Lösung: ICX610-C621A Motherboard (Anwendungsvorschlag)

 

Vorteile von Edge Computing

In industriellen und medizinischen Anwendungen ist die industrielle Bildverarbeitung die Mutter der Industrialisierung 4.0 und ein wichtiger Bestandteil einer effizienten Produktion. Besonderen Anforderungen an Leistung werden bei der häufigsten KI-Anwendung, der industriellen Bildverarbeitung, an die dafür zuständige Recheneinheiten gestellt: Bilddaten müssen verzögerungsfrei empfangen, Rückmeldung nach schneller und genauer Analyse gesendet werden, Resultate und Bilddaten müssen gleichzeitig gespeichert werden. Das führt zu sehr hohen Ansprüchen an Bandbreite und Rechenleistung.

Im Rahmen des Edge-Computing müssen Daten in Echtzeit verarbeitet und analysiert werden. Dabei können die Daten nicht zur Verarbeitung in die Cloud gesendet werden, Software, Hardware und Daten müssen direkt am Edge-Server verarbeitet werden. Dadurch wird nicht nur die Übertragungsbandbreite verringert, so können auch Datenverzögerungen und damit Produktivitäts-Beeinträchtigungen verhindert werden und Kommunikation in Echtzeit mit der schnellsten Reaktionszeit ermöglicht werden.

Was wird beim Edge-Computing berechnet? Video- und Audiodaten sowie Daten von verschiedenen Sensoren. In Produktionslinien, die auf Effizienz optimiert sind, und in präzisen medizinischen Anwendungen müssen die Inhalte extrem detailliert sein, um genaue Ergebnisse zu erzielen. Dafür müssen große Mengen von Daten verarbeitet werden.

Edge-Computing-Szenario in der Fabrikautomatisierung

Eine Beispielarchitektur für Edge Computing in der Fabrikautomatisierung. Das Endgerät kommuniziert mit dem Edge-Computing-Server und sendet die Daten zurück. Der Server analysiert die Daten, sendet die entsprechenden Steuerbefehle zurück, speichert die Daten lokal und sendet sie dann bei Bedarf an die Cloud zurück. Der Cloud-Host sollte den Bedarf an Echtzeitanalysen minimieren, um Kommunikationsverzögerungen zu vermeiden.

 

Kritische Faktoren eines Edge-Computing-Servers

Ein Edge-Computing Server muss über die Fähigkeiten eines Mikro-Rechenzentrums und einer Edge-Cloud verfügen. Hohe Verarbeitungs- und Übertragungsgeschwindigkeit sowie Speichereffizienz werden ebenfalls benötigt. Der Schwerpunkt der Datenverarbeitung liegt auf Echtzeit und Präzision, die Übertragung muss mit geringer Latenz erfolgen und es muss genügend Bandbreite und Speicherplatz für den Datenzugriff zur Verfügung stehen. Dies alles ist die Spezialität von Motherboards der Serverklasse.

Das DFI ICX610-C621A kombiniert den Multi-Core und Multi-Thread Intel Xeon Prozessor als Multitasking-Spezialist, um den Datenverarbeitungsanforderungen mehrerer Endgräte gerecht zu werden. Durch die große Anzahl interner und externer Schnittstellen werden ausreichend Übertragungskanäle bereitgestellt, um eine große Anzahl von Speichergeräten zu verwalten. Das hat die folgenden drei Kernfunktionen:

  • Intel Deep Learning Boost
  • Intel AVX-512
  • PCIe 4.0-Unterstützung

 

Intel® Deep Learning Boost mit Intel® AVX-512

Deep Learning Boost gibt es nicht erst seit dieser Generation der Xeon Prozessoren, aber diese Technologie, basierend auf dem AVX512 VNNI Befehlssatz, ist mit der Aktualisierung der Prozessoren noch leistungsfähiger geworden. Dadurch wurde die Leistung von Deep LeBarning und visueller Analyse erheblich gesteigert. Die Leistungsverbesserung in der Trainingsphase einer KI-Anwendung beträgt 60%, die tatsächliche Inferenz ist über 30 Mal schneller als bei der ersten Generation.

 

Leistungsreferenz - FP32 vs. Int8

Mit der Optimierung von Berechnungen mit geringer Genauigkeit (Int8) beträgt der Unterschied zwischen Int8 und FP32 in Yolo-v3-tiny-tf fast das 3,5-fache, während die Segmentierung von Hirntumoren das 1,6-fache beträgt.

 

average performance boost

Durch strengere Daten für die Beurteilung und Analyse, steigert VNNI die Leistung von Berechnungen mit geringer Genauigkeit bei KI Deep Learning und Inferenzen exponentiell. Durch die Optimierung von Berechnungen mit geringer Genauigkeit wird der Datendurchsatz des Prozessors bei KI-Anwendungen deutlich gesteigert. Im Durchschnitt wird ein so Vorteil von 2,19 Mal, ein zeitlicher Vorsprung von 45% erzielt.

Ist diese Zeitersparnis von 45 % so entscheidend? Nehmen wir an, dass es 25 Millisekunden dauert, um einen Produktdefekt auf der Produktionslinie zu erkennen (Anmerkung 1). Durch eine Zeitersparnis von der Hälfte wird diese Zeit auf weniger als 15 Millisekunden gedrückt. Als Effekt davon können in der gleichen Zeit mehr Produkte identifiziert werden, Einsparungen bei Arbeitsstunden und eine Steigerung der Produktivität liegen auf der Hand.

Bei medizinischen Anwendungen kann dies auch eine Reduzierung der Zeit sein, die der Patient einer Untersuchung oder Strahlen ausgesetzt ist.

 

*(Anmerkung 1) Erkennungsgeschwindigkeit kann je nach Komplexität des Bildes und Gerätebelastung variieren, die hier angegeben Werte dienen lediglich als Vergleichswerte.

 

Leistungsreferenz - FP32 vs. Int8

Kennzeichen-Erkennung im Bereich der intelligenten Verkehrssteuerung benötigen oft Edge-Server als Verarbeitungsknoten. Je schneller eine Erkennung erfolgt, desto unmittelbarer kann das System reagieren und so z.B. das Verwalten von Parkplätzen reibungsloser und einfacher gestalten.

Das geringe Datenvolumen von Int8 verringert die erforderliche Speicherkapazität und Lesebandbreite, dadurch werden Verarbeitungslatenz verringert und Datendurchsatz erhöht. In diesem Anwendungsbeispiel hat Int8 den 6-fachen Datendurchsatz von FP32 und nur fast ein achtel der Latenzzeit.

 

PCIe 4.0 Bandbreiten-Sprung

PCIe 4.0 bietet die maximale Übertragungsgeschwindigkeit eines einzelnen Steckplatzes. Multipliziert mit der Anzahl der Steckplätze ist die Datenmenge, die kombiniert übertragen werden kann, beträchtlich. Das ICX610-C621A verfügt über 3 PCIe x16 und 8 PCIe x8 Steckplätze. Nur ein einziger PCIe x16 Steckplatz kann bei unkomprimierten Bilddaten zwei 8K Bilder mit der höchsten Abtastfrequenz verarbeiten (Anmerkung 2). Diese Berechnung setzt sehr anspruchsvolle Standards voraus. Bei komprimierten oder weniger anspruchsvollen 4K oder Full-HD Bildern, ist die Anzahl der Streams, die verarbeitet werden können, noch viel höher.

Bei Industrieanwendungen mit mehreren Produktionslinien und Bilderkennungen können genügend Erweiterungssteckplätze die Anzahl der Verarbeitungsknoten verringern und damit den Einsatz vereinfachen. So kann ein einziger Edge-Server eine große Anzahl von Peripheriegeräten verwalten und als lokale Cloud für die Zwischenspeicherung der empfangenen Daten dienen.

Das ICX610-C621A kombiniert alle o.g. Punkte und verfolgt beim Design der Erweiterungssteckplätze die Strategie „mehr ist besser“. Es verfügt über zwei 10GbE Ethernet-Anschlüsse sowei, trotz der maximalen Anzahl von PCIe Anschlüssen, sechs SATA und einen NVMe Steckplatz. Für den Arbeitsspeicher stehen 4 Kanäle und 8 Speichermodul-Steckplätze für insgesamt bis zu 512GB zur Verfügung. Von der Datenerfassung bis zur -verarbeitung und -speicherung auf der Rückseite sind alle Komponenten mit den höchsten Bandbreiten-Spezifikationen verbunden und schaffen so eine Autobahn des Edge-Computing.

 

ICX610-C621A Spezifikationen:

  • 3rd Gen Intel® Xeon® Scalable Processor Family
  • 8 ECC-RDIMM up to 512GB
  • 2 x 10GbE
  • IPMI OOB Remote Management
  • Single Display: VGA resolution up to 1920x1200 @ 60Hz
  • Multiple Expansion: 3 PCIe x16, 2 PCIe x8, 1 x M.2 M key
  • Rich I/O: 2 Intel GbE, 1 Dedicated IPMI, 2 COM, 5 USB 3.1 Gen1, 5 USB 2.0
  • 15-Year CPU Life Cycle Support Until Q2' 36 (Based on Intel IOTG Roadmap)

 

*(Anmerkung 2) Auflösung 7680x4320, 60 Bilder pro Sekunde, 16 Bit Farbtiefe, 4:4:4 Farbabtastung.

ICX610-C621A Spec

DFI Server-Produkte vereinfachen den Einsatz von Edge-Computing in AIoT-Architekturen

Die Komplexität von IoT-Implementierungen nimmt immer schneller zu. Die empfangenen Daten werden immer variierter und die Menger der zu verarbeitenden Informationen immer größer. Mit ihrer Leistung, Zuverlässigkeit und großen Bandbreite vereinfachen die Serverprodukte von DFI den Einsatz von Internet der Dinge, reduziert Schwierigkeiten beim Bereitstellen von Verarbeitungsknoten und erhöht die Produktivität bei gleichzeitiger Kosteneinsparung.