Die Birentech BR100 GPU aus China verspricht 256 TFLOPs und 64 GB HBM2E bei 550 Watt
Der chinesische Chiphersteller Biren Technology hat mit der BR100 und der BR104 zwei neue Grafikkarten vorgestellt, die beeindruckende Spezifikationen bieten. Die BR100 bietet als Topmodell zwei GPU-Chiplets, die bei TSMC mit einer Strukturbreite von 7 nm hergestellt werden. Der gesamte GPU-Die bietet eine Fläche von 1.074 Quadratmillimetern, 77 Milliarden Transistoren, 512 Execution Units (EUs), 256 MB L2-Cache, 8 MB L1-Cache und 64 GB HBM2E-Grafikspeicher.
Das Chiplet-Design soll die Ausbeute verbessern und damit die Kosten reduzieren. Die beiden GPU-Chiplets werden über ein Interconnet miteinander verbunden, das eine Bandbreite von 896 GB/s erreicht. Birentech spezifiziert eine ganze Reihe an Performance-Metriken: Die Grafikkarte soll 2.048 TOPs (INT8), 1.024 TFLOPs (BF16) und 256 TFLOPs (FP32) erreichen. Zum Vergleich: Die Nvidia GeForce RTX 3090 Ti kommt bei Fließkomma-Berechnungen mit einfacher Präzision (FP32) auf 40 TFLOPs, die Nvidia A100 auf 19,5 TFLOPs.
Die Grafikkarte richtet sich an den HPC-Markt, daher vergleicht der Hersteller die Performance im unten eingebetteten Benchmark-Vergleich mit der Nvidia A100. Demnach kann die GPU in Deep-Learning-Workflows eine bis zu 2,8 Mal höhere Performance erzielen, bei einem 120 Prozent höheren Stromverbrauch. Wenn diese Angaben korrekt sind, wäre die BR100 nicht nur leistungsstärker, sondern auch effizienter als Nvidias Ampere-Architektur.
Die Anbindung ans Mainboard erfolgt über PCIe 5.0 x16. Birentech bietet mit der Biren BR104 auch eine günstigere Version der Grafikkarte an, die mit nur einer statt zwei GPUs ausgestattet ist, sodass die halbe Performance und 32 GB HBM2E-Grafikspeicher bei einer TDP von 300 Watt erreicht werden. Ob die Grafikkarten von Birentech in praxisrelevanten Workflows tatsächlich eine deutlich bessere Leistung erzielen als die Nvidia A100 und H100, werden wohl erst unabhängige Benchmarks zeigen.