Newsletter Subscribe
Enter your email address below and subscribe to our newsletter
Enter your email address below and subscribe to our newsletter

Rechenleistung wird bald vor allem zur Anwendung von KI gebraucht – und weniger zum Training der Modelle. Das eröffnet ganz neue Marktchancen – auch für das deutsch-amerikanische Chip-Start-up Tensordyne
Wenn einer die Trendwende erkennen kann, dann wohl er – Nvidia-Boss Jensen Huang, seines Zeichens wichtigster Manager im globalen KI-Chipmarkt, ist überzeugt: „Die Ära der Inferenz ist angebrochen.“ Gemeint ist damit, dass nach Jahren, in denen KI-Chips für vor allem für das aufwändige Training der großen Sprachmodelle eingesetzt wurde, nun der Bedarf an Rechenleistung für Anwendungen massiv wachsen wird. Wenn KI mit Nutzern chattet, Texte erstellt oder Bilder generiert, geht es um Inferenz.
Der Übergang ins Inferenzzeitalter könnte gleichzeitig eine einmalige Chance bieten: Weil andere Arten von Chips für die entsprechenden Berechnungen gebraucht werden, muss es diesmal nicht automatisch wieder Nvidia sein, das den Löwenanteil des Marktes auf sich vereint. Und so versucht sich derzeit eine ganze Reihe von neuen Anbietern daran, dem Chipmonopolisten den Rang abzulaufen.
Mit dem deutsch-amerikanischen Start-up Tensordyne kommt nun ein weiterer Player hinzu. Die Firma, die einst als Chipzulieferer fürs autonome Fahren gestartet war, bringt mit Napier ein Chipsystem für Rechenzentren auf den Markt, das effizienter und platzsparender sein und vor allem mit viel weniger Energie auskommen soll als herkömmliche Systeme. Das ist das Versprechen.
„Unsere Hauptinnovation liegt im mathematischen Bereich“, erklärt Mitgründer Gilles Backhus: „Damit haben wir es geschafft, Chipfläche und Stromverbrauch ziemlich stark zu reduzieren.“ Konkret geht es darum, dass die Multiplikationen, die KI-Modelle massenhaft zur Berechnung nutzen, durch logarithmische Additionen ersetzt werden – womit auf Ebene des eingesetzten 3-Nanometer-Chips nur ein Bruchteil der üblicherweise anfallenden Energie und Zeit benötigt würden.
Eine Napier-Recheneinheit mit 72 Chips übertreffe einen vollen NVL72-Rack von Nvidia und benötige dabei 75 Prozent weniger Strom und 70 Prozent weniger Stellfläche, heißt es. Tensordyne hofft, damit insbesondere im Energiehochpreisland Deutschland eine Marktlücke auftun zu können – als Standort für das Training von Sprachmodellen ist Deutschland schließlich bei den aktuellen Energiepreisen nicht wettbewerbsfähig.
Tensordyne ist mit seinem Vorstoß in den Inferenzmarkt allerdings bei weitem nicht allein. Auch Nvidia stellt sich mit den entsprechenden Produkten auf den Epochenwechsel ein, dazu kommt Erzrivale AMD, der sich über wachsende Marktanteile freuen kann. Und auch die Hyperscaler selbst entwickeln inzwischen Chips, weil sie die irrwitzigen Nvidia-Margen satt haben.
International positionieren sich darüber hinaus einige üppig finanzierte Angreifer: Positron AI aus den USA wurde im Februar mit 230 Mio. Dollar finanziert; Rebellions aus Südkorea erhielt jüngst sogar 400 Mio. Dollar. Die US-Firma Cerebras nahm bei ihrem Börsengang im Mai 5,55 Mrd. Dollar ein, die Aktie verlor seither allerdings fast ein Drittel an Wert. Bereits im Winter erhielt d-Matrix aus dem Silicon Valley 275 Mio. Dollar von Investoren und wurde dabei mit 2 Mrd. Dollar bewertet.
Tensordyne hofft, mit dem Rückwind aus dem aktuellen Produktlaunch im vierten Quartal ebenfalls noch einmal Geld einsammeln zu können. In Unternehmenskreisen rechnet man damit, dass dann eine Bewertung von bis zu 5 Mrd. Dollar möglich sein könnte. Bislang hat das Unternehmen nach eigenen Angaben mehr als 200 Mio. US-Dollar von Investoren bekommen.
Die Firma, die an seinen beiden Standorten in München und in Sunnyvale insgesamt 120 Mitarbeiter beschäftigt, war lange unter dem Namen Recogni bekannt. Vor knapp zehn Jahren ging sie mit Fokus auf Sensordatenverarbeitung und visuelle Erkennungssysteme an den Start. Wenig später legte das Unternehmen seinen ersten Pivot hin und versuchte sich als Chipspezialist für das autonome Fahren zu positionieren. Unter anderem investierten BMW und Toyota über ihre Risikokapitaltöchter in das Unternehmen. Weil der Durchbruch bei Automotive jedoch ausblieb, änderte Recogni 2023 erneut die Ausrichtung – und setzte kurz nach dem ChatGPT-Urknalls fortan auf Rechenzentren als Zielmarkt.
„Wenn wir schon 100 Millionen Umsatz im Automotivebereich gehabt hätten, dann hätten wir uns den Pivot natürlich zweimal überlegt oder vielleicht einfach eine zweite Sparte gestartet“, gibt Mitgründer Backhus zu. „Dass das nicht der Fall war, kann man auch ruhig ehrlich sagen.“ Dass sich das Start-up damals vor allem auf den zunehmend kriselnden Automarkt in Europa fokussierte, war keine Hilfe. Nun sollen es Kunden aus dem Rechenzentrumsmarkt richten. Von „namhaften Cloud- und KI-Infrastrukturbetreibern“ lägen bereits Absichtserklärungen im Wert von über 200 Mio. Dollar vor, erklärt das Unternehmen.
Der sogenannte Tape-Out, also die Freigabe der Chip-Designdaten, an den Auftragsfertiger TSMC, ist nach Angaben von Tensordyne bereits abgeschlossen. Im nächsten Schritt werde die Produktion starten, bei der man mit dem der HPE-Tochter Juniper Networks sowie Broadcom und TSMC zusammenarbeite. Dass Tensordyne letztlich seinen Platz unter den Inferenzanbietern finden werde, davon ist Backhus fest überzeugt. „Am Ende ist der Markt sehr groß und auch sehr schnell wachsen.“