Skymizer, une startup taïwanaise de puces IA, a annoncé l'accélérateur d'inférence HTX301 et la plateforme matérielle/logicielle HyperThought le 11 mai 2026. Selon un communiqué de PR Newswire, l'entreprise affirme que la carte PCIe unique peut exécuter des modèles de langage jusqu'à 700 milliards de paramètres, comme Llama 3.1, grâce à son architecture propriétaire.
Le HTX301 est présenté comme un design de référence pour l'inférence IA sur site, ciblant les entreprises qui doivent déployer des modèles localement. Skymizer a déclaré que la puce y parvient grâce à une combinaison de mémoire à haute bande passante et de flux de données optimisé, bien qu'aucun benchmark de performance spécifique n'ait été fourni dans l'annonce.
La plateforme HyperThought comprend des outils logiciels pour le déploiement et la gestion de modèles, conçus pour simplifier l'intégration avec les flux de travail IA existants. Skymizer n'a pas divulgué de prix ni de dates de disponibilité pour le HTX301, et une vérification indépendante des capacités annoncées est en attente.