La puce HTX301 de Skymizer vise l'inférence IA à 700B paramètres

Skymizer a annoncé la puce d'inférence HTX301, affirmant un support monocarte pour les modèles à 700 milliards de paramètres via sa plateforme HyperThought.

Skymizer HTX301 Chip Targets 700B Parameter AI Inference

Image: letsdatascience.com

Skymizer, une startup taïwanaise de puces IA, a annoncé l'accélérateur d'inférence HTX301 et la plateforme matérielle/logicielle HyperThought le 11 mai 2026. Selon un communiqué de PR Newswire, l'entreprise affirme que la carte PCIe unique peut exécuter des modèles de langage jusqu'à 700 milliards de paramètres, comme Llama 3.1, grâce à son architecture propriétaire.

Le HTX301 est présenté comme un design de référence pour l'inférence IA sur site, ciblant les entreprises qui doivent déployer des modèles localement. Skymizer a déclaré que la puce y parvient grâce à une combinaison de mémoire à haute bande passante et de flux de données optimisé, bien qu'aucun benchmark de performance spécifique n'ait été fourni dans l'annonce.

La plateforme HyperThought comprend des outils logiciels pour le déploiement et la gestion de modèles, conçus pour simplifier l'intégration avec les flux de travail IA existants. Skymizer n'a pas divulgué de prix ni de dates de disponibilité pour le HTX301, et une vérification indépendante des capacités annoncées est en attente.

❓ Frequently Asked Questions

What is the HTX301 chip?

The HTX301 is an inference accelerator chip announced by Skymizer, claimed to run large language models with up to 700 billion parameters on a single PCIe card.

What is the HyperThought platform?

HyperThought is a hardware/software platform from Skymizer that includes tools for deploying and managing AI models on-premises, designed to work with the HTX301.

When will the HTX301 be available?

Skymizer has not announced pricing or availability dates for the HTX301 as of the May 11, 2026 announcement.

📰 Source:
letsdatascience.com →
Partager: