MiniCPM-V 4.6 : un modèle de 1,3B fonctionne sur RTX 4090

OpenBMB et l'Université Tsinghua publient MiniCPM-V 4.6, un modèle multimodal de 1,3 milliard de paramètres fonctionnant sur une seule RTX 4090.

MiniCPM-V 4.6: 1.3B Model Runs on RTX 4090

Image: pandaily.com

OpenBMB, en collaboration avec l'Université Tsinghua, a publié en open source MiniCPM-V 4.6, un modèle de langage multimodal de 1,3 milliard de paramètres. Le modèle est conçu pour fonctionner efficacement sur une seule carte graphique NVIDIA RTX 4090, rendant l'IA avancée accessible aux développeurs individuels et aux petites équipes.

Selon le dépôt GitHub du projet et les annonces officielles, MiniCPM-V 4.6 atteint des performances comparables à celles de modèles plus grands sur des benchmarks tels que MMMU et MathVista. Il prend en charge les entrées d'images et de texte, permettant des tâches comme la réponse à des questions visuelles et l'analyse de documents.

La version inclut des poids pré-entraînés et du code d'inférence sous une licence open source. La petite taille du modèle permet un déploiement local sans dépendances cloud, répondant aux préoccupations de confidentialité et de latence. En mai 2026, le projet a attiré l'attention de la communauté IA pour son efficacité et son accessibilité.

❓ Frequently Asked Questions

What is MiniCPM-V 4.6?

It is a multimodal AI model with 1.3 billion parameters, open-sourced by OpenBMB and Tsinghua University.

What hardware does it require?

It runs on a single NVIDIA RTX 4090 GPU, making it accessible for local deployment.

What tasks can it perform?

It handles image and text inputs for tasks like visual question answering and document analysis.

📰 Source:
pandaily.com →
Partager: