Exploration des Applications
Avec le lancement de ChatGPT et GPT-Vision, la promesse de fusionner la technologie de traitement du langage naturel et celle de la vision par ordinateur est enfin réalisée. Cette initiative marque un pas de géant dans la quête d’une intelligence artificielle plus performante. Les exemples qui suivent démontrent la variété et la profondeur des applications possibles, ouvrant ainsi un vaste champ d’exploration et d’innovation. Découvrez comment ces technologies transforment la manière dont nous interagissons avec les données visuelles et textuelles.
Modélisation à partir d’une image
La synergie entre ChatGPT et GPT-Vision déverrouille des fonctionnalités inédites. Nous avons sélectionné quelques exemples captivants qui illustrent la diversité des applications possibles.
Découvrez ici comment une simple image se transforme en une modélisation 3D impressionnante :
Programme de musculation personnalisé selon votre équipement
Laissez-vous guider par un programme de musculation sur-mesure en fonction de votre matériel disponible :
Et explorez d’autres idées de programme ici :
Analyse et décodage de documents floutés
Découvrez comment un document flouté révèle ses secrets grâce à l’analyse approfondie :
Conversion de photos en texte pour une lettre complexe
La technologie transforme une image de lettre en texte éditable :
Récupération d’objets complexes dans une image
Explorez comment la technologie identifie et récupère des objets complexes :
Détection d’images issues de Google Street View ou de satellites
Une démonstration de détection précise d’images satellitaires ou de Google Street View :
Analyse détaillée d’une radiographie
Une analyse de radiographie, bien que impressionnante, il est recommandé de consulter un spécialiste :
Analyse d’images complexes
Plongez dans l’analyse d’une image hautement complexe :
Création de scénarios à partir de l’analyse de plusieurs images
Découvrez comment quatre images distinctes se muent en un scénario cohérent :
Analyse d’un moteur de voiture
Une analyse minutieuse d’un moteur de voiture, encore une fois, la consultation d’un professionnel est conseillée :
Optimisation de code
Un regard sur l’optimisation de code grâce à cette technologie :
Limitations Notables
Malgré les prouesses affichées, certaines limitations persistent. Il est crucial de noter que la lecture des QR Codes et le partage des conversations restent hors de portée pour le moment.
Si vous ne voyez pas ces nouvelles fonctionnalités, une simple actualisation de la page, ou une déconnexion/reconnexion peuvent résoudre le problème. En cas de persistance, la suppression du cache lié à openai.com pourrait être une solution à envisager.
La capture d’écran ci-dessous illustre une des interfaces utilisateur de ces nouvelles fonctionnalités :

Vidéo GPT-Vision
Il faut évidemment que je crédite l’excellente chaine YouTube de Emile Dev (à suivre si vous souhaitez vous tenir informé sur les actualités de l’intelligence artificielle) qui a inspiré cet article et dont voici la vidéo de présentation: