Castorp a écrit:
Ben si les LLM sont incapables de gérer des trucs dont les localisations sont déjà connues, comment veux-tu qu'elles gèrent des trucs plus abstraits et chaotiques ?
C'est en ça que les Altman et Amodei de ce monde fument de la colle.
Cela n'a pas trop d'intérêt d'utiliser des LLM pour cela, parce que c'est purement de la donnée, massive, mais assez structurée, homogène et bien standardisée avec les technologies existantes (du moins pour les standards de fichiers techniques, pour le contenu et les subdivisions administrative c'est une autre histoire).
Tu ne vas pas entraîner un modèle avec des critères morphologiques en disant "Cologne se trouve à droite de Paris et à gauche de Berlin, à peu près mi-distance" ou "le Rhône descend en ligne droite vers la Méditerranée et ne va pas en Italie", cela te sert à contrôler l'information (où à la rigueur faire une main levée, de toute façon inexacte), pas à la construire. Tu vas juste positionner des points dans un espace à deux axes.
L'enjeu n'est pas de l'interpréter, mais d'y accéder et de l'afficher, éventuellement en améliorant esthétiquement les fonds de cartes.
En plus il y a une problématique liée à la projection cartographique qui impose un calcul (implicitement on utilise la plupart du temps celle des GPS, mais un LLM lui n'a pas de raison de privilégier celle-ci plutôt qu'une autre).
L'enjeu serait plutôt de relier les LLM à ces systèmes qui fonctionnent (il y a par exemple OpenStreetMap comme solution "open source" :
https://nominatim.openstreetmap.org/ui/search.html, GeoNames).
En fait un LLM peut tout faire sauf des calculs...
Bizarrement sur ta carte il n'a pas trop raté les fleuves d'Espagne et Portugal (peut-être parce qu'il y en a peu - il a quand-même coupé le Tage à la frontière), mais merdé tous les autres