Forum de FilmDeCulte

Le forum cinéma le plus méchant du net...
Nous sommes le 02 Aoû 2025, 03:47

Heures au format UTC + 1 heure




Poster un nouveau sujet Répondre au sujet  [ 147 messages ]  Aller à la page Précédente  1 ... 6, 7, 8, 9, 10
Auteur Message
MessagePosté: 10 Juil 2025, 11:15 
Hors ligne
Expert
Avatar de l’utilisateur

Inscription: 27 Déc 2018, 23:08
Messages: 6876
Khdkd

_________________
He pays penance to the air above him

N.O. - The Him


Dernière édition par Vieux-Gontrand le 10 Juil 2025, 16:30, édité 11 fois.

Haut
 Profil  
 
MessagePosté: 10 Juil 2025, 11:23 
Hors ligne
Expert

Inscription: 30 Sep 2016, 19:39
Messages: 6243
Vieux-Gontrand a écrit:
Mais traduire "vide" par "sans nuances" c'est pas un peu un contresens, comme disent les profs?


En plus cela fait passer un point de vue sur l'origine du texte pour son contenu. Et la gradation dans le choix des adjectifs introduit une intention qu'il n'y a pas dans l'original.

À la limite la tournure "il n'y a pas de futur" éviterait le solécisme en préservant le sens, ainsi que le niveau de langue du texte de départ.


C'est un meme avec une punchline à la fin, d'où la liberté prise dans la dernière traduction qui est une morale pas la traduction de la phrase en anglais.


Haut
 Profil  
 
MessagePosté: 15 Juil 2025, 11:11 
Hors ligne
Expert

Inscription: 30 Sep 2016, 19:39
Messages: 6243
Vieux-Gontrand a écrit:
Heu utiliser un modèle existant est devenu facile, mais répliquer un modèle, dans le sens le réentraîner ou faire du fine tuning dessus, n'est pas à la portée du premier venu et reste encore coûteux, fastidieux et lent, notamment parce qu'il faut normaliser et classifier de nouvelles données; puis faire converger le modèle vers celles-ci.

Et si le cas d'utilisation est trop précis ou trop spécifique ce n'est pas bon non plus, car le modèle risque d'être suradapté et inutilisable en dehors du contexte d'entraînement, et de cela (à mon niveau, j'imagine qu'il ya de la recherche sur la question) on ne s'en aperçoit qu'à l'usage.


https://youtu.be/8enXRDlWguU

Une interview d'une journaliste qui a écrit un bouquin, critique, sur la bulle AI, elle explique qu'il y a deux paradigmes, l'un consistant à créer des petit modèles adaptés à des problèmes particuliers et l'autre, celui d'OpenAi, consistant à faire un truc tout intégré, beaucoup plus gourmand en énergie et en données et moins pratique. OpenAi, ce faisant, occulte un peu donc ces systèmes qui sont développés en parallèle.


Haut
 Profil  
 
MessagePosté: 16 Juil 2025, 09:21 
Hors ligne
Expert
Avatar de l’utilisateur

Inscription: 17 Juin 2021, 13:07
Messages: 1960
sinon chat a pris le reflexe américain de dire "très bonne question" systématiquement, et je me suis demandé quand est-ce que cette petite technique pour valoriser son interlocuteur et créer une atmosphère positive d'apprentissage deviendra totalement hégémonique en france aussi par mimétisme.

aux usa c'est vraiment une blague.
- excuse me, what time is it ?
- great question !


Haut
 Profil  
 
MessagePosté: 16 Juil 2025, 14:40 
Hors ligne
Sir Flashball
Avatar de l’utilisateur

Inscription: 23 Déc 2013, 01:02
Messages: 24329
Sur Youtube, maintenant, les vidéos sont doublées automatiquement, et c'est l'option par défaut.
C'est de la merde à tous les niveaux (trad, voix, intonation), personne ne veut de cette fonctionnalité de merde, mais bon, il faut que les GAFA nous fassent bouffer de leur IA à tout prix, en espérant un jour rentrer dans leurs frais.

_________________
"Je vois ce que tu veux dire, mais..."
"Je me suis mal exprimé, pardon."


Haut
 Profil  
 
MessagePosté: 16 Juil 2025, 14:47 
Hors ligne
Expert
Avatar de l’utilisateur

Inscription: 17 Juin 2021, 13:07
Messages: 1960
intéressant. je crois que notre génération a beaucoup appris l'anglais grâce à internet, je me demande si l'inévitable invasion des traductions automatiques (genre même sur les réseaux sociaux je peux imaginer que la traduction sera l'option par défaut d'ici peu de temps) ne va pas faire reculer ça. sachant que même en voyage avec toutes les apps de traduction simultanée ce n'est plus vraiment "obligatoire".

et bien parler des langues étrangères redeviendra un fort marqueur social.


Dernière édition par FingersCrossed le 16 Juil 2025, 14:55, édité 1 fois.

Haut
 Profil  
 
MessagePosté: 16 Juil 2025, 14:54 
Hors ligne
Sir Flashball
Avatar de l’utilisateur

Inscription: 23 Déc 2013, 01:02
Messages: 24329
FingersCrossed a écrit:
je me demande si la nécessaire invasion des traductions automatiques (genre même sur les réseaux sociaux je peux imaginer que la traduction sera l'option par défaut d'ici peu de temps)


C'est déjà l'option par défaut sur Reddit. Je dois désactiver ça à chaque fois. Et c'est de la PURE merde.
Le pire : quand Google fait des recherches, il va fouiller dans les trad automatiques de Reddit, et te remonte ça comme des réultats en français : du coup, c'est absolument n'importe quoi.

Les GAFA ont vraiment transformé le net en un champ de merde.

_________________
"Je vois ce que tu veux dire, mais..."
"Je me suis mal exprimé, pardon."


Haut
 Profil  
 
MessagePosté: 17 Juil 2025, 23:06 
Hors ligne
Sir Flashball
Avatar de l’utilisateur

Inscription: 23 Déc 2013, 01:02
Messages: 24329
OpenAI vient de dévoiler son nouvel "agent". Et dans la vidéo de démo (avec Sam Altman, no less!), ils demandent à la machine de planifier un voyage à travers les Etats-Unis permettant de visiter de la façon la plus efficace possible tous les stades de la MLB (la ligue de baseball américaine).

Et voici la carte qu'a pondu ChatGPT.
Image

C'est à se pisser dessus à quel point y a rien qui va.

_________________
"Je vois ce que tu veux dire, mais..."
"Je me suis mal exprimé, pardon."


Haut
 Profil  
 
MessagePosté: 18 Juil 2025, 19:38 
Hors ligne
Expert

Inscription: 30 Sep 2016, 19:39
Messages: 6243
Le fichier Excel est encore pire : les trente stades sont bien présents mais les dates d’une saison normale ne sont pas du tout respectées et l’agent fait comme si elles se déroulait sur trois mois.
Les employés d’openai font mine de rien d’une manière qui force le respect.


Haut
 Profil  
 
MessagePosté: 29 Juil 2025, 06:27 
Hors ligne
Vaut mieux l'avoir en journal
Avatar de l’utilisateur

Inscription: 04 Juil 2005, 15:21
Messages: 23356
Localisation: Paris
Quelqu’un aurait cet article, svp :

https://www.lefigaro.fr/langue-francais ... 7akp13flin

_________________
Que lire cet hiver ?
Bien sûr, nous eûmes des orages, 168 pages, 14.00€ (Commander)
La Vie brève de Jan Palach, 192 pages, 16.50€ (Commander)


Haut
 Profil  
 
MessagePosté: 29 Juil 2025, 10:03 
Hors ligne
Expert
Avatar de l’utilisateur

Inscription: 17 Juin 2021, 13:07
Messages: 1960
NOS CONSEILS - Longueur des phrases, structure rhétorique... Les avancées de la stylométrie appliquée à l’IA permettent de distinguer plus finement ce qui a été écrit de main humaine ou généré artificiellement.

Connaissez-vous la stylométrie, cette approche qui utilise la statistique pour décrire les propriétés stylistiques d’un texte ? Elle a au fil du temps permis de démêler bien des plumes : distinguer Corneille de Molière et mettre ainsi fin aux soupçons de supercherie littéraire, ou identifier, dans l’affaire Grégory, si la lettre anonyme émane de la tante, de l’oncle... ou du corbeau lui-même. Elle répertorie les régularités linguistiques, les choix syntaxiques et les préférences lexicales, ces infimes empreintes qui trahissent le style d’un auteur. Appliquée à l’intelligence artificielle générative, la stylométrie fait des étincelles. Les modèles génératifs, aussi lisses soient-ils, laissent des traces: des petites maladresses, des tics de langage, des manies syntaxiques. Nous avons recensé neuf signes qui trahissent l’œuvre de la machine. Florilège.
À découvrir

Votre pause jeu sous le parasol avec l’application Le Figaro Jeux!
Votre pause jeu sous le parasol avec l’application Le Figaro Jeux!

Une cadence en rythme ternaire

L’IA générative adopte souvent une cadence en ternaire, un phénomène que l’ingénieur et chercheur en intelligence artificielle Frédéric Kaplan qualifie de «triptyque rythmique». Cette figure stylistique consiste en une succession de trois propositions, verbes ou phrases, qui s’amplifient ou se complètent. Il prend l’exemple suivant: «C’est un système qui contraint, qui renforce, qui verrouille.» La forme, loin d’être nouvelle, est un classique de la rhétorique, omniprésente dans les discours politiques, les essais et les argumentaires. Mais sa redondance en boucle trahit ici un auteur qui n’en est pas un.

Des phrases plus longues

Passer la publicité
Publicité

Une étude intitulée Feature Extraction and Analysis for GPT-Generated Text de A. Selvioğlu, V. Adanova et M. Atagoziev, datant de mars 2025, analyse ce phénomène avec précision: les textes produits par ChatGPT présentent une longueur moyenne de phrase plus élevée que celle des écrits humains, avec une faible dispersion autour de cette moyenne.
Graphique de densité de la longueur des phrases pour des extraits de textes générés par ChatGPT ou écrits par l’homme. Copie de l’’article de recherche «Feature Extraction and Analysis for GPT-Generated Text» de A. Selvioğlu, V. Adanova et M. Atagoziev, mars 2025.

On voit sur le graphique de densité ci-dessous que les extraits de textes générés par ChatGPT (vert et jaune) présentent des phrases avec un plus grand nombre de mots que les extraits de textes écrits par l’homme (rouge et bleu).

... et à la structure logique trop linéaire

Dans le même ordre d’idées, la progression d’idées chez l’IA est d’une fluidité mécanique. Chaque phrase s’enchaîne logiquement, sans rupture, sans tension ni surprise. Voilà ce qu’on appelle en stylométrie le manque de «burstiness», désignant l’absence de cette variabilité naturelle propre aux écrits humains, où se mêlent accélérations soudaines, hésitations, digressions ou ralentissements stylistiques.

Des structures syntaxiques répétées

Si chaque patron syntaxique isolé semble anodin, leur récurrence systématique dans un texte est suspecte. Les chercheurs ont repéré ces schémas comme des «marqueurs stylométriques» caractéristiques des productions automatisées. On relève donc cette fameuse énumération ternaire automatique, mais également la structure «Au lieu de [faire quelque chose], [quelqu’un] devrait...». On note aussi la proposition principale, suivie d’un chapelet de participes présents: «...en renforçant, en facilitant, en éclairant...»

Un lexique managérial et technologique très marqué

Des termes comme «reimagined» («réinventé») sont utilisés plus de mille fois plus souvent que par des humains, «bioluminescent» 650 fois plus, «graphene» 400 fois plus. Cette spécificité reflète la nature des corpus d’entraînement massifs de l’IA et la probabilité statistique qui gouverne le choix des mots. On sait ce qui avait été dit sur le verbe «delve», signifiant «creuser» en français, terme pourtant peu utilisé dans le monde anglo-saxon. Comme le soulignait le Guardian, le terme est en revanche plus commun dans certains contextes anglophones africains, notamment au Nigeria, en raison de l’externalisation du travail de renforcement humain (RLHF) vers ces régions, où les annotateurs humains influencent la tonalité et le style du modèle. Ce mot avait connu une véritable explosion avec l’arrivée de l’IA générative.

Les chercheurs ont été étonnés par la pauvreté du vocabulaire utilisé. «Nous nous attendions à des scores significativement plus élevés en matière de diversité lexicale (MTLD, qui quantifie la fréquence d’apparition de nouveaux mots dans un texte) dans les textes générés par GPT, puisque ce dernier est entraîné sur une grande quantité de texte anglais», nous explique ainsi Venera Adanova, enseignante-chercheuse à la Ted University de Tunisie, auteure du rapport «Feature Extraction and Analysis for GPT-Generated Text».

Des tournures génériques ou stéréotypées

Si l’IA brille par sa maîtrise dans les lettres de motivation, les mémoires académiques et les rapports de stage, c’est que les textes formels sont particulièrement propices à son intervention. Les détecteurs d’IA s’appuient notamment sur la plus ou moins grande probabilité de chaque mot à suivre le précédent, soit le degré d’«entropie lexicale». L’entropie désignant au sens large le désordre dans un système. Ce sont bien sûr les textes humains qui présentent la plus grande entropie, comprenez l’imprévisibilité la plus importante dans le choix des mots. Si ces liens sont trop systématiquement «parfaits», ils concluent qu’il est peu probable qu’un humain soit l’auteur. Cela mène parfois à des faux positifs: des textes humains ayant le malheur d’être trop conventionnels, accusés à tort d’être artificiels.

Une surreprésentation notable d’adverbes de modération

Certaines études récentes en linguistique computationnelle relèvent un excès d’adverbes de modération dans les textes produits par l’IA : «probablement», «clairement», «essentiellement», «relativement», «potentiellement», «généralement»… Ces termes apparaissent jusqu’à 1,7 fois plus fréquemment que dans les écrits humains. Dans sa logique probabiliste, l’IA générative évite les affirmations catégoriques et couvre ses arrières pour maximiser la cohérence sur des sujets incertains ou ambigus.

Une prédilection pour les formes passives et impersonnelles

L’usage massif des formes passives et des tournures impersonnelles comme «Il est important de noter que», «Il convient de souligner que»...constitue un autre indice probant. Le «GenAI Detection Challenge 2024 » de l’équipe IntegrityAI, basée à Abu Dhabi, démontre que ce signal stylométrique, couplé à des modèles linguistiques avancés, permet d’atteindre un taux de détection supérieur à 89 % dans les essais académiques. Ces formes passives sont souvent accompagnées d’adjectifs au passif: «amélioré», «réduit», «renforcé», «optimisé»...

Une grande similarité entre le paragraphe et le titre

«Nous nous attendions également à ce que des caractéristiques telles que la similarité paragraphe-titre et la similarité paragraphe-à-paragraphe aient un pouvoir discriminant plus élevé, étant donné que les textes générés par GPT sont produits uniquement à partir du titre de la thèse et devraient donc s’articuler plus étroitement autour de ce titre», explique Venera Adanova. «Étonnamment, d’autres mesures statistiques ont fini par dominer le processus de classification.» Reste que la cohérence entre le titre et le paragraphe demeure bien plus marquée dans les textes générés par l’IA que dans ceux rédigés par des humains. Là où un auteur humain s’autorise digressions, nuances ou effets de style dès l’introduction, l’IA, elle, reste fidèle au titre comme un élève trop scolaire récitant son sujet.


Haut
 Profil  
 
MessagePosté: 29 Juil 2025, 13:43 
Hors ligne
Vaut mieux l'avoir en journal
Avatar de l’utilisateur

Inscription: 04 Juil 2005, 15:21
Messages: 23356
Localisation: Paris
Merci !

_________________
Que lire cet hiver ?
Bien sûr, nous eûmes des orages, 168 pages, 14.00€ (Commander)
La Vie brève de Jan Palach, 192 pages, 16.50€ (Commander)


Haut
 Profil  
 
Afficher les messages postés depuis:  Trier par  
Poster un nouveau sujet Répondre au sujet  [ 147 messages ]  Aller à la page Précédente  1 ... 6, 7, 8, 9, 10

Heures au format UTC + 1 heure


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 2 invités


Vous ne pouvez pas poster de nouveaux sujets
Vous ne pouvez pas répondre aux sujets
Vous ne pouvez pas éditer vos messages
Vous ne pouvez pas supprimer vos messages

Rechercher:
Aller à:  
cron
Powered by phpBB® Forum Software © phpBB Group
Traduction par: phpBB-fr.com
phpBB SEO
Hébergement mutualisé : Avenue Du Web