VERS UN CHOIX DE MODÈLE DE LANGAGE DE TYPE LLMS POUR LA GÉNÉRATION DE NOUVELLES EN ARABE : ANALYSE COMPARATIVE ET CRITÈRES DE SÉLECTION
DOI :
https://doi.org/10.34874/IMIST.PRSM/liri-v6i1.58069Résumé
Le présent article essai de trouver une voie pour la sélection du modèle de langage de type LLMs le plus adapté à la génération de nouvelles littéraires en arabe standard moderne. À l’intersection du traitement automatique du langage, de la linguistique computationnelle et des études littéraires arabes, l’étude propose une méthodologie comparative fondée à la fois sur des critères techniques (taille, entraînement, capacités multilingues) et sur des exigences littéraires (respect des schémas narratifs, correction syntaxique, tonalité stylistique). L’analyse de modèles tels qu’AraGPT2, AraLLaMA-2-7B, BLOOMZ, JAIS et Fanar montre qu’aucun ne satisfait pleinement l’ensemble des critères. L’approche développée ici se distingue des travaux antérieurs en intégrant les spécificités esthétiques et narratives de la nouvelle arabe. En dépit de certaines limites méthodologiques (absence de tests croisés sur un même prompt), l’article propose une stratégie hybride fondée sur la complémentarité des modèles. Il ouvre des perspectives pour le développement de systèmes génératifs littéraires adaptés aux complexités linguistiques et culturelles de l’arabe.
Mots-clés : Large Language Models (LLMs), génération automatique de textes, Traitement automatique du langage naturel (TALN), nouvelle littéraire arabe, analyse comparative