À propos du projet
Le projet
Le Traducteur Français·Futunien est un outil numérique modeste, conçu pour faciliter la traduction entre le français et le futunien. Ce projet est né d'une volonté de valoriser une langue encore peu représentée sur internet, et il a été développé en collaboration avec une locutrice native de Futuna, dont l'expertise linguistique est précieuse.
Actuellement en version Alpha, le vocabulaire couvert est limité mais s'enrichit progressivement. Le moteur de traduction repose sur des règles grammaticales explicites et un lexique de plus de 6 000 entrées. Pour les phrases dont certains mots ne sont pas encore couverts, un pipeline de normalisation (thésaurus + LLM local) tente d'améliorer automatiquement la couverture. Chaque traduction reste déterministe et vérifiable.
La langue futunienne
Le futunien (ou fakafutuna) est une langue polynésienne, parlée principalement sur l'île de Futuna, dans le territoire français de Wallis-et-Futuna. Selon les données disponibles, il comptait environ 4 500 locuteurs à Futuna en 2008, et environ 5 000 en Nouvelle-Calédonie en 1996 (Wikipédia, 2026).
Bien qu'ancrée dans la culture locale, cette langue reste fragile : les ressources numériques pour l'apprendre ou la pratiquer sont rares. Ce projet vise à contribuer, à son échelle, à la préservation et à la visibilité du futunien.
La méthode
La traduction repose sur un pipeline en trois étapes, du plus simple au plus puissant :
- Moteur déterministe — analyse grammaticale de la phrase française (structure VSO, marqueurs de temps, négation, interrogation), puis traduction mot à mot à partir d'un lexique de plus de 6 000 entrées. Les mots non couverts sont signalés entre crochets.
- Thésaurus français (hors-ligne, instantané) — si la couverture est insuffisante, un thésaurus de 36 000 entrées (LibreOffice) cherche automatiquement des synonymes connus du dictionnaire futunien pour chaque mot non reconnu.
- Normalisation par LLM local (optionnelle) — si le thésaurus seul ne suffit pas, un modèle de langue local reformule la phrase française en utilisant les synonymes suggérés, que le moteur déterministe retraduit. Le LLM ne traduit jamais directement en futunien.
Chaque étape n'est activée que si la précédente n'a pas suffi à améliorer la couverture. Cette approche garantit des traductions déterministes et vérifiables tout en maximisant la couverture lexicale.
Le lexique lui-même est construit par fusion de sources : le dictionnaire co-élaboré avec la locutrice native est croisé automatiquement avec le dictionnaire historique de Grézel (1878, domaine public), ce qui permet d'identifier les concordances entre les deux sources et d'importer les mots manquants pour validation ultérieure.
Évolution du projet
Qualité de traduction
La qualité des traductions s'améliorera selon deux axes complémentaires. D'abord, l'enrichissement continu du lexique : chaque mot non traduit (signalé entre crochets) est un indicateur direct de ce qui reste à ajouter. Ensuite, l'extension vers la traduction de textes et de paragraphes, au-delà des phrases simples, avec une meilleure gestion des enchaînements et du contexte entre phrases.
Fonctionnalités prévues
- Synthèse vocale — écouter la prononciation des mots traduits, utile pour les apprenants et les personnes peu familières de l'écrit futunien.
- Application mobile — une version portable (Progressive Web App), utilisable hors-ligne, pour les habitants de Futuna et la diaspora.
- Appui par intelligence artificielle — implémenté : un thésaurus de 36 000 entrées et un LLM local normalisent automatiquement les phrases dont certains mots sont absents du lexique, avant de les retransmettre au moteur déterministe.
- Direction futunien → français — la traduction inverse est en cours de développement et sera disponible prochainement.
Phases du projet
- Phase 1 — Dictionnaire de base et moteur de règles grammaticales
- Phase 2 — Interface web et déploiement public
- Phase 3 — Application mobile (PWA)
- Phase 4 — Pipeline de normalisation : thésaurus LibreOffice + LLM local
- Phase 5 — Enrichissement du lexique et amélioration de la couverture (en cours)
- Phase 6 — Traduction de textes longs et paragraphes
- Phase 7 — Synthèse vocale et prononciation
- Phase 8 — Direction futunien → français (améliorée)
Sources et références
Le dictionnaire du projet est construit à partir de deux sources complémentaires, fusionnées et hiérarchisées :
- Lexique co-construit avec la locutrice native — dictionnaire bilingue français·futunien élaboré directement avec une locutrice native fluente de Futuna. Ces entrées sont marquées « Vérifié » (🌸) dans le dictionnaire.
- Grézel, J.-M. (1878). Dictionnaire Futunien-Français avec notes grammaticales. Paris : Maisonneuve. — Première grammaire et premier lexique de référence du futunien, œuvre du domaine public. L'intégralité des 5 071 entrées a été numérisée et intégrée : 4 649 mots futuniens absents du lexique de base ont été importés, et 414 entrées concordant entre les deux sources ont reçu le statut « Cohérent » (✓). Les entrées issues de Grézel sont marquées « Non vérifié » jusqu'à validation par la locutrice native — certains mots peuvent être anciens ou archaïques.
- Moyse-Faurie, C. Dictionnaire futunien-français avec index français-futunien. Paris : Peeters/SELAF, 1993. — Grammaire du futunien. Nouméa : CDP, 1997. — Références académiques pour le futunien contemporain, utilisées pour la conception des règles grammaticales. Aucun contenu de ces ouvrages n'est reproduit directement dans le projet.
Le dictionnaire compte actuellement 6 417 entrées au total : 153 validées par la locutrice native, 414 confirmées par concordance entre deux sources, et le reste en attente de relecture. En cas de divergence entre les sources, la validation par la locutrice prime toujours.
Contact
Ce projet est développé de manière bénévole. Si vous êtes locuteur ou locutrice du futunien et souhaitez contribuer à l'enrichissement du lexique, ou si vous avez des remarques sur les traductions, n'hésitez pas à nous contacter.