Études & Publications
À propos de SYSTRAN
Depuis sa création en 1968, SYSTRAN est pionnier dans le domaine des technologies de traduction automatique. Les innovations développées par SYSTRAN sont désormais couramment utilisées par les entreprises et utilisateurs professionnels. Avec une forte orientation vers la recherche et le développement, SYSTRAN, 50 ans plus tard, est plus innovante que jamais.
SYSTRAN propose aux utilisateurs professionnels des solutions de traduction automatisée avancées et sécurisées dans divers domaines tels que la collaboration à l'international, la production de contenu multilingue, le support client, l'eDiscovery, l'analyse de Big Data, le e-commerce, etc. SYSTRAN propose une solution sur-mesure avec une architecture ouverte et évolutive qui permet une intégration transparente dans les applications tierces existantes et les infrastructures informatiques.
Vers un NMT basé sur l'exemple avec des transformateurs à niveaux multiples
Vers un NMT basé sur l'exemple avec des transformateurs à niveaux multiples
Maxime Bouthors, Josep Crego, François Yvon.
Conférence 2023 sur les méthodes empiriques dans le traitement du langage naturel (EMNLP 2023), décembre 2023, Singapour.BiSync : un éditeur bilingue pour les textes monolingues synchronisés
BiSync : un éditeur bilingue pour les textes monolingues synchronisésDans notre monde globalisé, un nombre croissant de situations se présentent où les gens sont tenus de communiquer dans une ou plusieurs langues étrangères. Dans le cas d'une communication écrite, les utilisateurs qui maîtrisent bien une langue étrangère peuvent trouver de l'aide grâce aux technologies de traduction assistée par ordinateur (TAO). Ces technologies permettent souvent aux utilisateurs d'accéder à des ressources externes, telles que ... Suite
Josep Crego, Jitao Xu, François Yvon.
61e réunion annuelle de l'Association de linguistique computationnelle (ACL 2023), juillet 2023, Toronto, Canada.Traduction automatique basée sur des exemples à partir d'un texte vers une représentation hiérarchique de la langue des signes
Traduction automatique basée sur des exemples à partir d'un texte vers une représentation hiérarchique de la langue des signesCet article présente une expérience de traduction automatique de texte en langue des signes (SL). Comme nous n'avons pas un grand corpus aligné, nous avons exploré une approche basée sur l'exemple, en utilisant AZee, une représentation intermédiaire du discours en SL sous forme d'expressions hiérarchiques.
Élise Bertin-Lemée, Annelies Braffort, Camille Challant, Claire Danet, Michael Filhol
18e Conférence en Recherche d'Information et Applications — 16e Rencontres Jeunes Chercheurs en RI — 30e Conférence sur le Traitement Automatique des Langues Naturelles — 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (TALN 2023), juin 2023, Paris, France.Intégration de mémoires de traduction dans une traduction automatique non autorégressive
Intégration de mémoires de traduction dans une traduction automatique non autorégressive
Jitao Xu, Josep Crego, François Yvon.
7e conférence de la section européenne de l'Association pour la linguistique computationnelle (EACL 2023), Association pour la linguistique computationnelle, mai 2023, Dubrovnik, Croatie.Synchronisation bilingue : restauration des relations de traduction avec les opérations de modification
Synchronisation bilingue : restauration des relations de traduction avec les opérations de modificationLa traduction automatique (MT) est généralement considérée comme un processus en une seule fois qui génère l'équivalent linguistique cible de certains textes sources à partir de zéro. Nous considérons ici un réglage plus général qui suppose une séquence cible initiale, qui doit être transformée en une traduction valide de la source, rétablissant ainsi le parallélisme entre la source et la cible. Pour cette tâche de synchronisation bilingue, nous considérons plusieurs architectures (à la fois autorégressives et non autorégressives) et régimes de formation, et expérimentons de multiples paramètres pratiques tels que MT interactif simulé, traduction avec mémoire de traduction (TM) et nettoyage de TM. Nos résultats suggèrent qu'un seul système générique basé sur l'édition, une fois affiné, peut se comparer avec, voire surpasser, les systèmes dédiés spécialement formés pour ces tâches.
Jitao Xu, Josep Crego, François Yvon
Conférence 2022 sur les méthodes empiriques de traitement du langage naturel (EMNLP 2022), décembre 2022, Abou Dabi, Émirats arabes unisTraduction automatique non autorégressive avec mémoires de traduction
Traduction automatique non autorégressive avec mémoires de traductionLa traduction automatique non autorégressive (NAT) a récemment fait de grands progrès. Cependant, la plupart des travaux réalisés à ce jour ont porté sur des tâches de traduction standard, même si certains modèles NAT basés sur l'édition, tels que le Levenshtein Transformer (LevT), semblent bien adaptés à la traduction avec une mémoire de traduction (TM). C'est le scénario envisagé ici. Nous analysons d'abord le modèle LevT vanille... Suite
Jitao Xu, Josep Crego, François Yvon
Conférence 2022 sur les méthodes empiriques de traitement du langage naturel (EMNLP 2022), décembre 2022, Abou Dabi, Émirats arabes unis.Traduction robuste des transcriptions vocales en français
Traduction robuste des transcriptions vocales en françaisMalgré un écart de performance réduit avec des approches directes, les solutions en cascade, impliquant la reconnaissance automatique de la parole (ASR) et la traduction automatique (MT), sont encore largement utilisées dans la traduction vocale (ST). Les approches directes utilisant un seul modèle pour traduire le signal vocal d'entrée souffrent du goulot d'étranglement critique de la rareté des données. En outre, plusieurs applications de l'industrie affichent des transcriptions vocales... Suite
Elise Bertin-Lemée, Guillaume Klein, Josep Crego, Jean Senellart
Compte rendu de la 15e conférence biennale de l'Association pour la traduction automatique dans les Amériques (Volume 2 : Users and Providers Track and Government Track), septembre 2022, Orlando États-UnisAbandon de groupe latent pour la traduction automatique multilingue et multidomaine
Abandon de groupe latent pour la traduction automatique multilingue et multidomaineLa traduction automatique multidomaine et multilingue repose souvent sur des stratégies de partage de paramètres, où de grandes parties du réseau sont destinées à capturer les points communs des tâches à accomplir, tandis que des parties plus petites sont réservées pour modéliser les particularités d'une langue ou d'un domaine. Dans les approches basées sur la carte, ces stratégies sont codées en dur dans l'architecture réseau, indépendantes... Suite
Minh-Quang Pham, François Yvon, Josep Crego
Conclusions de l'Association for Computational Linguistics : NAACL 2022, juillet 2022, Seattle, États-UnisGénération d'un langage gestuel multilinéaire basé sur des exemples à partir d'une représentation hiérarchique.
Génération d'un langage gestuel multilinéaire basé sur des exemples à partir d'une représentation hiérarchique.
Boris Dauriac, Annelies Braffort, Elise Bertin-Lemée.
Juin 2022, Marseille, France.Adaptation multidomaine dans la traduction automatique neuronale avec des stratégies d'échantillonnage dynamique
Adaptation multidomaine dans la traduction automatique neuronale avec des stratégies d'échantillonnage dynamiqueConstruire des modèles efficaces de traduction automatique neuronale implique souvent de prendre en compte divers ensembles de données hétérogènes afin d'optimiser les performances pour le(s) domaine(s) d'intérêt. Ces problèmes d'adaptation multisources/multidomaines sont généralement abordés par le biais de stratégies de sélection ou de repondération des instances, sur la base d'une évaluation statique de la pertinence des instances de formation par rapport à la tâche ... Suite
MinhQuang Pham, Antoine Senellart, Dan Berrebbi, Josep Crego, Jean Senellart
Compte rendu de la 23e conférence annuelle de l'Association européenne pour la traduction automatique, juin 2022, Gand, Belgique