Accueil

The objective of TransRead is to study new multilingual text processing applications, aimed at facilitating the reading of multilingual documents for readers with intermediate knowledge of a foreign language. Contrarily to black-box approaches, which target users without any knowledge of the original language of some text, TransRead is primarily concerned with the visualization of bilingual texts and of their cross-lingual links. Subtitling is a commonplace technology that exploits such bilingual alignments to enable viewers to read in a familiar language what is said in some unknown language. By analogy, one of the objectives of TransRead is to explore the subtitling of books, and to devise ways in which cross-lingual alignments, computed at the sentential and sub-sentential levels, or cross-lingual dictionary access, will help and enrich the reading of texts in their original language. To this end, we intend to take advantage of the opportunities created by the availability of new mobile terminals (touchpad tablets, electronic readers) and by the recent advances in information visualization technologies.

Between the complete ignorance of a language (where translation is the only option) and bilinguism (where translation is useless), there exist a variety of contexts of partial bilinguism, where such bilingual electronic readers would prove highly useful: for second language learners, for workers in international environments, for migrant settling in a new country, for inhabitants of multilingual states, for speakers of related languages, or, in more industrial contexts, for editors in the publishing industry or for professional translators. For this latter type of professional uses, we propose to study a second kind of application related to the crucial issue of quality control of human translation and of translation memories. Bodies of document translations, so called parallel corpora, constitute key resources in modern computer assisted translation environments. They are used to derive bilingual lexicons or terminologies and to feed translation memories, not to mention their use for MT applications. Yet, the quality of these resources and its impact on their reusability have, surprisingly, not received much attention to date. A second objective of TransRead is therefore to study and develop innovative visualization strategies for such bilingual texts, with a view on assessing and improving their quality. This raises difficult scientific issues, such as the design of numerical confidence measures evaluating the validity of alignments or the conception of effective visualization techniques for large bilingual corpora.

fr

L'objectif du projet TransRead est d'étudier de nouvelles applications multilingues destinées à faciliter la consultation de documents en plusieurs langues par des utilisateurs imparfaitement bilingues. Au rebours des approches "boîte noire", qui ciblent un public monolingue, TransRead s'intéresse donc en premier lieu à la visualisation de textes bilingues et des alignements qui les lient. Une technologie, largement banalisée, d'exploitation d'alignements bilingues est le sous-titrage, qui permet de lire dans une langue ce qu'on entend dans une autre, les deux modalités s'enrichissant mutuellement à des degrés qui varient selon les compétences linguistiques des spectateurs. Par analogie, une des visées de TransRead est l'exploration des formes que pourrait prendre le sous-titrage de livres et d'imaginer comment l'utilisation d'alignements translingues, calculés au niveau des phrases et des groupes de mots, mais également au niveau des entrées de dictionnaire, permettront de faciliter et d'enrichir et l'expérience de lecture en langue source. Nous comptons, à cet effet, mobiliser les possibilités offertes par l'arrivée de nouveaux types d'équipements mobiles (tablettes tactiles, lecteurs électroniques) et les avancées des techniques de visualisation d'information.

Entre méconnaissance totale d'une langue (traduire est indispensable) et bilinguisme parfait (traduire est inutile), il existe une multiplicité de contextes de bilinguisme partiel, qui pourraient utilement bénéficier de tels dispositifs de médiation multilingue: des apprenants d'une langue seconde, des adultes éduqués évoluant dans un contexte international, des migrants en phase d'insertion, des habitants de pays multilingues, des locuteurs de langues apparentées, ou encore, dans un cadre plus industriel, des traducteurs ou des travailleurs des métiers de l'édition littéraire, technique, juridique ou commerciale. Ce dernier contexte permettra d'explorer un second cadre applicatif, celui du contrôle de qualité de traductions humaines et/ou de mémoires de traduction. Les corpus parallèles ou bitextes, constitués d'un texte et de sa traduction, sont des ressources essentielles pour les environnements de traduction assistée par ordinateur. Il est possible d'en extraire des lexiques, des terminologies bilingues, voire des mémoires de traduction, sans parler de leur utilisation en TA statistique. La question de la qualité de ces ressources et de leur adéquation à ces utilisations est pourtant peu étudiée. Un second objectif de TransRead est d'étudier et de développer des stratégies d'exploration de bitextes qui permettront d'en mieux contrôler la qualité; un aspect important de cette étude étant le calcul d'indicateurs numériques de la validité de l'alignement entre deux versants d'un bitexte; un autre étant de trouver les techniques de visualisation adaptées au traitement efficace de ces grands corpus.