Francés

Qu’est-ce que Ladex?

LADEX est un projet de recherche interuniversitaire et pluridisciplinaire octroyé par le Ministerio de Economía y Competitividad espagnol portant sur Le langage juridique et administratif dans le domaine de l’immigration : étude multilingue et implications culturelles/El lenguaje jurídico y administrativo en el ámbito de la extranjería : estudio multilingüe e implicaciones culturales qui vise à combler le vide existant jusqu’à présent sur des études scientifiques et philologiques qui combinent la caractérisation du langage juridique et administratif avec les implications socio-culturelles des migrations internationales .
Il est évident que le phénomène migratoire a transformé notre société et la langue, instrument indispensable de communication, rend témoignage de ce fait car comme nous le rappelait L. Guilbert « L’histoire de la langue rejoint celle de la société ». L’espace européen où la libre mobilité de la population des pays membres de l’Union et le souhaitable respect des droits humains de demandeurs d’asile au sein de leurs frontières, coexiste avec la préoccupation des États au sujet de la sécurité et par conséquent, avec la nécessité pratique de fixer des limites à leurs frontières. Ces deux aspects, contradictoires, ont focalisé, au cours de dernières années, les efforts politiques et administratifs de l’UE. C’est ainsi qu’au sein du langage juridique, le langage administratif plus que tout autre, a été forcé de conserver un difficile équilibre entre une telle duplicité d’intentions: d’un côté les Administrations publient des textes qui traduisent le considérable effort d’intégration afin de garantir les droits des personnes migrantes; de l’autre, ces textes dénotent la préoccupation des États concernant la restriction de l’immigration, ayant pour conséquence une stratification de droits sociaux en plus de cacher les éventuelles incohérences idéologiques déjà annoncées par Haddad (2003) et Morris (2001).

Quels sont les objectifs de ladex?

  1. Les objectifs spécifiques que LADEX se propose sont :
    Compiler un corpus textuel multilingue (espagnol, français, italien) de documents pour les étrangers émis par les Ministères de l’intérieur et les Administrations publiques en Espagne, au Royaume-Uni, en France et en Italie, entre 2007 et 2011 pour les citoyens européens et non-européens. Ces documents d’immigration composent la bureaucratie à laquelle tout immigrant, voulant régulariser sa situation dans le pays d’accueil, doit être confronté.
  2. Effectuer une analyse taxonomique de différents corpora, d’abord en fonction des particularités de chaque langue en question; puis en comparaison avec l’espagnol, dans l’objectif d’obtenir des informations d’application en didactique de langues, dans le domaine de la traduction ou dans le secteur de la communication professionnelle.
  3. Comparer la terminologie, la phraséologie et les aspects discursifs de différents modules qui composent le langage juridique et administratif afin de déterminer les caractéristiques linguistiques microtextuelles,
  4. Réfléchir sur les contextes culturels impliqués dans ces démarches afin de faire des estimations sur les possibles différences et/ou équivalences constatées dans chaque langue susceptibles de permettre de faire une caractérisation contrastive de l’utilisateur étranger et de déterminer les potentielles implications culturelles sous-jacentes.
  5. Déduire les possibles conséquences juridiques et/ou sociales de difficultés posées par la correcte interprétation de cette langue de spécialité.

Quelle a été la méthodologie suivie dans le cadre de Ladex?

La méthodologie suivie pour le développement de ce projet de recherche a été la linguistique de corpus.

1ère étape : Identification du corpus

Pour l’identification du corpus linguistique, point de départ de ce travail, les chercheurs on fait une révision de la bibliographie précédente sur ce domaine, notamment des travaux de Calvo Ramos (1980), Aguirre et Hernando de Larramendi (1997), Alvarez (1997), Borja Albi (1998) et Alcaraz Varó et Hughes (2009). La plupart de ces auteurs conclue que le langage administratif se compose de documents résolutifs, documents d’instruction, d’instance interne et de constance externe, documents de communication et les écrits de l’Administration :

Investigation

Ces catégories comprennent chacune de documents appartenant à de typologies discursives diverses pouvant varier selon la langue dans les quatre cultures juridiques différentes, à savoir l’espagnol, le français, l’anglais et l’italien:

LenguajeAdministrativo
2ème étape : Classement taxonomique

Après la compilation et la systématisation de différents corpora (composés par de documents provenant de diverses typologies discursives), les chercheurs ont procédé à leur classement taxonomique.

  1. Textes émis par l’administration qui s’adressent aux citoyens (FR- 1) : décrets, règlements, actes administratifs adressés aux citoyens, résolutions, etc.
  2. Textes échangés entre les différentes administrations. Actes qu’une administration adresse à une autre administration (FR- 2) : instruction, circulaire, note, rapport, communication, etc.
  3. Textes informatifs (FR- 3) : brochures, dépliants, etc.
  4. Communications diverses que les citoyens adressent à l’administration (FR- 4) : déclaration, communication, application d’une instance, etc.

Dans une première étape les chercheurs ont identifié les textes idiosyncrasiques uniques dans le cadre du système juridique et administratif concret étant donné la difficulté de réaliser une compilation exhaustive de documents faisant partie de diverses typologies textuelles dû à leur grand volume. Ils ont donc effectué une compilation sélective des textes les plus représentatifs, inclassables du point de vue taxonomique, pour après créer un bloque où ils ont inclus les documents spécifiques à un certain pays, difficiles à mettre en comparaison avec les documents spécifiques d’un autre pays comme par exemple, les arrangements français.

3ème étape : Numérisation de différentes corpora et développement des outils informatiques

Dans l’étape suivante ils ont procédé à la numérisation de différents corpora au moyen des outils informatiques TreeTager et Freeling qui ont permis la consultation morphologique des textes ce qui leur a fourni les données indispensables à leur analyse.

4ème étape : Propositions d’opérationnalisation

Puis, on est arrivé aux propositions d’opérationnalisation ayant pour but l’analyse de la caractérisation culturelle/idéologique des immigrants aux niveaux linguistique et textuel ce qui leur a permis finalement l’annotation proprement dite de ces textes. Pour cela on a adapté des outils informatiques tels que le Bacbone Annotator et Backbone CMT, spécialisés dans la gestion de corpus linguistiques. On a également amélioré le fonctionnement des logiciels freeware et opensource. Enfin, ils sont arrivés à l’opérationnalisation effective de certaines entités (ou constructos), c’est à-dire des remarques sur l’empreinte culturelle/idéologique qui a favorisé la caractérisation de l’immigrant.

5ème étape : Approche quantitative et qualitative

1) Approche quantitative

Avant de ce faire et tenant compte du volume de différents corpora, ils ont focalisé leur attention sur deux typologies textuelles : celle constituée par les textes normatifs (Ladex – FR – 1) composée en français par 2050943 tokens (plus de 600 pages) et celle des textes informatifs (Ladex – FR 3) qui double pratiquement l’antérieur en français, composée par 4.771.381 tokens. Cela est dû à l’inclusion dans cette typologie textuelle de certains documents publiés par des associations et/ou fondations à but non lucratif qui rédigent des rapports, préparent des dossiers divers en collaboration avec des institutions de différents pays comme l’Italie, l’Espagne ou le Royaume-Uni. Ces documents ont une grande répercussion sur le débat social exerçant souvent une influence considérable sur l’élaboration de certaines règlementations locales et même nationales.

Partant de la sélection préalable de ces deux typologies discursives, les chercheurs ont délimité leur travail de recherche à 5 lemmes : immigrant, immigré, étranger, migrant et citoyen. En se servant du moteur de recherche Skein Engine ils ont réalisé un échantillonnage aléatoire au sein de ces deux sous-corpus, limité à 100 lignes. L’échantillon obtenu dans les deux cas a été enregistré en format Kwic, puis en Sentence. Enfin on a procédé à l’approche quantitative des résultats obtenus.

2) Approche qualitative

Les données obtenues à partir de l’approche quantitative ont constitué le point de départ d’une exploration qualitative du co- texte ainsi que des éléments collocationnels les plus représentatifs.
Pour l’approche qualitative les chercheurs ont analysé:

(1) La catégorisation du score par rapport à ses collocations en fonction de :

1.1.l’affaire administrative traitée : dossier d’entrée, de sortie, de naturalisation, demande de séjour, de rapatriement…) ;
1.2.les aspects religieux ;
1.3.les facteurs culturels : pratiques sociales, éducation , envois d’argent dans le pays d’origine, etc.
1.4. les aspects concernant l’ethnique/ou l’identité nationale ;
1.5.certaines particularités distinctives : âge, sexe , famille, travail , zones à forte densité de population, etc.
1.6. des marques spécifiques à un groupe ou une organisation particulière.

(2) La caractérisation grammaticale du score :

2.1. le terme est objet de, 2.2 sujet de, 2.3.modifié par, 2.4.modifie à, 2.5. il est coordonné avec,
2.6.il fait partie d’une structure prépositionnelle, 2.7.il est possesseur de ; 2.8.cas de nominalisation, 2.9.juxtaposition, etc.

(3) Analyse de la prosodie insistant sur les aspects positifs et/ou négatifs, le ton neutre du message ou par contre, marqué ; l’emploi d’euphémismes ou de certaines structures linguistiques et phraséologiques « politiquement correctes ».

6ème étape : Annotation morphologique et exploitation des textes

Outils informatiques : http://sacodeyl.inf.um.es/ladex-webpage/
http://sacodeyl.inf.um.es/ladex-search/

7ème étape. Conclusions scientifiques : publication et diffusion internationale des résultats obtenus dans leurs recherches