Résumé "Sciences du langage" (c) 2003-01-27 Fabian M. Suchanek http://suchanek.name/texts/summaries/sdl.txt Ceci est le résumé des cours du module "Sciences du langage", donnés en hiver 2002 à l'Université Pierre-Mendès-France Grenoble: * Le cours de sémantique, donné par Mme Bianco * Le cours de la reconnaissance de la parole donné par M Vanfreyday * Le cours de syntaxe donné par M Lecomte Le résumé du cours de phonologie se trouve dans phono.txt. (Since this text is supposed to be in French, I could not avoid using non-ASCII characters, sorry for that to all foreign readers) Le lecteur, en lisant le texte ci-dessous, accepte que l'auteur décline toute responsabilité concernant des informations fausses ou incomplètes. Si quelqu'un trouve une faute, je lui serais reconnaissant de bien vouloir me le dire. C'est le seul moyen de profiter moi-même de la publication de ce résumé. Mon e-mail est f.m.suchanek@zweb.de, mais il faut effacer la lettre 'z' dans l'adresse. ===================================================================== Introduction ===================================================================== cf aussi lingu.txt (en anglais) cf aussi phono.txt (en francais) Ensemble: Une collection non rangée d'éléments non identiques. M = {x1, x2, ..., xn} est l'ensemble de x1 x2, ... xn M = {x | f(x) } est l'ensemble de tous les x pour lesquels f(x) est vrai Sous ensemble d'un ensemble M: Un ensemble T tel que tous les éléments appartenant à T appartiennent à M. On dit que T est inclu dans M. T < M Liste, Suite, Tuple: Une collection rangée d'éléments. v = (v[1], v[2], ... v[n]) Couple: Un tuple de deux éléments. Triplet: Un tuple de trois éléments. Vecteur: Un tuple de valeurs réelles. Annotation: Pour une définition plus générale, cf maths.txt (en francais) Chaîne: Une suite de caractères. Algorithme: Une suite d'instructions. Arbre: Un élément et une suite d'arbres. La suite peut être vide. Chaque arbre de cette suite est appelé un "enfant", l'élément est appelé "noeud". Exemple: N1 / | \ N2 N3 N4 | \ \ N5 N6 N7 Degré d'un noeud: Le nombre de ses enfants. Exemple: Le degré de N1 dans l'arbre de ci-dessus est 3 Arbre binaire: Un arbre dont chaque noeud est de dégré 2. Noeud terminal, Feuille: Un noeud sans enfants. Exemple: Dans l'arbre ci-dessus, N2, N5, N6 et N7 sont des feuilles Racine d'un arbre: Le noeud qui n'est enfant d'aucun autre noeud. Exemple: Dans l'arbre ci-dessus, N1 est la racine. Application, Fonction: Un classement f qui prend un élément appartenant à un ensemble A (ou à plusieurs ensembles) et qui redonne un élément appartenant à un ensemble B. On écrit: f: A -> B f(a)=b, où a appartient à A et b appartient à B f: A x B -> C f(a,b)=c a f b = c Fonction partielle: Une fonction dont le résultat n'est pas défini pour tous les paramètres possibles. Fonction trigonométrique: Une des fonctions sinus, cosinus, tangens. Annotation: Pour une définition de ces fonctions, voir analysis.txt (en allemand) Paramètre: Un élément qu'on donne à une fonction. max: La fonction qui prend un ensemble de valeurs réelles et en redonne la plus grande. min: La fonction qui prend un ensemble de valeurs réelles et en redonne la plus petite. argmax: La fonction qui prend une variable et une expression arithmétique et redonne la valeur de la variable pour laquelle l'expression est maximale. Exemple: argmax(x,-(x-3)^2) = 3, car -(x-3)^2 est maximal pour x=3 Probabilité: Une fonction P qui prend un évènement et redonne une valeur entre 0 et 1 qui estime la vraisemblance de cet évènement. On note * P(x) la probabilité de l'évènement x * P(x|y) la probabilité de l'évènement x, vu que y s'est passé Annotation: Pour un traitement détaillé, cf statistik.txt (en allemand) Diachronique: Concernant le processus d'un état à un autre dans le temps. Synchronique: Concernant l'état présent. Objet, Entité: Quelque chose. Concept, Classe: Un ensemble d'entités. Attribut: Une propriété qui peut avoir des valeurs. Exemple: La couleur des yuex est un attribut, qui peut avoir les valeurs "bleu", "vert", "noir" Linguistique: L'étude des langues. Linguistique comparée: La linguistique qui s'occupe de la comparaison de plusieures langues. Mot: Une composante d'une langue. Annotation: En effet, il n'existe aucune définition qui soit plus exacte... Énoncé, Phrase: Une suite de mots composée selon les règles d'une langue. Grammaire: Voir définition dans le cours de syntaxe plus bas Classe: Voir définition dans le cours de syntaxe plus bas Sens d'une phrase: L'état du monde auquel la phrase fait référence. Sens d'un mot dans une phrase: La contribution que le mot fait au sens de la phrase. Morph: Une composante d'un mot qui contribue à son sens. Morphème: Une classe de morphs effectuant la même contribution au sens. Hz, Hertz: L'unité 1/seconde. Son: Une vibration d'une matière, d'ordinare de l'air. Amplitude d'un son à un moment t: La position de la matière vibrante au moment t par rapport à sa position normale. Le plus l'amplitude maximale est grande, le plus le son est fort. Son pur: Un son dont la vibration a la forme d'une courbe de sinus. Différentes intensités du son correspondent à différentes amplitudes maximales. Fréquence d'un son pur: Le temps d'une période sinus complète de la vibration du son, élevé à la puissance de -1. La fréquence est mésurée en Hertz. Somme de deux sons: Le son qui a comme amplitude en tout moment la somme des amplitudes des deux sons. Théorème de Fourier appliqué aux sons: Chaque son peut être vu comme une somme de sons purs avec des amplitudes maximales différentes. Fréquence d'un son S: La fréquence d'un des sons purs dont S est la somme. On dit que la fréquence contribue au son. Son de language: Un son qui sert à la communication et est produit par l'air passant par les organes vocaux humains. Annotation: Pour les détails, cf phono.txt Phonème: Un ensemble de sons ou de suites de sons ayant le même rôle dans une langue. Pronociation: La production d'une suite de sons de langage qui représente un mot ou une phrase. Parole: Le résultat d'une prononciation. Graphe: Une structure de noeuds et de flèches entre eux. Annotation: Pour les détails, cf gc.txt (en francais) ===================================================================== Sémantique ===================================================================== Comme le cours ne donne pas les définitions de toutes les notions, les définitions ont été déduites ou trouvées dans lingu.txt. cf lingu.txt (en anglais) pour un traitement détaillé du sujet cf philo.txt (en anglais) ou funclog.htm (en francais, disponible à partir du février 2003) pour une théorie d'ontologie ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Histoire ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Sémantique: L'étude du sens des mots et des phrases. Sémantique compositionnelle: La sémantique qui s'occupe des morphèmes. Histoire de la sémantique: * Période révolutioniste (1883-1930) * la linguistique comparée * la linguistique diachronique * Période mixte (1930-1960) * la linguistique diachronique * la linguistique synchronique * la linguistique structuraliste (de Saussure) * l'analyse sémantique * l'analyse compositionnelle * Période des modèles linguistiques (1960-) * Utilisation de l'informatique * Idée de la compétence linguistique (Chomsky) * Approche mentaliste (Chomsky) Annotation: Les approches différentes n'ont pas été détaillées, cf lingu.txt (en anglais) pour un traitement exacte Évolution de sens: Le phénomène que le sens d'un mot change pendant les siècles. Exemple: Le mot "Bureau" avait les sens suivants 1. Un tissue pour couvrir un moeble 2. Un moeble 3. Une pièce 4. Un ensemble de gens qui travaillent 5. Une institution Exemple: Le mot "investir" avait les sens suivants 1. Entourer 2. Entrer 3. Faire des économies Articulation: Un niveau d'une langue. Première articulation: Le niveau des morphèmes. Deuxième articulation: Le niveau des phonèmes. Signifiant, Dénomination, Symbole, Forme phonétique d'un mot: La suite de sons de langage qui représente ce mot. Extension d'un mot: La classe à laquelle le mot fait référence. Signifié d'un mot: La pensée à l'extension du mot. Intension d'un mot: (?) Référent d'un mot: Un objet de l'extension du mot. Désignation d'un mot: L'entité à laquelle le mot fait référence. Signe saussurien: L'idée qu'un mot comporte * son signifié * son signifiant Triangle de Odgen-Richards: L'idée qu'un mot comporte * la pensée * son référent * son symbole La pensée est liée au référent et au mot et établie donc un lien indirect entre le référent et son symbole. Forme lexicale d'un mot: (?) Triangle de Tamba-Motz: L'idée qu'un mot comporte * son sens * son référent * sa forme lexicale Triangle de Ulman: Un autre triangle quelconque (?). Dénotation d'un mot: La part de son sens qui ne dépend pas de celui qui utilise le mot. Connotation d'un mot: La part de son sens qui dépend de celui qui utilise le mot. Mot plein, Mot avec un contentement prédicatif: Un mot qui fait référence à une entité, classe, propriété ou action. Mot fonctionnel: Un mot qui n'est pas un mot plein. Un tel mot sert à l'organisation de la phrase. Sémantique lexique: La sémantique qui s'occupe des mots pleins. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Analyse ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Ambiguité de référence d'un mot: Le phénomène qu'il n'est pas clair quel objet est décrit par le mot. Sème, Unité de sens, primitive sémantique, trait distinctif, trait sémantique minimal d'un mot: Une propriété de ses référents. Analyse compositionnelle d'un ensemble de mots: Un tableau qui a les mots comme lignes et les unités de sens comme colonnes. Si les référents du mot i ont la propriété j, alors on met un '+' à la position i,j. Sinon, on met un '-'. L'analyse compositionnelle sert pour distinguer des mots dont le sens est proche. Elle peut aussi résoudre des ambiguités de référence. Si n est le nombre des mots, alors log2(n) est une borne inférieure pour le nombre de sèmes. Pourque l'analyse compositionnelle réduise aussi l'informetion, n est une borne supérieure. Prédicat: Un symbole qui fait référence à une action, une propriété ou un état. Arité d'un prédicat: Le nombre d'entités que le prédicat concerne. Proposition, Littéral: Une chaîne de la forme "P(t[1],t[2],...t[n])" où P est un prédicat, les t[i] sont des entités et n est l'arité de P. Ce littéral signifie que les t[i] effectuent l'action ou ont la propriété à laquelle P fait référence. Argument d'un littéral P(t[1],...t[n]): Un des t[i]. Texte: Une suite de phrases. Analyse propositionnelle d'un texte: Une suite de littéraux qui représente le sens des phrases du texte. On numérote les littéraux. Les paramètres des littéraux peuvent aussi être des numéros d'autres littéraux. Dans ce cas, les numéros font référence soit à l'état exprimé par le littéral, soit à un de ses paramètres. Annotation: Comme cela, il n'est pas clair si Bob pense à Agnes ou si Bob pense que Agnes est malade: 1. malade(Agnes) 2. pense(Bob,1) Puis n'est pas clair si Agnes est malade ou pas. Difficultés: * Déterminer les prédicats * Déterminer leur nombre d'arguments L'analyse propositionelle d'un texte n'est pas unique. Subordonnée d'une classe: Un sous ensemble de la classe. Surordonnée d'une classe C: Une classe dont C est un subordonnée. Réseau sémantique: Un arbre dont les noeuds sont des classes. Chaque classe a comme enfants ses subordonnées. On peut ajouter des flèches de sorte "partie-de". Annotation: Cf aussi ijava.txt (en francais) Hyperonym d'un mot M: Un mot qui fait référence à une surordonnée de l'extension de M. Exemple: "Artiste" est un hyperonym de "Musicien" Hyponym d'un mot M: Un mot qui fait référence à une subordonnée de l'extension de M. Exemple: "Musicien" est un hyponym de "Artiste" Héritage: Le fait que les entités d'une sousordonnée d'une classe C possèdent toutes les propriétés de C. Prototype: Une entité qui représente sa classe. Mode d'une phrase: Sa propriété d'être une question, une déclaration ou une instruction. Aspect d'une phrase: Sa propriété de décrire une action accomplie ou inaccomplie. Modalité d'une phrase: Son temps, son mode et son aspect. Composition d'une phrase selon Fillmore: Le couple de sa proposition et sa modalité. Ossature d'une action: Une chaîne de la forme suivante: V(C[1],...C[n]) où V est le nom de l'action et les C[i] sont choisi parmi les mots suivants: * Agent: L'instigateur * Instrument: Le stimulus qui cause l'action * Objet: L'entité qui bouge, change ou dont l'existence est en question * Contre-agent: La force contre laquelle l'action est executée * Résultat: L'entité crée * Source: Le lieu de départ de quelque chose qui bouge * But: Le lieu d'arrivée de quelque chose qui bouge * Patient: L'entité qui recoit, accepte ou subit l'effet de l'action Grammaire des cas d'une phrase: L'ossature de l'action exprimée par la phrase, dont les C[i] ont été remplacés par leurs valeurs. La grammaire des cas a été introduite par Fillmore. Théorie de la décomposition fonctionnelle: L'idée que le sens de toute phrase peut être exprimé par un schéma comme le suivant Agent <=> Action <---Relation--- Entité(s) Entité <==> attribut(valeur) où * Agent est l'instigateur de l'action * Relation est * o (est l'objet de l'action) * i (est l'instrument de l'action) * R (sont le récipient et le donateur de l'action) * - (sont la source et le but de l'action) * Attribut est un attribut de l'entité à gauche, dont la valeur est fixée * Action est * ATRANS (transfer d'une relation abstraite) * PTRANS (transfer physique) * PROPEL (application d'une force physique) * MTRANS (transfer d'information mentale) * MBUILD (construction d'information mentale) * SPEAK (produire un énoncé) * ATTEND (diriger un organde et un sens vers un stimulus) * MOVE (mouvement d'une part du corps) * GRASP (attrapage d'un objet) * INGEST (introduction d'un objet dans le corps) * EXPEL (l'inverse de INGEST :-) Plusieures relations peuvent être attachées à l'action. Plusieurs schémas de cette sorte peuvent être combinés par "=>" (implication) ou des flèches verticales (un schéma est un objet d'un autre schéma). La théorie de la décomposition fonctionnelle a été développée par Schank. Elle est plus puissante que la grammaire des cas, car elle peut exprimer qu'une phrase est l'objet d'une autre (comme dans "Je dis que..."). Annotation: Pour une description qui inclut le temps et le mode de la phrase, cf ai.txt (en anglais) ===================================================================== Reconnaissance de la parole ===================================================================== ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ La production des sons de langage ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ cf aussi phono.txt (en francais) IPA: Le tableau des sons de langage et de leur description, qui a été rédigé par l'Association Phonétique Internationale. Articulateurs, Conduit vocal, Organes vocaux humains: Les organes humains suivants (parmi autres): * Fosses nasales / Nasal cavity / Nasenhoehle * Langue / tongue / Zunge * Cordes vocales / Vocal cords / Stimmbaender * Larynx / Larynx / Kehlkopf * Pharynx / pharynx / Rachen * Bouche / Mouth / Mund * Cavité labiale * Cavité buccale | O / nez --> / / fosses nasales /_ _________ | ___/ cavité \ |_/ buccale \| | Cavité --> |\/ _________ | labiale / langue \ <------- pharynx --> |/\_\ \ | | \ | |()| <-- cordes vocales | | <-- larynx | | <-- trachée-artère |-----------------| bouche Annotation: Pour les autres articulateurs, cf phono.txt (en francais) Production d'un son de langage: Le passage de l'air par le conduit vocal. L'appareil respiratoire fournit l'énérgie en poussant de l'air à travers la trachée-artère. La pression de l'air est modulée (au sommet de la trachée) avant d'être appliquée au conduit vocal par le larynx. Amplification d'une fréquence dans un son: Le renforcement de cette fréquence. Résonance d'un son: L'amplification de certaines fréquences. Résonateur: Une fosse ou cavité du conduit vocal qui peut causer une résonance. Il y a donc le résonateur nasal, le résonateur pharyngal, le résonateur labial et le résonateur buccal. La forme du dernier peut être modulée par l'emplacement de la langue. Voyelle: Un son de langage dont le caractéristique est le libre passage de l'air à partir des cordes vocales. Le seul traitement que l'air peut dès lors subir est la résonance. Voyelle nasale: Une voyelle pour laquelle les fosses nasales résonnent. Voyelle orale: Une voyelle non nasale. Voyelle antérieure: Une voyelle pour laquelle la langue prend une position en arrière dans la bouche. Voyelle postérieure: Une voyelle pour laquelle la langue prend une position en avant dans la bouche. Voyelle centrale: Une voyelle pour laquelle la langue prend une position au milieu de la bouche. Consonne: Un son de langage qui n'est pas une voyelle. Occlusif: Une consonne qui résulte d'une fermeture et une ouverture subite du passage de l'air. Continue: Une consonne qui n'est pas un occlusif. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Le traitement des signals ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Signal d'un son: Une représentation du son. Numérisation d'un signal: L'application des étapes suivantes: * Préamplification * Filtrage de garde (?) * Échantillonnage * Quantification Le résultat est une information temps/amplitude du signal. Information temps/amplitude d'un signal: L'information quelle amplitude le son a-t-il en chaque moment. Échantillonnage d'un signal: Le choix d'un intervall de temps de m millisecondes et la réduction de l'information temps/amplitudes aux valeurs des amplitudes toutes les m millisecondes. Qualité d'un échantillonage: Son intervall de temps élevé à la puissance -1. La qualité est mésurée en Hertz. Signal discret: Un signal qui résulte d'un échantillonnage. Théorème de Shannon: Un échantillonage de k valeurs par seconde perd l'information des fréquences au dessus de k/2 Hz. Quantification d'un signal: Le choix d'un nombre de bits n et la réduction des valeurs de l'amplitude aux valeurs 0,1,2,3 ... (2^n)-1. Qualité d'une quantification: Son nombre de bits n. Son périodique: Un son dont la forme de vibration se repète continuellement. Si une méthode d'analyse de son est seulement applicable à un son périodique et on aimerait analyser un son non périodique, on extracte la part du son qu'on veut analyser et on la repète. Le résultat est un son périodique qui peut être analysé. Le résultat de l'analyse n'est valable que pour le moment choisi. Poids d'une fréquence f d'un son S: Le facteur d'amplitude avec lequel f contribue à S. Principe de la Transformée de Fourier, Principe de TF: Toute onde physique (parmi elles le son périodique) peut être représentée par une somme de fonctions trigonométriques. Celle-ci est appelée "Série de Fourier". Pour un son périodique donné, on peut donc retrouver les fréquences qui le constituent. On peut aussi trouver leurs poids -- comme cela est fait par l'oreille humaine. Spectre d'une fonction d'amplitude g:R->C: Une fonction G:R->C qui prend une fréquence f comme paramètre et redonne le poids avec lequel f contribue au son décrit par g. Le spectre est seulement défini pour un son périodique -- ou bien pour un seul moment donné d'un son non périodique. Transformée de Fourier, TF: La fonction F qui prend une fonction d'amplitude g:R->C et redonne son spectre G:R->C. Il est: * F(g) = G * g = F^-1(G) la transformation est donc réversible * F(g + c*h) = F(g) + c*F(h) pour toute fonction d'amplitude g,h * F(h*g) = F(h)*F(g) pour toute fonction d'amplitude g,h Spectre discrète d'une fonction d'amplitude x:R->C: (?) Transformée de Fourier discrète, TF discrète: (?) Fast Fourier Transformation, FFT: Un algorithme qui calcule le spectre d'une fonction d'amplitude d'une manière très efficace. On écrit G(f) = FFT(g(t)). Sonagramme d'un son: Un système de coordonnées dont la coordonnée X correspond au temps et la coordonnée Y correspond à la fréquence. On met un point sombre à la position x,y, si la fréquence y contribue avec un grand poids au son au moment x. On met un point clair si la contribution est faible. Le sonagramme représente donc le changement du spectre du son durant le temps. Cepstre: Une méthode pour séparer les contributions de la source et du conduit vocal d'un son de langage. Elle se base sur l'hypothèse que le son résulte de deux systèmes linéaires (?) en série. La méthode comprend les étapes suivantes: * Capture du son (le domaine temporel) * Préaccentuation et fenêtrage (?) * FFT (ce qui mène au domaine fréquentiel ou domaine spectral) * L'application de abs et log * FFT inverse (ce qui donne les coefficients cepstraux dans le domaine cepstral ou quéfrenciel) Paramétrisation d'un signal: Le calcul des valeurs suivantes * Indices prosodiques * Prosodie du son * Énergie du son * Résultat du LPC * MFCC * Zerocrossing La paramétrisation sert au codage du son pour l'ordinateur. Pitch, Prosodie, Fréquence fondamentale d'un son de langage: La fréquence la plus forte du son. Elle est notée par F[0]. La prosodie résulte de la vibration des cordes vocales et constitue l'hauteur de la voix. Elle dépend essentiellement de l'âge et du sexe du locuteur: * 100 à 150 Hz pour l'homme adulte * 140 à 240 Hz pour la femme adulte Néanmoins, elle peut présenter des variations considérables chez un même locuteur -- selon le type de phrase prononcée et selon l'état émotif et l'attitude du locuteur. La fréquence fondamentale peut être calculée comme étant le plus grand commun diviseur des fréquences les plus fortes du spectre du son. Formant d'un son de langage: Une fréquence du son, qui a été amplifiée par un résonateur. Théoriquement, un résonateur amplifie un nombre infini de fréquences, mais seulement les 3 amplifications les plus fortes jouent un rôle pour la langue. On note les formants F[1], F[2], .... Énergie d'un son durant un intervalle de temps: La somme de ses amplitudes carrées pour tous les moments de l'intervalle. Pour un signal discret, l'énergie est simplement la somme de ses valeurs, enlevées au carré. LPC, Linear predictive coding: Un algorithme qui calcule la prochaine valeur d'un signal discret comme étant une somme pondérée des valeurs précédentes. Le nombre de valeurs précédentes prises en considération est appellé l'ordre du modèle. Le LPC est utilisé pour réduire l'information envoyée dans les réseaux mobiles: L'émetteur et le récepteur utilisent le même modèle de LPC. Chaqu'un d'eux prédit la valeur prochaine. L'émetteur compare la valeur prédite avec la valeur correcte et envoye leur différence. Le récepteur corrige sa valeur prédite par cette différence et obtient la valeur correcte. Comme cela, on envoye seulement la différence des valeurs, qui est beaucoup plus petite que la valeur elle-même. MFCC, Mel-scaled Frequency Cepstral Coefficients: Des coefficients cepstraux, dont l'échelle est non linéaire. (?) Zerocrossing d'un son: Le nombre de fois où le son a une amplitude de 0 durant 1 seconde. D'ordinaire, le zerocrossing du bruit est plus grand que celui du son de langage, ce qui permet de distinguer ces deux contributions. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Reconnaissance de la parole ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Informations linguistiques de la parole: La phrase ou le mot représenté par la suite des sons. Informations extralinguistiques de la parole: * L'identité du locuteur * La langue parlée * L'état physiologique et psychologique du locuteur * stress * maladie Système de reconnaissance des formes: Un système qui effectue les étapes suivantes: 1. Capture du signal ou de la forme par des capteurs 2. Paramétrisation du signal 3. Décision 4. Affichage de la classe à laquelle la forme appartient Pour apprendre qu'une forme donnée appartient à une classe donnée, les étapes suivantes sont effectuées: 1. Capture du signal ou de la forme par des capteurs 2. Paramétrisation du signal 3. Étiquettage du signal avec une classe par un "enseignant" 4. Apprentissage Annotation: Pour un traitement détaillé, cf ia.txt (en anglais) RAP, reconnaissance automatique de la parole: L'extraction de la phrase ou du mot à partir de la parole, effectuée par un ordinateur. Dictionnaire, Vocabulaire d'un système RAP: L'ensemble des mots reconnus par le système. Les niveaux de difficulté de la RAP: * Le nombre de locuteurs (mono locuteurs, multi locuteurs) * Le nombre de mots du dictionnaire (petit vocabulaire, grand vocabulaire) * Les canaux de transmission (en direct, via le téléphone, les réseaux mobiles etc) * L'environnement acoustique (calme, normal, bruité, extrème) * Le style de parole (digits, mots isolés, mots enchaînés, parole continue) * Le style de conversation (une seule personne à la fois, conversation de type cocktail party) Les domaines d'application de la RAP: * Les services télécom * La commerce éléctronique * Les services Web * Les bornes vocales (?) * La bureautique * L'enseignement des langues * Les transports * L'aide aux handicapés * L'archivage et recherche d'informations La variété des domaines entraîne la dépendance du système RAP de l'application considérée. Variabilité de la parole: Le fait que * une personne ne prononce jamais deux fois le même son de la même facon * deux personnes ne prononcent pas le même son de la même facon Ce qui complique la RAP en plus est la variabilité du signal causée par de différents enregistrements (p.ex. 2 microphones différents). Rapport signal bruit, sound noise relation, SNR: Une mésure de la qualité d'un signal, qui est calculée de la manière suivante: SNR = 10 * log10(E(s)/E(b)) dB où E(s) est l'énergie du son, E(b) est l'énergie du bruit et "dB" est l'unité "déci Bel". On voit que E(signal) = 10^N*E(bruit) => SNR = N*10 dB Le SNR peut être estimé par SNR = 20 * log10(Amplitude(s)/Amplitude(b)) DTW, Dynamic Time Warping: Un algorithme qui décide si une suite de sons donnée pourrait représenter un mot connu. Pour cela, il lui faut * Des paramètres pour coder un son * Une mésure de distance entre les sons codés * Un dictionnaire de mots connus avec leurs prononciations On représente le cours de l'algorithme par une grille qui a la suite des sons capturés en bas et la suite des sons d'un mot connu a gauche. Les sons sont représentés par des symboles (d'ordinare les lettres correspondants). L'algorithme essaye d'identifier chaque son capturé avec un son du mot connu. On note une telle identification par une croix dans la grille. On obtient une suite de croix qui commence au coin en bas à gauche et va jusqu'au coin en haut à droite. L'algorithme minimise le "coût du chemin", c'est-à-dire la somme des distances des sons capturés aux sons du mot connu. Cette somme est une mésure de la qualtité de l'identification. Le passage d'une croix à la prochaine est appellée "transition". Le DTW est utilisé dans les systèmes RAP à petit vocabulaire. DTW symétrique: Un DTW qui permet pour une croix donnée à la position (x,y) les transitions aux positions (x+1,y), (x+1,y+1), et (x,y+1). La distance total se calcule par D(0,0) = 0 D(x,y) = min({D(x-1,y-1), D(x-1,y), D(x,y-1)}) + d(x,y) où d(x,y) est la distance entre les sons x et y. DTW asymétrique: Un DTW qui punit les transitions diagonales. La distance totale se calcule alors par: D(0,0) = 0 D(x,y) = min({D(x-1,y-1)+2*d(x,y), D(x-1,y) +d(x,y)+dh, D(x,y-1) +d(x,y)+dv}) où dv et dh sont des valeurs empiriques qui contrecarrent les effets de bord. DTW asymétrique amélioré: Un DTW qui permet pour une croix donnée à la position (x,y) les transitions aux positions * (x+1,y) (un son prononcé ne se trouve pas dans le mot) * (x+1,y+1) (un son prononcé correspond à un son du mot) * (x+1,y+2) (un son du mot a été laissé tomber) Par conséquent, il y a des cases de la grille qui ne sont jamais utilisées ("incomplétude"). Théorème de Bayes: Le fait suivant: P(B|A) = P(A|B) * P(B) / P(A) Unité de RAP: Un mot ou un phonème. La plupart des systèmes RAP utilisent des phonèmes, mais les idées présentées ci-dessous marchent aussi pour des mots. Approche statistique: Une idée pour la RAP qui utilise * un codage des suites de sons par des vecteurs * un modèle acoustique, c'est-à-dire des données pour les valeurs P(x|w[i]). Une telle valeur est la probabilité que la suite des sons x apparait quand une unité w[i] est prononcée * un modèle de langage, qui donne les valeurs P(w[i]). Une telle valeur est la probabilité générale d'une unité w[i]. Des versions plus raffinées existent, qui rendent compte des unités précédentes. Pour une suite de sons donnée x, on trouve l'unité correspondante w(x) de la manière suivante: w(x) = argmax(w[i], P(w[i]|x) ) = argmax(w[i], P(x|w[i])*P(w[i])/P(x) ) Le modèle acoustique et le modèle de langage sont acquis par apprentissage. Un nombre possible de phonèmes est par exemple 46. L'apprentissage nécessite beaucoup de données. Coarticulation: Le phénomène que l'articulation d'un phonème dépend en général beaucoup des phonèmes voisins. Modèle acoustique indépendant: Un modèle acoustique qui modélise chaque phonème indépendant des phonèmes voisins. Le problème est que la coarticulation est ignorée. Triphone d'un phone: Un triple d'un phonème précédent, du phonème lui-même et d'un phonème suivant. Modèle acoustique dépendant: Un modèle acoustique qui modélise chaque phonème par ses triphones. Le problème est qu'un tel modèle nécessite même plus de données pour l'apprentissage. Clustering: Une solution pour le problème du modèle dépendant. Au lieu d'enregistrer chaque phonème par tous ses triphones, on classe les phonèmes selon leur influence sur le phonème donné. Puis, on stocke seulement les classes de phonèmes. Corpus: Une grande suite de phrases. Modèle stochastique de langage: Un modèle de langage, qui estime la probabilité d'une unité donnée à partir des unités précédentes. Les probabilités sont apprises à partir d'un corpus. Modèle unigramme: Un modèle stochastique de langage, qui calcule la probabilité d'une suite d'unités w directement par des probabilités de ses composantes w[i]: P(w) = P(w[1]) * P(w[2]) * ... Le modèle comprend donc simplement les données P(w[i]). Modèle bigramme: Un modèle stochastique de langage, qui calcule la probabilité d'une suite d'unités w à l'aide de la probabilité avec laquelle une unité w[i] est précédée par une autre: P(w) = P(w[2]|w[1]) * P(w[3]|w[2]) * ... Le modèle comprend donc les données P(w[i]|w[j]). Modèle trigramme: Un modèle stochastique de langage, qui calcule la probabilité d'une suite d'unités w à l'aide de la probabilité avec laquelle une unité w[i] est précédée par deux autres: P(w) = P(w[3]|w[1] et w[2]) * P(w[4]|w[2] et w[3]) * ... Le modèle comprend donc les données P(w[i]|w[j] et w[k]). Modèle N-classes: Un modèle stochastique de langage, qui estime la probabilité d'un mot à l'aide de sa classe. Le modèle comprend les données P(c[i]) ("uni-classes") et P(c[i]|c[j]) ("bi-classes"). Elles estiment respectivement la probabilité générale d'une classe ou la probabilité qu'un mot de la classe c[i] apparait, vu que le mot précédent était de la classe c[j]. Treillis de mots: Un graphe, dont les noeuds sont les mots d'une phrase. Ils sont liés par des flèches du premier mot au dernier mot de la phrase. Si pour un mot, il existe plusieures alternatives, on les dessine l'un au dessus de l'autre. On met les flèches de sorte qu'on peut suivre les flèches pour obtenir une phrase pour chaque mot en question. Modèle grammatical: Un modèle de langage qui estime la probabilité d'un mot à l'aide d'une grammaire. Pour une suite de sons donnée, il construit un treillis de mots et cherche la suite des mots qui obéit le mieux à la grammaire de la langue. Modèle de Markov Caché, Hidden Markov Model, HMM: Un tuple de * Un ensemble d'états S={s[1],...s[n]} * Un ensemble d'observations V={v[1],...v[m]} * Une fonction A:S x S -> [0,1] qui redonne pour chaque couple d'états la probabilité d'une transition * Une fonction B:S x V -> [0,1] qui redonne pour chaque couple d'un état s et une observation v la probabilité de cette observation v vu que le système est dans l'état s * Une fonction PI:S -> [0,1] qui redonne pour chaque état sa probabilité initiale Un tel modèle simule les transitions d'un système d'un état à un autre, vu qu'on a une suite d'observations O=(o[1],...o[k]). Pour une suite d'états donnée E=(e[1],...e[k]) on peut calculer la probabilité que cette suite E cause les observations O: On multiplie la probabilité initiale PI(e[1]) par les probabilités des transitions A(e[i],e[i+1]) et les probabilités B(e[i],o[i]). Le modèle peut être utilisé pour simuler la reconnaissance d'un son: Comme états, il y a l'attaque (le début), le son lui-même et la transition du son (la période finale du son). Problèmes basiques d'un HMM: * Comment est-ce qu'on calcule la probabilité d'une suite d'observations, si les transitions ne sont pas connues? (Problème d'évaluation) * Comment est-ce qu'on choisit les états pour maximiser la probabilité d'une suite d'observations? (Problème de décodage) * Comment est-ce qu'on change les paramètres du modèle pour garantir qu'une suite d'états donnée produit la probabilité maximale pour une suite d'observations donnée? (Problème d'apprentissage, résolu par l'algorithme Baum-Welch) ===================================================================== Syntaxe ===================================================================== cf aussi cl.txt (en anglais) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Les langues ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Syntaxe: L'étude des phrases correctes d'une langue. Pragmatique: L'étude de l'usage de la langue. Morphologie: L'étude des morphèmes. Phonologie: L'étude des phonèmes. Diversité des langues: Il y a environ 6000 langues parlées dans le monde, dont * 3 familles en Europe (l'indoeuropéen, le finno-ongrien, la basque) * 14% en Nouvelle-Guinée * 12 familles chez les indiens de l'Amérique du Nord Néanmoins, on peut toujours traduire le sens d'une phrase dans n'importe quelle langue. Une morphologie universelle serait utopique, par contre on essaye de trouver une grammaire universelle. Sanskrit: Une langue qui a été parlée en Indie. Panini a écrit une grammaire de la langue Sanskrit en -500 après JC. Bien que la langue ne soit plus parlée, il existe beaucoup de littérature en Sanskrit. Langue SVO: Une langue dans laquelle une phrase est le plus souvent de la forme sujet verbe objet. Les langues SVO sont les langues les plus fréquentes. Exemple: L'anglais et le francais Annotation: Voir plus bas pour les définitions de "sujet" et "objet" et "verbe" Langue SOV: Une langue dans laquelle une phrase est le plus souvent de la forme sujet verbe objet. Les langues SOV sont aussi fréquentes. Par contre, les langues de la structure VSO, OVS ou OSV sont très rares. Exemple: Le japonais Ontogenèse: Le développement de l'enfant. Phylogenèse: Le développement de la race humaine. Prélangage: Un ensemble de productions vocales associées à des évènements. Exemple: "Ouille!" est associé à un évènement doloreux :-) Proto-langage: Un ensemble de suites de mots pleins, dont le sens est la suite des extensions des mots. Un tel langage ne peut pas créer des phrases complexes sans être ambigue. Exemple: "Moi chasser toi entrer forêt" Il n'est pas clair qui est entré dans la forêt Langage: Un ensemble de suites de mots pleins et fonctionnels. Un tel langage permet de calculer le sens d'une phrase à partir des sens de ses mots. On suppose que la race humaine a développé le langage pour résoudre des problèmes complexes qui ne peuvent pas être décrits par un proto-langage. Un langage permet de décrire les objets d'une manière précise en exprimant un ensemble de propriétés. Pronom: Un mot qui fait référence à une entité qui dépend de la phrase elle-même ou des phrases précédentes. Exemples: "Je", "toi"... Pronon clitique: Un pronon dont la position dans la phrase est fixe. Exemple: Il est forcément "Je le lui donne", les pronoms ne peuvent pas prendre une autre position dans la phrase Pidgin: Une version simplifée d'une langue. Créole: Un pidgin qui s'est développé. Lexigramme: Un symbole qui représente une entité ou une classe. Apprentissage de langue chez le chimpanzée: On a trouvé que les chimpanzées ne sont pas capables d'apprendre une langue de la facon humaine. L'apprentissage est très lourd et souvent limité à deux lexigrammes. Inflexion d'un mot: Une modification de la forme du mot, très souvent par une combinaison avec des morphs. Apprentissage de la grammaire par l'enfant: Les enfants apprennent très vite la grammaire de leur langue (d'une manière implicite). Ce-ci bien qu'on ne les enseigne pas explicitement. Les enfants produisent leur premier mot reconnaissable ("Maman" :-) aux alentours de 12 mois. Le vocabulaire augmente de 3 mots par mois jusqu'à 1 mot toutes les deux heures à partir d'un âge de 18 mois. À 18 mois, l'enfant commence à utiliser les inflexions et à former des phrases incomplètes de 2 ou 3 mots. À 30 mois, la plupart des inflexions et la plupart des règles grammaticales est présente. À 3 ans, l'enfant sait parler parfaitement. Une théorie du langage devrait donner une réponse aux questions suivantes: * Comment se fait-il qu'après une période de stagnation de plusieurs mois, il y ait un sign évident de développement grammatical pendant 12 mois après l'âge de 18 mois? * Comment se fait-il que l'enfant maitrise parfaitement la grammaire à 3 ans, bien qu'il soit notoirement incoméptent dans les autres activités? * Pourquoi l'enfant apprend-il correctement la langue bien que les parents ne font que très peu attention à la grammaticalité des énoncés? Les erreurs linguistiques des enfants sont souvent dues à une sur-généralisation d'une règle grammaticale. Exemple pour une sur-généralisation: L'ajout de "-ed" pour former le passé en anglais mène à des phrases comme "He holded it"). ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ La grammaire ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Règle de réécriture: Un couple de deux suites de symboles. On l'écrit sous la forme X[1],...X[m] -> Y[1],...Y[n]. Elle dit: La suite des symboles X[1],...X[m] peut être réécrite ou remplacée par la suite des symboles Y[1],...Y[n]. Annotation: Pour un traitement très détaillé, cf infod.txt (en allemand) ou cl.txt (en anglais) Grammaire: Un tuple d' * un ensemble de symboles terminaux * un ensemble de symboles non-terminaux * un ensemble de règles de réécriture * un symbole non-terminal initial S Expression: Une suite de symboles terminaux. Expression engendrée par une grammaire: Une expression qui peut être obtenue par réécritures successibles à partir du symbol initial. Exemple: La grammaire avec les règles suivantes engendre toutes les expressions qui comprennent n 'a's suivis par n 'b's: S -> ab S -> aSb Arbre de dérivation d'une expression engendrée par une grammaire: Un arbre dont chaque noeud non terminal est un symbole non-terminal et dont les feuilles constituent l'expression. La racine est le symbole initial et chaque noeud a comme enfants les symboles qui en ont été produits avec une règle de réécriture. Grammaire d'une langue: Une grammaire dont * les symboles terminaux sont des mots * les expressions engendrées sont les phrases de la langue Dans toute la suite, on admet qu'il y a une seule grammaire pour chaque langue et qu'on parle de la grammaire de la langue francaise. Fonction grammaticale, Classe, Préterminal d'un mot M: Le symbole non-terminal X pour lequel la grammaire possède la règle de réécriture X -> M. Les classes sont d'ordinaire * A (adjectif) * V (Verbe) * N (nom) * P (préposition) Syntagme d'une grammaire: Un de ses symboles qui n'est ni terminal ni préterminal. D'ordinaire, ces symboles sont les suivants (parmi autres): * S (phrase) * SN (syntagme nominal) * SP (syntagme verbal) * SP (syntagme prépositionnel) * SA (syntagme adjectival) Syntagme d'une phrase: Une suite de ses mots qui est provient d'un syntagme de la grammaire. Exemple: Dans "Le petit chien mignon a mordu Pierre à la jambe", "Le petit chien mignon" est un syntagme, comme il provient d'un SN. Verbe d'une phrase: La suite de ses mots que la grammaire a produite à partir du V qu'elle a produit à partir du SV. Sujet d'une phrase: La suite de ses mots que la grammaire a produite à partir du SN qu'elle a produit directement à partir du S. Objet d'une phrase: La suite de ses mots que la grammaire a produite à partir du SN qu'elle a produit à partir du SV. Grammaire hors contexte: Une grammaire dont toutes les règles sont de la forme X[1] -> Y[1],...Y[n]. Grammaire contextuelle: Une grammaire dont toutes les règles sont de la forme X[1],...X[i],...X[m] -> X[1],...X[i-1],Y[1],...Y[n],X[i+1],...X[m]. Une telle règle remplace donc un symbole qui est entouré par un certain contexte de symboles. On écrit la règle aussi sous la forme X[i] -> Y[1],...Y[n] / X[1],...,_,...X[m] Langage formel: Un sous ensemble de l'ensemble de toutes les chaines. eps: Un symbole vide. Automate à états finis: Un tuple de * Un ensemble de symboles A, dont le symbole eps * Un ensemble d'états Q * Une fonction partielle de transitions f:Q x A -> Q * Un état final qf appartenant à Q * Un état initial q0 appartenant à Q Un tel automat peut produire les chaînes de certains langages formels par l'algorithme suivant: 1. Soit q := q0 2. Soit S := () 3. TantQue q != qf, repète 4. Choisis un a[i] appartenant à A pour lequel f(q,a[i]) est défini 5. Si a[i] != eps, alors ajoute a[i] à S 6. q := f(q,a[i]) 7. FinTantQue 8. S est la chaîne produite Un automate peut être visualisé par un graphe dont les noeuds sont les états et les flèches sont les transitions, qu'on munit du symbole associé. Ces automates ne peuvent pas produire tous les languages formels. Exemple: {AB | A est une chaîne de a's et B est une chaîne de b's} peut être produit. Par contre, {AB | A est une chaîne de a's et B est une chaîne de la même longuer de b's} ne peut pas être produit Annotation: Pour un traitement très détaillé, cf infod.txt (en allemand) ou cl.txt (en anglais) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Les théories ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Variable: Une minuscule de la fin de l'alphabet. Exemples: x, y, z Représentation logique d'une phrase: Une suite de littéraux, qui exprime le sens de la phrase. Les arguments des littéraux peuvent aussi être des variables. Dans ce cas, deux littéraux avec la même variable concernent la même entité. Les arguments des littéraux peuvent aussi être d'autres littéraux. Dans ce cas, le littéral concerne l'état exprimé par le littéral en position d'argument. La suite est notée avec des "et"s entre les littéraux. Exemple: "Le petit chien de ma mère est malade" --> chien(x) et petit(x) et possède(z,x) et mère(z,moi) Modèle markovien de la langue: L'idée que la probabilité de l'occurance d'un mot dans une phrase ne dépend que du mot précédent. Le modèle markovien est faux. Dépendance linguistique: Le lien entre le verbe et le sujet d'une phrase. Dépendence enchassée: Une dépendance de la forme A1 B1 B2 A2 | '--' | '--------' Exemple: "Le mammouth que j'ai voulu manger me mange" | '--' | '---------------------------------' Dépendance croisée: Une dépendance de la forme A1 B1 A2 B2 '--|--' | '-----' Modèle d'automates de la langue: L'idée que toutes les phrases de la langue peuvent être produites par un automate à états finis. Cela n'est pas vrai: * Le modèle ne rend pas compte de la syntagmatisation * Le modèle ne rend pas compte des dépendances linguistiques * Le modèle ne peut pas représenter des dépendances enchassées ou croisées Déplacement d'un mot dans une phrase: Le bougement du mot à une feuille vide de l'arbre de la phrase. Trace d'un déplacement: Le lien entre la position ancienne et la position actuelle du mot déplacé. Il se montre dans la représentation logique de la phrase par une variable commune des deux littéraux concernés. Chaîne d'un mot déplacé: Le couple du mot et d'un symbole qui indique la position initiale du mot. Modèle de la grammaire syntagmatique, GGT, grammaire génératrice transformable: L'idée qu'une langue est décrite par une grammaire et des transformations sous forme de déplacements. On dit que la grammaire donne la structure profonde d'une phrase lorsque les transformations produisent sa structure surface. La dernière permet de déduire la représentation logique et la prononciation de la phrase. Rôle sémantique d'un mot dans une phrase: Le rôle que l'entité désignée par le mot joue dans l'état exprimé par la phrase. C'est la grammaire qui assigne les rôles sémantiques aux mots. Exemples: Cf "Grammaire des cas" plus haut Syntagmatisation: Le phénomène qu'on peut remplacer un syntagme d'une phrase par un autre syntagme du même genre -- sans violer la grammaire. Créativité: Le phénomène qu'on peut produire une infinité de phrases d'une langue. Évidence pour une le modèle GGT: La grammaire explique * le fait que certaines phrases sont admises, certaines pas * la créativité * la syntagmatisation * l'indépendance du rôle sémantique de la position du mot * l'indépendance du sens de la phrase de sa grammaticalité Théorie X barre: L'idée de la grammaire syntagmatique plus l'idée que chaque syntagme est de la forme X'' / \ s X' / \ X c * X est la tête lexicale du syntagme, d'ordinaire V, N, A, P * X' est la projection intermédiaire de X (autrefois SV,SN,SA,SP) * X'' est la projection maximale de X * s est le spécifieur (très souvent Det) * c est le complément (très souvent A) L'ordre des enfants d'un noeud n'est pas fixé dans le modèle. Les noeuds peuvent être vides. La théorie X barre a été développée par Chomsky. Elle permet une déscription homogène de tous les types de syntagmes. Si un syntagme X' nécessite plusieurs compléments, on redouble X' par adjonction et attache les compléments de sorte que chaque noeud a toujours deux enfants. Exemple: "Bob chasse le mammouth" V'' / \ N'' V' / / \ / V N'' N' | | \ | | | N' N | | | | | | N | | | | Bob chasse le mammouth Adjonction: Une application qui prend deux arbres X et Y et un paramètre "droit" ou "gauche" et produit l'arbre suivant pour "droit": pour "gauche": X X / \ / \ X Y Y X Principe de la liaison sémantique: Le fait que, dans la représentation logique d'une phrase, la tête et le complément d'un syntagme partagent les mêmes arguments. Arbre de phrase selon la théorie X barre: Un arbre de la forme I'' / \ s I' / \ I V'' / \ ..... * I'' est le noeud d'inflexion, qui engendre toute la phrase * s est le spécifieur de I * I stocke l'information de temps de la phrase, très souvent sous forme d'un mot auxiliaire comme "a", "will", "has" etc. * V'' est la projection maximale du verbe de la phrase, donc l'arbre de dérivation de la phrase elle-même Il se passe très souvent que le spécifieur de V'' (donc le SN sujet) se déplace à la position du spécifieur de I. La représentation permet de calculer une représentation logique de la phrase: Chaque X'' correspond à un prédicat, dont le spécifieur et le complément sont les arguments. Un complément complexe est remplacé par une variable et introduit lui-même comme prédicat. Exemple: "Bob a chassé le mammouth" I'' / \ / I' / / \ / I V'' / / / \ / / N'' V' / / / / \ / / / V N'' / / N' | | \ | | | | | N' | | N | | | | | | | | N | | | | | | a Bob chassé le mammouth ^-----' Représentation logique: passé(chasser(Bob, mammouth)) Annotation: Pour un traitement détaillé des représentations logiques à l'aide du calcul lambda, cf cl.txt (en anglais) Infinitif d'un verbe: Sa forme sans inflexion. Complémenteur: Un des mots "que" ou "qui" ou "de" (si "de" est suivi par un infinitif). Leur classe est "C". Syntagme complémentaire: Un syntagme introduit par un complémenteur. Un tel syntagme peut être le complément d'un syntagme nominal. Il a l'arbre suivant: C'' / \ s C' / \ C I'' / / \ / / I' / / / \ / / I V'' / / / / \ / / / N'' V' / / / / / \ / / / N' V N'' Exemple: "...que Bob a chassé" | | | | | \ | | | N | | | | | | | | a Bob chassé que ^-----' | ^-------------------' * C'' est la projection maximale du complémenteur * C' est la projection du complémenteur * C est le complémenteur * I'' est l'arbre d'une phrase Si le complémenteur est "qui", ce mot est vu comme sujet de V'' qui se déplace vers C. Si le complémenteur est "que" et concerne l'objet de la phrase, "que" est vu comme complément de V'' qui se déplace vers C. Si le complémenteur est "que" et introduit une phrase sous ordonnée, rien ne se déplace. Si le complémenteur est "de", les niveaux I'' et I' sont supprimés et le sujet de V'' se déplace vers le sujet du V'' superieur. Syntagme interrogatif: Un syntagme qui commence par "Quel(le)(s)". Interrogative: Une phrase qui commence par un syntagme interrogatif. Une telle phrase a l'arbre suivant: C'' / \ / C' / / \ / C I'' / / / \ / / / I' / / / / \ / / / I V'' | / / / / \ | / / / N'' V' | | / / / / \ | | / / N' V N'' Exemple: "Quel mammouth | | | | | | | \ Bob a(-t-il) chassé?" | | | | N | Det N' | | | | | | \ \ | | | | | | | N | | | | | | | \ 0 a Bob chassé quel mammouth ^-----' _____________ ^------------------------' La racine d'une telle phrase est donc C'', dont le spécifieur prend l'objet de la phrase I''. La représentation logique a la forme { quel(x) n(x) } ... où "n" est le nom qui accompagne "quel(le)(s)" et "..." est la représentation logique de la phrase I'', dans laquelle l'objet a été remplacé par "x". Trait formel: Une propriété d'un syntagme qui n'a pas d'interprétation sémantique. Cas: Un trait formel des syntagmes nominaux. Trait "qu", Trait "wh": Un trait formel des syntagmes interrogatifs. Théorie de la vérification des traits: L'idée que les syntagmes ont des traits formels qui doivent être "vérifiés" ou "validés". Les traits sont validés de la manière suivante: * Le trait "qu" est validé si le syntagme nominal se trouve en position spécifieur d'un C'' * Le cas est validé si le syntagme nominal se trouve en position spécifieur d'un autre syntagme. Si la tête de celui-ci est un V, alors le cas est dit d'être "accusatif", si la tête est un P, le cas est "oblique" et si la tête est I, le cas est "nominatif". D'après la théorie, les déplacements et les introductions des prépositions ont lieu pour vérifier cette contrainte. Mais la théorie prévoit des déplacements qui ne sont pas observés. Programme minimaliste: La théorie X barre plus la théorie de la vérification des traits. On essaye donc d'expliquer tous les phénomènes de la syntaxe par un nombre minimal d'hypothèses. Déplacement visible: Un déplacement qui se montre dans l'ordre des mots de la phrase. On dit que le déplacement concerne les traits phonétiques et les traits sémantiques de la phrase. Déplacement furtif: Un déplacement qui est effectué dans l'imagination pour vérifier un trait formel, mais qui n'a pas d'effet sur l'ordre des mots dans la phrase. On dit que le déplacement concerne seulement les traits sémantiques de la phrase. Trait fort pour une langue: Un trait formel qui entraîne des déplacements visibles pour sa vérification. Exemple: "nominatif" est un trait fort dans la langue francaise: Un N'' va effectuer un déplacement pour recevoir ce cas. // Mais "nominatif" n'est pas un trait (?) Le trait, c'est "cas" Trait faible pour une langue: Un trait formel qui entraine des déplacements furtifs pour sa vérification. Exemples: "accusatif" et "oblique" sont des traits faibles dans la langue francaise: Un N'' ne va pas effectuer un déplacement visible pour recevoir un tel cas. // Pareil, "accusatif" n'est pas un trait (?) Théorie de la Grammaire universelle, Théorie GU: L'idée qu'il y a des "principes" linguistiques qui sont innés, propres aux hommes et communs pour toutes les langues. Puis, il y a des "paramètres", c'est-à-dire des attributs aux valeurs "oui/non", qui spécifient une certaine langue. Ils sont fixés pendant l'apprentissage de la langue par l'enfant. La théorie de la grammaire universelle a été développée par Chomsky. Exemple pour un principe: * Les phrases sont organisées par des syntagmes Exemples pour des paramètres: * La tête peut être en début ou en fin de syntagme (SVO ou SOV, prépositions en début ou en fin ("post-positions")) * Le syntagme interrogatif peut de déplacer en position spécifieur ou pas * Le sujet peut être obligatoire ou pas