Correction orthographique des
mots inconnus, si une suggestion évidente
s’impose. Ainsi il corrigera «
mouvemment » en « mouvement
» car aucun autre mot proche n’est
possible mais il ne corrigera pas «
eleve » car ce mot peut être
remplacé par « élève
» ou « élevé
».
Analyse syntaxique qui fixe la
catégorie grammaticale de chacun
des mots, par exemple de déterminer
si le mot « aura » est un
nom ou une forme du verbe avoir. Grâce
à la technologie Cordial, cette
détermination s’effectue
avec un très haut niveau de confiance,
supérieur à 99 %. Puis les
propositions sont découpées
et les fonctions grammaticales de chacun
des mots sont déterminées.
Analyse sémantique détermine
le sens de chacun des mots. Pour certains
mots, il est possible de s’appuyer
sur la syntaxe, ainsi le mot « mousse
» ne réfère pas au
même sens selon qu’il est
masculin ou féminin. Mais, d’une
façon générale, les
sens ne peuvent être déterminés
que par l’analyse de contexte, l’étude
des relations sémantiques entre
chacun des mots de la phrase.
Extraction des mots-clés
détermine les mots pivots de la question.
Type de la question est extrait du classement
préalable des introducteurs possibles
et de leurs milliers de combinaisons (où,
vers où, avec quoi, quand, à
partir de quand, comment, avec combien...),
c'est-à-dire de la forme de la
question. Ce type sera ensuite comparé
aux types de réponses qui ont été
relevés lors de l’indexation
dans chacun des textes.
Traduction multilingue des mots-clés
dans les langues choisies par l'utilisateur,
à savoir, le français, l'anglais,
l'italien, le portugais et le polonais.