Une base de cent soixante mille noms propres
a été constituée de
septembre 1999 à avril 2000. Elle recouvre les Iles Britanniques à
l'exception de l'Irlande. Exhaustive pour les toponymes, elle se fonde, quant aux
patronymes, sur les items les plus fréquents du recensement de 1905.
Très tôt, le choix de la transcription
manuelle s'est imposé, du fait que les noms propres ne suivent que très
peu les règles de correspondance graphème-phonème usuelles.
L'anglais standard a été pris comme
norme de transcription, ce qui peut soulever la question de la
représentativité d'une telle norme.
On examinera d'autre part la méthodologie
de tels projets, triplement contraints par les délais, le budget, et la
compétence plus ou moins adéquate des informateurs.
En dernier lieu, l'exposé abordera les prolongements
envisageables, que ce soit en termes d'enseignements tirés des transcriptions
effectuées, d'améliorations et de corrections possibles, mais surtout
de l'extension de la base. Sur ce dernier point, on discutera la pertinence d'une
approche markovienne, sachant que l'on a affaire à des éléments dont
les occurrences sont extrêmement peu fréquentes.