Il Cambridge English Corpus compie 25 anni
Le fonti sono le più svariate, i ricercatori del Corpus raccolgono quotidianamente parole ed espressioni utilizzate in libri, canzoni, social network, programmi televisivi, giornali, radio o semplicemente intervistando persone per le strade delle metropoli anglosassoni.
Un inglese che non è solo accademico ma raccoglie anche i vocaboli specialistici utilizzati da avvocati, operai, ingegneri, insegnanti, artigiani, finanzieri, musicisti in tutto il mondo. Questa varietà di fonti consente al Corpus di essere sempre aggiornato sulle evoluzioni della lingua inglese, sia parlata sia scritta.
Tutto questo ha permesso negli anni di raccogliere 1,8 miliardi di parole ed espressioni, creando uno tra i più grandi e completi database al mondo della lingua inglese, 320 volte le voci in inglese presenti su Wikipedia.
Se mettessimo insieme tutte le parole contenute nel Corpus (e usassimo un carattere grande 12 pt), le parole farebbero un doppio giro del globo, e per leggere tutte le parole del Corpus ci vorrebbero oltre 11 anni, leggendo senza interruzione 24 ore al giorno!
Tuttavia nel Corpus non c'è solo spazio per l'inglese dei madrelingua ma anche per chi prova ad impararlo, raccogliendo e catalogando ogni anno oltre 5 milioni di prove sostenute in tutto il mondo da chi affronta una certificazione Cambridge English (come Preliminary, First, Advanced) vengono raccolti, paese per paese, gli errori più comuni di chi studia l'inglese tenendo conto di variabili come l'età, il sesso, il livello d'istruzione dell'esaminato.
La parola più sbagliata nel mondo?
"Because"! Analizzando il Corpus i ricercatori hanno trovato ben 237 modi diversi in cui è stata scritta.
"Quando noi e gli autori della Cambridge lavoriamo per un nuovo libro per insegnare la lingua inglese agli italiani" spiega Claudia Corrias, editor della Cambridge University Press "grazie al Corpus possiamo sapere gli errori più comuni degli studenti italiani e lavorare su contenuti ed esercizi studiati appositamente per evitarli."
Dai dati del Corpus risulta che, oltre a because, le parole più difficili da scrivere per gli italiani sono accommodation, especially e which.
"La Cambridge University Press è la casa editrice in attività più antica al mondo" racconta Patrizia Zanon, General Manager della Cambridge University Press Italia "la continua ricerca e l'innovazione sono nel nostro DNA: abbiamo iniziato a produrre libri appena quarant'anni dopo la scoperta dell'America e da allora non ci siamo più fermati. Il Corpus è frutto di questa storia - aggiunge Patrizia Zanon - ed è alla base dell'approccio dei nostri corsi di lingua, nati per permettere agli studenti di addentrarsi nella lingua parlata ogni giorno".
Cambridge University Press is the publishing business of the University of Cambridge with VAT registered number GB 823 8476 09. Our principal office is at University Printing House, Shaftesbury Road, Cambridge, CB2 8BS, United Kingdom.
--
www.CorrieredelWeb.it
Nessun commento:
Posta un commento