L’articolo descrive la progettazione, la realizzazione e le caratteristiche di un nuovo learner corpus di italiano L2: il corpus CELI. Il corpus raccoglie, sistematicamente, le produzioni scritte di apprendenti di italiano L2 che hanno superato le prove per la certificazione linguistica CELI dell’Università per Stranieri di Perugia in relazione ai livelli B1, B2, C1 e C2. Il corpus contiene 3041 testi prodotti da altrettanti apprendenti, con una distribuzione bilanciata dei token per livello di competenza. I metadati associati a ciascun testo includono: il genere, la data di nascita, il numero di matricola e la nazionalità dell’apprendente; il livello di competenza, secondo il QCER, relativo alla prova superata dall’apprendente; il punteggio totale assegnato all’intera prova d’esame, il punteggio totale assegnato alla componente scritta dell’esame, il punteggio specifico assegnato alla singola produzione scritta, con i relativi punteggi assegnati alla competenza lessicale, alla competenza grammaticale, alla competenza sociolinguistica, e alla coerenza e coesione del testo prodotto; il numero identificativo della traccia utilizzata per la produzione di ciascun testo, con l’indicazione del genere (lettera, e-mail, blog, racconto, articolo e relazione) e della tipologia (argomentativa, descrittiva e narrativa, o mista: descrittiva-narrativa; argomentativa-narrativa; argomentativa-descrittiva; argomentativa-narrativa-descrittiva) del testo prodotto. Il corpus CELI si presta a numerosi utilizzi sia sul versante della ricerca linguistico-acquisizionale, soprattutto in chiave pseudo-longitudinale, sia sul versante della pianificazione didattica, dello sviluppo di attività didattiche e del language testing.
Il Corpus CELI: una nuova risorsa per studiare l'acquisizione dell'italiano L2 / Spina, Stefania; Fioravanti, Irene; Forti, Luciana; Santucci, Valentino; Scerra, Angela; Zanda, Fabio. - In: ITALIANO LINGUADUE. - ISSN 2037-3597. - 14:1(2022), pp. 116-138. [10.54103/2037-3597/18161]
Il Corpus CELI: una nuova risorsa per studiare l'acquisizione dell'italiano L2
Stefania Spina;Fabio Zanda
2022
Abstract
L’articolo descrive la progettazione, la realizzazione e le caratteristiche di un nuovo learner corpus di italiano L2: il corpus CELI. Il corpus raccoglie, sistematicamente, le produzioni scritte di apprendenti di italiano L2 che hanno superato le prove per la certificazione linguistica CELI dell’Università per Stranieri di Perugia in relazione ai livelli B1, B2, C1 e C2. Il corpus contiene 3041 testi prodotti da altrettanti apprendenti, con una distribuzione bilanciata dei token per livello di competenza. I metadati associati a ciascun testo includono: il genere, la data di nascita, il numero di matricola e la nazionalità dell’apprendente; il livello di competenza, secondo il QCER, relativo alla prova superata dall’apprendente; il punteggio totale assegnato all’intera prova d’esame, il punteggio totale assegnato alla componente scritta dell’esame, il punteggio specifico assegnato alla singola produzione scritta, con i relativi punteggi assegnati alla competenza lessicale, alla competenza grammaticale, alla competenza sociolinguistica, e alla coerenza e coesione del testo prodotto; il numero identificativo della traccia utilizzata per la produzione di ciascun testo, con l’indicazione del genere (lettera, e-mail, blog, racconto, articolo e relazione) e della tipologia (argomentativa, descrittiva e narrativa, o mista: descrittiva-narrativa; argomentativa-narrativa; argomentativa-descrittiva; argomentativa-narrativa-descrittiva) del testo prodotto. Il corpus CELI si presta a numerosi utilizzi sia sul versante della ricerca linguistico-acquisizionale, soprattutto in chiave pseudo-longitudinale, sia sul versante della pianificazione didattica, dello sviluppo di attività didattiche e del language testing.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


