Ahotsak Ahozko Corpusa

Ahotsak Ahozko Tradiziozko Corpusa izendatu dugun proiektuaren helburua ahozko materialean oinarritutako corpus linguistiko bat osatzea da. Euskal Herriko Ahotsak proiektuaren barruan egindako transkripzioetan oinarrituz, 1900-1950 bitartean jaiotako euskaldunen bat-bateko hizkera naturalaren ezaugarriak bildu nahi ditu.


Hizlarien lekukotasunak oinarri hartuta, ondorengo informazioa jasotzen dugu: 1) lema bakoitzaren aldaerak; 2) aldaeren eta lemen banaketa geografikoa; 3) datu estatistikoak. Kasu guztietan, bildutakoaren transkripzio-zatia eta bideoa kontsultatzeko aukera ere eskaintzen da.

Oraindik ere Beta fasean gaude, lematizazio fase esperimentala garatzen eta eskuzko zuzenketak egiten (ahozko lagin batean ez dagoelako lan automatikorik egiterik). Webgunean aurkituko dituzun datuak eta emaitzak, beraz, ez dira inola ere behin betikoak. Saio esperimental baten emaitza gisa ulertu eta erabili behar dira. Corpus irekia da, gainera, etengabe ari baikara transkripzio gehiago egiten eta materiala aztertzen.