Ordföljdsvariation inom kardinaltalssystem : Extraktion av ordföljdstypologi ur parallella texter

Detta är en Kandidat-uppsats från Stockholms universitet/Institutionen för lingvistik

Sammanfattning: Typologisk klassificering av kardinaltals ordföljdstendenser har generellt utgått från en binär uppdelning i pre- och postnominella språk, men viss inomspråklig variation i ordföljdsmönster mellan olika kardinaltal har hittats bland världens språk. Tillgång till parallelltexter på många olika språk möjliggör storskalig kvantitativ typologisk analys av syntaktiska fenomen som detta, givet en lämplig strategi för språkoberoende parsning av icke-annoterat material. I denna studie undersöks aspekter av kardinaltalsberoende ordföljdsvariation i 1336 språk genom ordlänkning och annoteringsöverföring i en massivt parallell korpus av Bibelöversättningar. Källtexter märks upp med syntaktisk och lexikal annotering som förs över till icke-annoterad ordlänkad data på andra språk, och ordföljdstendenser för varje kardinaltal och språk mäts statistiskt. Utvärdering av metodens klassificering av generell kardinaltalsordföljd gav 87 % överensstämmelse med data från den manuellt sammanställda WALS-databasen, i linje med tidigare evalueringar av liknande metoder. Variation i ordföljdsmönster mellan individuella kardinaltal uppvisades i en väsentlig andel av undersökta språk, vilket motiverar värdet av en mer detaljerad klassificering av kardinaltals ordföljdstypologi. Undersökning av seriell ordföljdsvariation, där ett seriellt gränsvärde finns mellan olika dominerande ordföljdstyper i ett språks kardinaltalssystem, visade att den överlägset vanligaste strukturen för seriell variation i den undersökta datan var prenominella uttryck för 1 i språk där den dominerande kardinaltalsordföljden klassats som postnominell.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)