Könspreferens för instruerande TTS-synteser

Detta är en Kandidat-uppsats från KTH/Skolan för elektroteknik och datavetenskap (EECS)

Författare: Erik Meurk; Simon Sundström; [2021]

Nyckelord: TTS-syntes; preferens; kön; instruerande; ;

Sammanfattning: Text-till-talsynteser (eng. Text-to-speech, TTS), med andra ord digitalt skapade röster, har blivit en naturlig del av våra dagliga liv. Vi hör dem i kollektivtrafiken, när vi interagerar med digitala assistenter och när människor som saknar en egen röst använder dem för att kommunicera. Dessa artificiella röster har, precis som riktiga röster, olika egenskaper som påverkar hur de låter och uppfattas. Det är därför intressant att förstå vilka TTS-synteser som användare föredrar i olika sammanhang. I denna studie undersöktes huruvida det finns en preferens för olika kön hos instruerande TTS-synteser. I studien fick 46 deltagare spela ett spel där målet var att fullfölja ett antal upplästa instruktioner genom olika knapptryck på skärmen. Spelet var uppdelat i två omgångar, där instruktören i ena omgången var en TTS-syntes med en manlig röst och i den andra en kvinnlig. Vilken TTS-syntes som började och ordning av instruktioner slumpades för deltagarna. Efter spelad omgång svarade deltagarna på en enkät om upplevda röstegenskaper hos instruktören. När sista omgången fullföljts besvarades även en avslutande enkät där det bland annat frågades vilken av TTS-synteserna de föredrog, följt av en kvalitativ fråga där de fick motivera sitt svar. Svaren analyserades sedan genom ett statistiskt test och en kvalitativ analys. Studien kunde ej påvisa någon preferens för kön hos instruerande TTS-synteser. Istället visade resultatet att testpersonerna har individuella preferenser och åsikter om rösterna, även om det verkade finnas viss konsensus om somliga upplevda röstegenskaper hos TTS-synteser.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)