Sökning: "multi-modal analys"

Visar resultat 1 - 5 av 6 uppsatser innehållade orden multi-modal analys.

  1. 1. The Gunnlod Dataset : Engineering a dataset for multi-modal music generation

    Kandidat-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Emil Johansson; Joel Lindgren; [2023]
    Nyckelord :Computer generated music; machine learning; musical instrument digital interfaces; ethics;

    Sammanfattning : This report details the creation of a new dataset named the Gunnlod dataset (after the Norse giantess who guarded the mead of poetry) for use in research in the field of machine learning as applied to music creation, particularly multi-modal music in the MIDI format of symbolic music representation. The dataset is based on a subset of approximately four fifths of the Lakh MIDI dataset. LÄS MER

  2. 2. A Study of Accumulation Times in Translation from Event Streams to Video for the Purpose of Lip Reading

    Kandidat-uppsats, KTH/Datavetenskap

    Författare :Didrik Munther; David Puustinen; [2022]
    Nyckelord :Lip-Reading; ANN; Event-based Cameras; Läppläsning; ANN; Eventbaserade kameror;

    Sammanfattning : Visually extracting textual context from lips consists of pattern matching which results in a frequent use of machine learning approaches for the task of classification. Previous research has consisted of mostly audiovisual (multi modal) approaches and conventional cameras. LÄS MER

  3. 3. Data Collection and Layout Analysis on Visually Rich Documents using Multi-Modular Deep Learning.

    Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Mattias Stahre; [2022]
    Nyckelord :DeepLearning; Machine Learning; Dataset Collection; Annotation; Labeling; Transformer Network; Multi-Modal; Computer Vision; Natural Language Processing; Embedding; LayoutLMv2; DocBank; Djupinlärning; Maskininlärning; Datasamling; Annotering; Märkning; Transformernätverk; Multi-modulär; Datorsyn; Naturlig Språkbehandling; Inbäddning; LayoutLMv2; DocBank;

    Sammanfattning : The use of Deep Learning methods for Document Understanding has been embraced by the research community in recent years. A requirement for Deep Learning methods and especially Transformer Networks, is access to large datasets. LÄS MER

  4. 4. Soundscape From an Audio- Visual Perspective : A study on how visual feedback affects our perception of a soundscape

    Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Josefine Hölling; [2021]
    Nyckelord :Audio-visual perception; Soundscape; Visualization; Sonic environment; Audio-reactive; Digital audio visualization.;

    Sammanfattning : The soundscape is a multi-sensory experience of an area. Previous research in the field has shown a positive correlation between designing with both audio and visual feedback for an increased perceived environmental pleasantness. LÄS MER

  5. 5. En pinne eller en stråke... det är frågan? : En intervju- och videoobservationsstudie av fiollärares syn på och arbete med stråkteknik

    Uppsats för yrkesexamina på avancerad nivå, Karlstads universitet/Institutionen för konstnärliga studier (from 2013)

    Författare :Emma-Teres Tjernström; [2019]
    Nyckelord :bowing technique; social semiotic; video observation; semi structured interview; multimodal interaction; stråkteknik; socialsemiotiskt perspektiv; videoobservation; semistrukturerade intervjuer; multi-modal analys;

    Sammanfattning : Syftet med studien är att undersöka fiollärares syn på och användning av stråkteknik i sin undervisning. Detta görs med följande forskningsfrågor: Hur representerar fiollärare sin syn på stråkteknik? och Hur designar fiollärare sin undervisning i stråkteknik? Studien är kvalitativ och data har samlats in genom semistrukturerade intervjuer med fyra olika fiollärare på musik- och kulturskolor. LÄS MER