Datafiltrering : En jämförelse mellan två olika AWS-arkitekturer

Detta är en Kandidat-uppsats från KTH/Skolan för elektroteknik och datavetenskap (EECS)

Författare: Nikita Heinonen; [2022]

Nyckelord: AWS; filtering; lambda; s3; glue; athena; parquet; AWS; filtrering; lambda; s3; glue; athena;

Sammanfattning: Arbetet bygger på förbättring av befintlig arkitektur för en tjänst som beräknar koldioxidutsläpp för molntjänster. Nuvarande arkitektur bygger på att samla ihop och klumpa stora mängder data i form av användarrapporter. Därefter körs frågor mot det data för att få ut relevant information. Detta kan ta väldigt lång tid. För att försöka påskynda denna process görs en undersökning om man kan minska tiden som går åt att köra frågor mot data om datamängden blir mindre. Detta uppnås genom att filtrera bort oönskad data ur mängden innan man kör frågor mot det. Vidare undersöks om den nya arkitekturen kan möjliggöra för enklare implementation av nya funktioner till tjänsten. Metoden för undersökningen var att bygga en alternativ arkitektur med hjälp av AWS och dess tjänster. Resultaten visar på att även om mängden data som skannas är nästan oförändrat så minskas körtiden avsevärt när den totala storleken på datamängden minskar. Vidare bidrar den nya arkitekturen till enklare implementation av nya tjänster än tidigare.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)