Sökning: "Apache Spark"

Visar resultat 6 - 10 av 49 uppsatser innehållade orden Apache Spark.

  1. 6. Scalable Algorithms in NonparametricComputational Statistics

    Master-uppsats, Uppsala universitet/Statistik, AI och data science

    Författare :Johannes Graner; [2022]
    Nyckelord :;

    Sammanfattning : Three problems in distributed computing and non-parametric computationalstatistics are explored to develop scalable distributed algorithms. The problemsare rigorous global optimization, trend detection in time series, and nonparametricdensity estimation with tree-based histograms. LÄS MER

  2. 7. A Real- time Log Correlation System for Security Information and Event Management

    Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Clémence Dubuc; [2021]
    Nyckelord :Correlation; SIEM; Security Logs; Apache Spark; Elastic Search; Korrelation; SIEM; Säkerhetsloggar; Apache Spark; Elastic Search;

    Sammanfattning : The correlation of several events in a period of time is a necessity for a threat detection platform. In the case of multistep attacks (attacks characterized by a sequence of executed commands), it allows detecting the different steps one by one and correlating them to raise an alert. LÄS MER

  3. 8. Comparison of Popular Data Processing Systems

    Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Kamil Nasr; [2021]
    Nyckelord :Apache Spark; Apache Flink; Apache Beam; Spark Runner; Flink Runner; Direct Runner; Big Data Analytics; Data Processing Systems; Benchmarking; Kaggle;

    Sammanfattning : Data processing is generally defined as the collection and transformation of data to extract meaningful information. Data processing involves a multitude of processes such as validation, sorting summarization, aggregation to name a few. LÄS MER

  4. 9. Project based multi-tenant managed RStudio on Kubernetes for Hopsworks

    Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Gibson Chikafa; [2021]
    Nyckelord :Multi-tenancy; Cloud computing; Performance isolation; Security; Scaling; Docker; Kubernetes; Azure; GCP; Multitenans; Molntjänster; Prestandaisolering; Säkerhet; Skalning; Docker; Kubernetes; Azure; GCP;

    Sammanfattning : In order to fully benefit from cloud computing, services are designed following the “multi-tenant” architectural model which is aimed at maximizing resource sharing among users. However, multi-tenancy introduces challenges of security, performance isolation, scaling and customization. LÄS MER

  5. 10. Jämförelser av MySQL och Apache Spark : För aggregering av smartmätardata i Big Data format för en webbapplikation

    Kandidat-uppsats, Högskolan i Skövde/Institutionen för informationsteknologi

    Författare :Robin Danielsson; [2020]
    Nyckelord :Big Data; Apache Spark; MySQL; JSON; Webbapplikationer;

    Sammanfattning : Smarta elmätare är ett område som genererar data i storleken Big Data. Dessa datamängder medför svårigheter att hanteras med traditionella databaslösningar som MySQL. Ett ramverk som uppstått för att lösa dessa svårigheter är Apache Spark som implementerar MapReduce-modellen för klustrade nätverk av datorer. LÄS MER