Sökning: "Apache Spark"
Visar resultat 6 - 10 av 49 uppsatser innehållade orden Apache Spark.
6. Scalable Algorithms in NonparametricComputational Statistics
Master-uppsats, Uppsala universitet/Statistik, AI och data scienceSammanfattning : Three problems in distributed computing and non-parametric computationalstatistics are explored to develop scalable distributed algorithms. The problemsare rigorous global optimization, trend detection in time series, and nonparametricdensity estimation with tree-based histograms. LÄS MER
7. A Real- time Log Correlation System for Security Information and Event Management
Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)Sammanfattning : The correlation of several events in a period of time is a necessity for a threat detection platform. In the case of multistep attacks (attacks characterized by a sequence of executed commands), it allows detecting the different steps one by one and correlating them to raise an alert. LÄS MER
8. Comparison of Popular Data Processing Systems
Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)Sammanfattning : Data processing is generally defined as the collection and transformation of data to extract meaningful information. Data processing involves a multitude of processes such as validation, sorting summarization, aggregation to name a few. LÄS MER
9. Project based multi-tenant managed RStudio on Kubernetes for Hopsworks
Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)Sammanfattning : In order to fully benefit from cloud computing, services are designed following the “multi-tenant” architectural model which is aimed at maximizing resource sharing among users. However, multi-tenancy introduces challenges of security, performance isolation, scaling and customization. LÄS MER
10. Jämförelser av MySQL och Apache Spark : För aggregering av smartmätardata i Big Data format för en webbapplikation
Kandidat-uppsats, Högskolan i Skövde/Institutionen för informationsteknologiSammanfattning : Smarta elmätare är ett område som genererar data i storleken Big Data. Dessa datamängder medför svårigheter att hanteras med traditionella databaslösningar som MySQL. Ett ramverk som uppstått för att lösa dessa svårigheter är Apache Spark som implementerar MapReduce-modellen för klustrade nätverk av datorer. LÄS MER