Sökning: "Web data extraction"

Visar resultat 1 - 5 av 37 uppsatser innehållade orden Web data extraction.

  1. 1. The One Spider To Rule Them All : Web Scraping Simplified: Improving Analyst Productivity and Reducing Development Time with A Generalized Spider

    Kandidat-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Rikard Johansson; [2023]
    Nyckelord :Web scraping; Web crawlers; HTML; Scrapy; Optimization; Web data extraction; Webbskrapning; Webbsökrobotar; HTML; Scrapy; Optimering; Webbdataextraktion;

    Sammanfattning : This thesis addresses the process of developing a generalized spider for web scraping, which can be applied to multiple sources, thereby reducing the time and cost involved in creating and maintaining individual spiders for each website or URL. The project aims to improve analyst productivity, reduce development time for developers, and ensure high-quality and accurate data extraction. LÄS MER

  2. 2. Motor Imagery Signal Classification using Adversarial Learning - A Systematic Literature Review

    Master-uppsats, Stockholms universitet/Institutionen för data- och systemvetenskap

    Författare :Osama Mahmudi; Shubhra Mishra; [2023]
    Nyckelord :Adversarial Learning; Motor Imagery; BCI; EEG; Machine Learning;

    Sammanfattning : Context: Motor Imagery (MI) signal classification is a crucial task for developing Brain-Computer Interfaces (BCIs) that allow people to control devices using their thoughts. However, traditional machine learning approaches often suffer from limited performance due to inter-subject variability and limited data availability. LÄS MER

  3. 3. Uppgradering av inspelningslösning för strömmad video : Förbättring och utvärdering av videokvalitet för distansinspektion

    Kandidat-uppsats, Mittuniversitetet/Institutionen för data- och elektroteknik (2023-)

    Författare :Olof Manneby; [2023]
    Nyckelord :Video conference; open-source; structural similarity; bit rate; Videokonferens; öppen källkod; strukturella likheter; bithastighet;

    Sammanfattning : Projektet som beskrivs i denna rapport utgör modifieringen av videokonferensprogrammet Jitsi Meet, där öppen källkod tillåter anpassning av tjänsten för videoinspelning. Den mottagna videoströmmen som utgör samtalet mellan två deltagare skall sparas till disk, för att sedan möjliggöra för utredning och analys av sessionens videokvalitet. LÄS MER

  4. 4. A visual approach to web information extraction : Extracting information from e-commerce web pages using object detection

    Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Alexander Brokking; [2023]
    Nyckelord :Web information extraction; computer vision; object detection; deep learning; Informationsextraktion från webben; datorseende; objektigenkänning; djupinlärning;

    Sammanfattning : Internets enorma omfattning har resulterat i ett överflöd av information som är oorganiserad och spridd över olika hemsidor. Det har varit motivationen för automatisk informationsextraktion av hemsidor sedan internets begynnelse. LÄS MER

  5. 5. Generic Data Harvester

    Kandidat-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :William Asp; Johannes Valck; [2022]
    Nyckelord :News; Articles; Newspapers; Web crawler; Web site parsing; Optimization; Web robot; Web spider; Web data extraction; HTML; Scrapy; Nyheter; Artiklar; Tidningar; Sökrobot; Analys av hemsida; Optimering; Webbrobot; Webbspindel; Data extrahering hemsidor; HTML; Scrapy;

    Sammanfattning : This report goes through the process of developing a generic article scraper which shall extract relevant information from an arbitrary web article. The extraction is implemented by searching and examining the HTML of the article, by using Python and XPath. LÄS MER