Sökning: "text extraction methods"

Visar resultat 1 - 5 av 56 uppsatser innehållade orden text extraction methods.

  1. 1. En undersökning av metoder förautomatiserad text ochparameterextraktion frånPDF-dokument med NaturalLanguage Processing

    M1-uppsats, KTH/Hälsoinformatik och logistik

    Författare :Alexander Värling; Emil Hultgren; [2024]
    Nyckelord :portable document format; faktura; digitalisering; IT-lösningar; optisk teckenigenkänning; textextraktion; naturlig språkbehandling; generative pre-trained transformer; portable document format; faktura; digitalisering; IT-lösningar; optisk teckenigenkänning; textextraktion; naturlig språkbehandling; generative pre-trained transformer;

    Sammanfattning : I dagens affärsmiljö strävar många organisationer efter att automatisera processen för att hämta information från fakturor. Målet är att göra hanteringen av stora mängder fakturor mer effektiv. Trots detta möter man utmaningar på grund av den varierande strukturen hos fakturor. LÄS MER

  2. 2. Exploring GPT models as biomedical knowledge bases : By evaluating prompt methods for extracting information from language models pre-trained on scientific articles

    Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Ebba Hellberg; [2023]
    Nyckelord :Language model; GPT; knowledge probing; information extraction; prompt methods; Språkmodell; GPT; kunskapsbas; informationsextraktion; prompt-metoder;

    Sammanfattning : Scientific findings recorded in literature help continuously guide scientific advancements, but manual approaches to accessing that knowledge are insufficient due to the sheer quantity of information and data available. Although pre-trained language models are being explored for their utility as knowledge bases and structured data repositories, there is a lack of research for this application in the biomedical domain. LÄS MER

  3. 3. Prisestimering på bostadsrätter : Implementering av OCR-metoder och Random Forest regression för datadriven värdering

    Uppsats för yrkesexamina på avancerad nivå, Uppsala universitet/Avdelningen för systemteknik

    Författare :Sofia Lövgren; Marcus Löthman; [2023]
    Nyckelord :OCR; Optical Character recognition; Random Forest regression; price estimation; housing cooperatives; machine learning; OCR; Optisk teckenigenkänning; Random Forest regression; Prisestimering; Bostadsrätter; Maskininlärning;

    Sammanfattning : This thesis explores the implementation of Optical Character Recognition (OCR) – based text extraction and random forest regression analysis for housing market valuation, specifically focusing on the impact of value factors, derived from OCR-extracted economic values from housing cooperatives’ annual reports. The objective is to perform price estimations using the Random Forest model to identify the key value factors that influence the estimation process and examine how the economic values from annual reports affect the sales price. LÄS MER

  4. 4. Graph Attention Networks for Link Prediction in Semantic Word Grouping

    Uppsats för yrkesexamina på avancerad nivå, Uppsala universitet/Avdelningen för beräkningsvetenskap

    Författare :Anton Gollbo; [2023]
    Nyckelord :;

    Sammanfattning : Manually extracting relevant information from extensive amounts of data can betime-consuming and labour-intensive. Automating this process can allow for a shift of focus toward analysis and utilization of the extracted information, rather than allocating time and resources to data collection and preparation. LÄS MER

  5. 5. Classification of invoices using a 2D NLP approach : A comparison between methods for invoice information extraction for the purpose of classification

    Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Linnéa Fredriksson; [2023]
    Nyckelord :Key-field extraction; Invoices; 2D NLP; Document Intelligence; Visually Rich Documents; LayoutLMv3; Nyckelfältsextraktion; Fakturor; 2-dimensionell naturligtspråkbehandling; LayoutLMv3;

    Sammanfattning : Many companies are handling a large number of invoices every year. To manually categorize them takes a lot of time and resources. For a model to automatically categorize invoices, the documents need to be properly read and processed by the model. LÄS MER