Begränsningar för molekylärbiologisk data i databaser

Detta är en Kandidat-uppsats från Institutionen för datavetenskap

Sammanfattning: De senaste åren har molekylärbiologisk data växt explosionsartat. Ny teknik gör att information kan härledas ur data snabbare och mer än tidigare. Faktum är att det tillkommer så mycket ny data att de nya resultaten inte längre kan publiceras i artiklar. Dessa sekvenser av data finns istället bara åtkomliga i speciella databaser. Dessa databaser är tillgängliga för allmänheten dels genom att ladda ned dem eller att använda en Internet browser. Det har, för ett par år sedan, kommit en ny standard för att strukturera upp och lagra data på. Detta nya sätt är XML. Det har föreslagits att XML skall ersätta eller ta över delar av de databaser som finns då XML skall vara ett bättre sätt att strukturera upp och lagra molekylärbiologisk data. Det finns däremot inga forskningar som direkt har undersökt hur bra XML är jämte andra databaser när det gäller Molekylärbiologisk data. Detta arbete skall ge en närmare inblick i hur bra databaser och XML kan hantera representation och lagring av sekvensdata som DNA och proteiner, då data av den sorten innehåller väldigt mycket information och är svår att representera. Resultaten kommer att visa att XML inte är riktigt tillräckligt bra för att ersätta de äldre databaserna. Resultaten kommer dessutom också att visa att de äldre databaserna, även om de är de bästa för tillfället, inte är perfekta för ändamålet att lagra sekvensdata.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)