Title
Semantic unification and searching of bioinformatics databases using data miningmethods: doctoral dissertation
Creator
Veljković, Aleksandar N., 1992-
CONOR:
114269961
Copyright date
2023
Object Links
Select license
Bez licence - direktna primena zakona
License description
Ako ne izaberete neku od licenci, vaše zaštićeno delo može biti korišćeno samo u okviru opštih ograničenja autorskih prava. Na taj način ne dozvoljavate komercijalno ni nekomercijalno korišćenje, naročito reprodukciju, distribuciju, emitovanje, dostupnost i obradu dela. Izbor Creative Commons (CC) licence promoviše diseminaciju vašeg dela. Za više informacija: http://creativecommons.org.rs/licence
Language
Serbian
Cobiss-ID
Theses Type
Doktorska disertacija
description
Datum odbrane: 26.03.2024.
Other responsibilities
Academic Expertise
Prirodno-matematičke nauke
Academic Title
-
University
Univerzitet u Beogradu
Faculty
Matematički fakultet
Alternative title
Semantic unification and searching of bioinformatics databases using data mining methods
Publisher
[A. Veljković]
Format
113 str.
description
Рачунарство - Истраживање података, Биоинформатика / Computer Science -Data mining, Bioinformatics
Abstract (sr)
Биоинформатика као наука будућности суочава се са проблемима
обраде велике количине података коjа се свакодневно увећава. Поред
проблема складиштења података, изазов представља и анализа података
и разумевање скривених веза између биолошких поjмова коjе се уочаваjу
тек након обjедињавања података из различитих извора. Ова дисертациjа
дефинише нови модел података за обjедињавање хетерогених података
из различитих биоинформатичких база података и дизаjн архитектуре
система за имплементациjу софтверског система заснованог на предложеном
моделу података. Додатно, дисертациjа дефинише аутоматизовани протокол
за откривање нових веза семантичке сличности заснованих на методама
истраживања података коришћењем података добиjених из дефинисаног
модела. Модел података, софтверска архитектура и аутоматизовани протокол
су тестирани над подацима из пет биоинформатичких база података. Резултати
показуjу високу флексибилност модела и високу ефикасност софтверског
система имплементираног према описаном дизаjну архитектуре.
Abstract (en)
ioinformatics as a science of the future faces the problems of process-
ing a large amount of data that is increasing every day. In addition to the problem
of data storage, the challenge is also data analysis and the understanding of hid-
den relations between biological entities that are observed only after unifying data
from different data sources. This thesis proposes a novel data model for the unifi-
cation of heterogeneous data from multiple bioinformatics databases and a system
architecture design for implementing software systems based on the proposed data
model. Additionally, the thesis defines an automated pipeline for discovering new
semantic similarity relations based on data mining methods using the data found
in the proposed data model. The data model, software architecture, and automatic
pipeline are evaluated using data from five real-world bioinformatics databases. The
results demonstrate a high flexibility of the data model and the high efficiency of
the software system implemented following the proposed architecture design.
Authors Key words
семантика, обjедињавање биоинформатичких база,
кластеровање, правила придруживања, граф знања
Authors Key words
semantics, bioinformatics database unification, clustering, association
rules, knowledge graph
Classification
004.6:004.233.3:57(043.3)
Type
Tekst
Abstract (sr)
Биоинформатика као наука будућности суочава се са проблемима
обраде велике количине података коjа се свакодневно увећава. Поред
проблема складиштења података, изазов представља и анализа података
и разумевање скривених веза између биолошких поjмова коjе се уочаваjу
тек након обjедињавања података из различитих извора. Ова дисертациjа
дефинише нови модел података за обjедињавање хетерогених података
из различитих биоинформатичких база података и дизаjн архитектуре
система за имплементациjу софтверског система заснованог на предложеном
моделу података. Додатно, дисертациjа дефинише аутоматизовани протокол
за откривање нових веза семантичке сличности заснованих на методама
истраживања података коришћењем података добиjених из дефинисаног
модела. Модел података, софтверска архитектура и аутоматизовани протокол
су тестирани над подацима из пет биоинформатичких база података. Резултати
показуjу високу флексибилност модела и високу ефикасност софтверског
система имплементираног према описаном дизаjну архитектуре.
“Data exchange” service offers individual users metadata transfer in several different formats. Citation formats are offered for transfers in texts as for the transfer into internet pages. Citation formats include permanent links that guarantee access to cited sources. For use are commonly structured metadata schemes : Dublin Core xml and ETUB-MS xml, local adaptation of international ETD-MS scheme intended for use in academic documents.
