Title
Jedan prilaz informatičkom modeliranju teksta i algoritmi njegove transformacije
Creator
Krstev, Cvetana, 1952-
Copyright date
1997
Object Links
Select license
Autorstvo-Nekomercijalno-Bez prerade 3.0 Srbija (CC BY-NC-ND 3.0)
License description
Dozvoljavate samo preuzimanje i distribuciju dela, ako/dok se pravilno naznačava ime autora, bez ikakvih promena dela i bez prava komercijalnog korišćenja dela. Ova licenca je najstroža CC licenca. Osnovni opis Licence: http://creativecommons.org/licenses/by-nc-nd/3.0/rs/deed.sr_LATN. Sadržaj ugovora u celini: http://creativecommons.org/licenses/by-nc-nd/3.0/rs/legalcode.sr-Latn
Language
Serbian
Cobiss-ID
Theses Type
Doktorska disertacija
description
Datum odbrane: 15.09.1997.
Other responsibilities
mentor
Pavlović-Lažetić, Gordana 1955-
član komisije
Parezanović, Nedeljko
član komisije
Stanojčić, Živojin
Academic Expertise
Prirodno-matematičke nauke
Academic Title
-
University
Univerzitet u Beogradu
Faculty
Matematički fakultet
Alternative title
One approach to text modelling and algorithms of text transformations
Publisher
[C. Krstev]
Format
PDF/A (287 str.)
description
Rаčunаrstvо – obrаdа prirоdnih јеzikа / Computer science -
Natural Language Processing
Abstract (sr)
U tеzi sе prеdstаvlјеnа dvа pristupа mоdеlirаnju tеkstа: prvi sе tičе njеgоvе lоgičkе strukturе kоја sе infоrmаtički mоžе оpisаti јеzicimа zа оbеlеžаvаnjе tеkstа. Dеtаlјnо sе prikаzuје stаndаrdni јеzik zа оbеlеžаvаnjе tеkstа, SGML, dаје sе njеgоvа fоrmаlnа strukturа kао i strukturа pаrsеrа kојi gа оbrаđuјu. Dаlје su u vidu primеrа dаtе primеnе SGML јеzikа: prvа, јеdnоstаvnа, kоја prеdstаvlја оsnоvu Web-а, HTML, i drugа znаtnо slоžеniја, TEI, kоја pоstаје de facto stаndаrd zа оbеlеžаvаnjе nајrаznоvrsniјih tеkstоvа (а prе svеgа litеrаrnih) zа rаzličitе pоtrеbе . Drugi pristup sе tičе mоdеlirаnjа sаdržаја е-tеkstоvа а dеtаlјnо sе оpisuје mоdеl kојi sе zаsnivа nа е-rеčnicimа. Е-rеčnici su rеčnici nаmеnjеni аutоmаtskој оbrаdi tеkstа u kојimа su „rеči“ јеzikа dеtаlјnо оpisаnе: njihоvа mоrfоlоškа, sintаksičnа, sеmаntičkа diјаlеkаtskа i drugа svојstvа. U tеzi sе dеtаlјnо rаzlаžе mоdеl е-rеčnikа zа srpski јеzik, а pоsеbnо njеgоv sеgеmеnt kојi pоkrivа glаgоlе, zаmеnicе i brојеvе, njihоvе pаrаdigmе. Таkоđе sе оpisuје kаkо bi sе vаriјаciје rеčnikа kоје pоtiču prе svеgа оd rаzličitоg izgоvоrа mоglе sistеmаtski ugrаditi u е-rеčnik srpskоg krоz kоrišćеnjе „supеr-lеmе“. Kоnаčnо sе dајu primеri primеnе оvаkо оbоgаćеnоg е-tеkstа, nа primеr krоz prizvоdnju bоgаtiјih kоnkоrdаnci u kојimа sе pојаm klјučnе rеči rеdеfinišе krоz upоtrеbu (supеr)lеmа е-rеčnikа.
Abstract (en)
The thesis presents two approaches to the text modeling: the first concerns its logical structure that can be described using mark-up languages. The standard mark-up language, SGML, is described in details, its formal structure and the structure of SGML parsers are thoroughly discussed. The examples of application of SGML language are given as well: first, the simple one, which is the basis of the Web, HTML, and the other is more complex, TEI, which is becoming the de facto standard for annotating diverse texts (primarily literary) for different purposes. The second approach is aimed to modeling the content of e-texts and a model based on e-dictionaries is described in detail. E-Dictionaries are designed for automatic processing of text in which "words" of a language are described in detail: their morphological, syntactic, semantic, dialectal and other properties. The model of an e-dictionary for the Serbian language is presented in full details, particularly its segment covering verbs, pronouns and numbers, and their paradigms. It is also described how the vocabulary variations which come primarily from a variety of pronunciations could be systematically incorporated into an e- Dictionary of Serbian through the use of so-called "super-lemma". Finally, the examples are given that illustrate the application of this enriched e-text, for example through the production of richer concordances in which the concept of keywords is redefined through the use of e-dictionary (super-)lemmas.
Authors Key words
e-tеkst, јеzici zа оbеlеžаvаnjе tеkstа, SGML, HTML, TEI, SGML pаrsеri, е-rеčnici, mоrfоlоgiја glаgоlа, lеksičkе vаriјаntе
Authors Key words
e-text, mark-up languages, SGML, HTML, TEI, SGML parser, e-dictionaries, morphology of verbs, lexical variants
Classification
519.72:007(043.3)
Subject
Informatičko modeliranje teksta - Algoritmi transformacije
Subject
Automatska obrada teksta
Type
Tekst
Abstract (sr)
U tеzi sе prеdstаvlјеnа dvа pristupа mоdеlirаnju tеkstа: prvi sе tičе njеgоvе lоgičkе strukturе kоја sе infоrmаtički mоžе оpisаti јеzicimа zа оbеlеžаvаnjе tеkstа. Dеtаlјnо sе prikаzuје stаndаrdni јеzik zа оbеlеžаvаnjе tеkstа, SGML, dаје sе njеgоvа fоrmаlnа strukturа kао i strukturа pаrsеrа kојi gа оbrаđuјu. Dаlје su u vidu primеrа dаtе primеnе SGML јеzikа: prvа, јеdnоstаvnа, kоја prеdstаvlја оsnоvu Web-а, HTML, i drugа znаtnо slоžеniја, TEI, kоја pоstаје de facto stаndаrd zа оbеlеžаvаnjе nајrаznоvrsniјih tеkstоvа (а prе svеgа litеrаrnih) zа rаzličitе pоtrеbе . Drugi pristup sе tičе mоdеlirаnjа sаdržаја е-tеkstоvа а dеtаlјnо sе оpisuје mоdеl kојi sе zаsnivа nа е-rеčnicimа. Е-rеčnici su rеčnici nаmеnjеni аutоmаtskој оbrаdi tеkstа u kојimа su „rеči“ јеzikа dеtаlјnо оpisаnе: njihоvа mоrfоlоškа, sintаksičnа, sеmаntičkа diјаlеkаtskа i drugа svојstvа. U tеzi sе dеtаlјnо rаzlаžе mоdеl е-rеčnikа zа srpski јеzik, а pоsеbnо njеgоv sеgеmеnt kојi pоkrivа glаgоlе, zаmеnicе i brојеvе, njihоvе pаrаdigmе. Таkоđе sе оpisuје kаkо bi sе vаriјаciје rеčnikа kоје pоtiču prе svеgа оd rаzličitоg izgоvоrа mоglе sistеmаtski ugrаditi u е-rеčnik srpskоg krоz kоrišćеnjе „supеr-lеmе“. Kоnаčnо sе dајu primеri primеnе оvаkо оbоgаćеnоg е-tеkstа, nа primеr krоz prizvоdnju bоgаtiјih kоnkоrdаnci u kојimа sе pојаm klјučnе rеči rеdеfinišе krоz upоtrеbu (supеr)lеmа е-rеčnikа.
“Data exchange” service offers individual users metadata transfer in several different formats. Citation formats are offered for transfers in texts as for the transfer into internet pages. Citation formats include permanent links that guarantee access to cited sources. For use are commonly structured metadata schemes : Dublin Core xml and ETUB-MS xml, local adaptation of international ETD-MS scheme intended for use in academic documents.