Title
Izgradnja referentnog korpusa savremenog srpskog jezika
Creator
Utvić, Miloš. 1976-
Copyright date
2013
Object Links
Select license
Autorstvo-Nekomercijalno-Bez prerade 3.0 Srbija (CC BY-NC-ND 3.0)
License description
Dozvoljavate samo preuzimanje i distribuciju dela, ako/dok se pravilno naznačava ime autora, bez ikakvih promena dela i bez prava komercijalnog korišćenja dela. Ova licenca je najstroža CC licenca. Osnovni opis Licence: http://creativecommons.org/licenses/by-nc-nd/3.0/rs/deed.sr_LATN. Sadržaj ugovora u celini: http://creativecommons.org/licenses/by-nc-nd/3.0/rs/legalcode.sr-Latn
Language
Serbian
Cobiss-ID
Theses Type
PhD thesis
description
Datum odbrane: 28.04.2014.
Other responsibilities
mentor
Krstev, Cvetana. 1952-
član komisije
Ćorić, Božo, 1945-
član komisije
Vitas, Duško, 1949-
član komisije
Pavlović-Lažetić, Gordana, 1955-
član komisije
Polovina, Vesna, 1953-
Academic Expertise
Društveno-humanističke nauke
University
Univerzitet u Beogradu
Faculty
Filološki fakultet
Alternative title
The ǂconstruction of reference corpus of contemporary Serbian
Publisher
[M. Utvić]
Format
PDF/A (417 listova)
description
Korpusna lingvistika / Corpus linguistics
Abstract (sr)
U prvom delu rada se razmatraju opˇsta pitanja koja se odnose na definiciju,
istorijat, parametre i klasifikaciju korpusa, kao i na korpusnu lingvistiku kao metodologiju
istraˇzivanja jezika. Posebna paˇznja je posve´cena pitanjima reprezentativnosti
i balansiranosti korpusa kao uzorka jezika. Takode je detaljno razmotren
i uticaj Interneta, odnosno veba, na kritiˇcko preispitivanje definicije korpusa. Kao
parametri korpusa, posebno su analizirani nosaˇc, domen i namena, obim (veliˇcina),
period, izvor/medijum, anotacija i viˇsejeziˇcnost. Na osnovu tih parametara su opisane
mogu´ce klasifikacije korpusa i posebno su izdvojeni nacionalni korpusi kao opˇsti,
referentni korpusi koji pretenduju da reprezentuju jezik jedne zemlje. Detaljno su
analizirani nacionalni korpusi slovenskih jezika. Poseban odeljak je posve´cen istorijatu
srpske korpusne lingvistike. Na kraju prvog dela rada su navedeni ciljevi
rada: razmatranje mogu´cnosti izgradnje opˇsteg korpusa srpskog jezika koji bi bio
elektronski, dinamiˇcki, sinhroni, balansiran, anotiran (morfoloˇski, strukturno, bibliografski),
kao i mogu´cnosti izgradnje prate´cih viˇsejeziˇcnih paralelnih korpusa u
kojima je srpski izvorni ili ciljni jezik...
Abstract (en)
The problem regarding the methods and tools to construct a corpus of
contemporary Serbian as a reference language resource is considered in this thesis.
The thesis consists of three parts.
General questions related to definition, history, parameters and classification of
corpora, as well as to corpus linguistics as a methodology in language research, are
considered in the first part of the thesis. The special attention is paid to questions
regarding representativeness and balance of corpus as a language sample. The affect
of Internet/Web on critical review of corpus definition is considered in detail,
too. Corpus parameters (storage medium, domain/purpose, size, time span, mode of
communication, annotation and multilinguality) are particularly analysed. Possible
classifications of corpora, based on these parameters, are described with emphasis
on national corpora as general reference corpora which are supposed to represent
the national language of a country. National corpora of Slavic languages are analysed
exhaustively. A special section is dedicated to the history of Serbian corpus
linguistics. The goals of thesis are listed in the end of the first part of the thesis: considering
possibilities for construction of general, electronic, dynamic, synchronous,
balanced, morphosyntactically and bibliographically-annotated corpus, as well as
the possibilities for construction of multilingual parallel corpora with Serbian as
source or target language...
Authors Key words
korpusna lingvistika, srpski jezik, raˇcunarska lingvistika, obrada
prirodnog jezika, morfosintaksiˇcka anotacija, referentni korpus
Authors Key words
corpus linguistics, Serbian, computational linguistics, natural language
processing, morphosyntactic annotation, reference corpus
Classification
811.163.41'322.2(043.3)
Subject
Srpski jezik
Type
Tekst
Abstract (sr)
U prvom delu rada se razmatraju opˇsta pitanja koja se odnose na definiciju,
istorijat, parametre i klasifikaciju korpusa, kao i na korpusnu lingvistiku kao metodologiju
istraˇzivanja jezika. Posebna paˇznja je posve´cena pitanjima reprezentativnosti
i balansiranosti korpusa kao uzorka jezika. Takode je detaljno razmotren
i uticaj Interneta, odnosno veba, na kritiˇcko preispitivanje definicije korpusa. Kao
parametri korpusa, posebno su analizirani nosaˇc, domen i namena, obim (veliˇcina),
period, izvor/medijum, anotacija i viˇsejeziˇcnost. Na osnovu tih parametara su opisane
mogu´ce klasifikacije korpusa i posebno su izdvojeni nacionalni korpusi kao opˇsti,
referentni korpusi koji pretenduju da reprezentuju jezik jedne zemlje. Detaljno su
analizirani nacionalni korpusi slovenskih jezika. Poseban odeljak je posve´cen istorijatu
srpske korpusne lingvistike. Na kraju prvog dela rada su navedeni ciljevi
rada: razmatranje mogu´cnosti izgradnje opˇsteg korpusa srpskog jezika koji bi bio
elektronski, dinamiˇcki, sinhroni, balansiran, anotiran (morfoloˇski, strukturno, bibliografski),
kao i mogu´cnosti izgradnje prate´cih viˇsejeziˇcnih paralelnih korpusa u
kojima je srpski izvorni ili ciljni jezik...
“Data exchange” service offers individual users metadata transfer in several different formats. Citation formats are offered for transfers in texts as for the transfer into internet pages. Citation formats include permanent links that guarantee access to cited sources. For use are commonly structured metadata schemes : Dublin Core xml and ETUB-MS xml, local adaptation of international ETD-MS scheme intended for use in academic documents.