Sarajevski korpus SMS poruka na bosanskom jeziku
Sarajevski korpus SMS poruka na bosanskom jeziku projekt je Centra za bosanski, hrvatski i srpski jezik Univerziteta u Sarajevu – Filozofskog fakulteta. Autori Korpusa su Halid Bulić (voditelj projekta), Elma Durmišević, Azra Hodžić-Čavkić, Enisa Bajraktarević, Azra Ahmetspahić-Peljto i Belmin Šabić. Rad na Korpusu trajao je od januara 2021. do jula 2023. godine.
Sarajevski korpus sadrži 10.000 autentičnih SMS poruka na bosanskom jeziku (samo su izostavljena imena radi anonimizacije). To je specijaliziran (dizajniran da posluži istraživanju jednog naročitog žanra) i statičan korpus (nije planiran njegov dalji rast) i nije korpus standardnog jezika. Obuhvaća poruke poslane od 2002. do 2022. godine i općenito se može smatrati sinhronijskim korpusom. Budući da su SMS poruke u ta dva desetljeća doživjele značajne promjene i razvoj, o kojima Sarajevski korpus može svjedočiti, on je i dijahronijski korpus.
Sve poruke uključene u ovaj korpus dobijene su od dobrovoljnih davalaca (informanata). Pošiljaoci i primaoci poruka koje su uključene u Sarajevski korpus SMS poruka na bosanskom jeziku isključivo su govornici bosanskog jezika, a veoma su raznovrsni po dobi, obrazovanju i zanimanju, mjestu porijekla i državama dugotrajnog boravka. Stoga je Korpus prilično reprezentativan, iako je u suštini sakupljen oportunistički.
Sarajevski korpus SMS poruka na bosanskom jeziku izvorno je objavljen kao elektronska knjiga, koju su recenzirali dr. Ismail Palić i dr. Mija Michelizza. (Uzorak knjige može se preuzeti ovdje.)
Sarajevski korpus SMS poruka na bosanskom jeziku izvorno je objavljen kao elektronska knjiga 2023. godine, a potom su podaci iz njega digitalizirani, prilagođeni modernim konkordanserima i alatima za pretragu i kao elektronski korpus postavljeni na repozitorij CLARIN.SI (Slovene Common Language Resources and Technology Infrastructure) 2024. godine.
Na 35. internacionalnom sarajevskom sajmu knjiga u aprilu 2024. godine Sarajevski korpus SMS poruka na bosanskom jeziku nagrađen je Priznanjem za e-izdavaštvo i nove tehnologije.
Profil Korpusa na repozitoriju CLARIN.SI dostupan je na: https://www.clarin.si/repository/xmlui/handle/11356/1913
Kako citirati?
Bulić, H., Durmišević, E., Hodžić-Čavkić, A., Bajraktarević, E., Ahmetspahić-Peljto, A., Šabić, B. (2023) Sarajevski korpus SMS poruka na bosanskom jeziku / The Sarajevo Corpus of SMS Messages in Bosnian. Sarajevo: Univerzitet u Sarajevu – Filozofski fakultet.
The Sarajevo Corpus of SMS Messages in Bosnian
The Sarajevo Corpus of SMS Messages in Bosnian is a project of the Center for Bosnian, Croatian and Serbian Languages of the University of Sarajevo – Faculty of Philosophy. The authors of the Corpus are Halid Bulić (project leader), Elma Durmišević, Azra Hodžić-Čavkić, Enisa Bajraktarević, Azra Ahmetspahić-Peljto and Belmin Šabić. Work on the Corpus spanned from January 2021 to July 2023.
The Sarajevo Corpus contains 10,000 authentic SMS messages in the Bosnian language (only the names have been omitted to ensure anonymity). It is a specialized (designed for researching a specific genre) and static corpus (no future growth is planned) and is not a standard language corpus. The messages cover the period from 2002 to 2022 and can generally be considered a synchronic corpus. Since SMS messages went through significant changes and development in those two decades, as evidenced by The Sarajevo Corpus, it can also be classified as a diachronic corpus.
All messages included in this Corpus were obtained from voluntary donors (informants). Both senders and recipients of the messages included in The Sarajevo Corpus of SMS Messages in Bosnian are Bosnian speakers, exhibiting diversity in terms of age, education and occupation, place of origin and countries of long-term residence. Therefore, The Corpus is quite representative, although it was essentially collected opportunistically.
The Sarajevo Corpus of SMS Messages in Bosnian was originally published as an electronic book, which was reviewed by Dr. Ismail Palić and Dr. Mia Michelizza. (Download the sample here.)
Cite as
Bulić, H., Durmišević, E., Hodžić-Čavkić, A., Bajraktarević, E., Ahmetspahić-Peljto, A., Šabić, B. (2023) Sarajevski korpus SMS poruka na bosanskom jeziku / The Sarajevo Corpus of SMS Messages in Bosnian. Sarajevo: University of Sarajevo – Faculty of Philosophy.