Orð og tunga - 01.06.2013, Page 58
48
Orð og tunga
5 Efniviður islex
islex er meðalstór orðabók að því er varðar fjölda uppflettiorða, með
tæplega 50.000 orð. Til samanburðar er fjöldi uppflettiorða í Islenskri
orðabók (4. útg. 2007) um 94.000, en sú bók telst vera fremur stór. í
gagnagrunni islex eru fólgin margvísleg gögn sem öll eru nákvæm-
lega skilgreind. Mynd 3 er e.k. flæðirit sem sýnir helstu þætti sem
snerta verkefnið.
Mynd 3. Skipan ISLEX-orðabókarinnar. Gagnagrunnurinn er táknaður með stóra sívaln-
ingnum. Fyrir ofan hann er reitur með flettu og orðflokki, sem gegna veigamiklu hlutverki í
gagnagrunninum. Til vinstri eru mikilvæg gagnasöfn, textasöfnin og beygingar orða. Hægra
megin eru reitir með helstu gagnaeiningum í ISLEX, og lengst til hægri eru markmálin,
danska, norska, sænska ogfæreyska. Neðan við ISLEX eru töflur sem geyma upplýsingar um
notendur, og stillingar á hegðun og útliti gagnategunda.
A þeim tíma sem liðinn er frá því að vinna hófst við islex hafa safnast
saman miklar upplýsingar í gagnagrunninn, bæði um íslenska orða-
forðann og markmálin fimm. Afar mikill efniviður er fólginn inni í
sjálfum flettugreinunum, þ.e. því efni sem birt er undir hverri ein-
stakri flettu. Allt efnið byggist á kerfislega flokkuðum upplýsingum
("tegundum"), jafnt íslenski hlutinn og markmálin, og eru t.d. notkun-
ardæmi ein slík tegund og millivísun önnur tegund. Einingarnar hafa
sérstakt heiti eftir því hlutverki sem þær gegna í orðabókinni. Alls
eru skilgreindar um 80 tegundir gagna, þar af er um helmingurinn