Gripla

◄ Árgangur ►

◄ Tölublað ►

◄ Grein ►

Leiðbeiningar (PDF)

Gripla - 20.12.2012, Blaðsíða 353

351 Randall, Beth. 2005. CorpusSearch 2 Users Guide. Phila delphia: university of Pennsylvania.<http://corpussearch.sourceforge.net/CS-manual/Contents.html> santorini, Beatrice. 2010. Annotation manual for the Penn historical corpora and the PCEEC. Philadelphia: university of Pennsylvania. <http://www.ling.upenn. edu/hist-corpora/annotation/index.html> sapp, Christopher D. 2011. „A Relative Pronoun in old norse?“ erindi flutt á DiGs 13, university of Pennsylvania, Philadelphia, 5. júní. Wallenberg, joel, Anton karl Ingason, einar freyr sigurðsson og eiríkur Rögnvalds son. 2011. Icelandic Parsed Historical Corpus (IcePaHC). version 0.9. <http://www. linguist.is/icelandic_treebank> suMMARy The Icelandic Parsed Historical Corpus Keywords: treebank, parsing, historical corpus, diachronic syntax, language technology. the article describes the background for and construction of Icelandic Parsed His- torical Corpus, IcePaHC, a million word parsed historical corpus of Icelandic that has just been completed (Wallenberg et al. 2011). this corpus contains fragments of 60 texts ranging from the late twelfth century to the present day and serves the dual purpose of being both a cornerstone of Icelandic language technology and also an invaluable tool in Icelandic diachronic syntax research. the corpus is unusual in many ways. first, it was designed to serve as a tool for both language technology and syntactic research, and was developed by scholars with research experience in both diachronic syntax and computational linguistics. secondly, the corpus spans almost ten centuries – the oldest texts were written in the final decades of the twelfth century and the youngest are from the first decade of the present century. thirdly, the corpus contains over one million words and is thus among the largest of the parsed corpora that have been published for any language. fourthly, access to the corpus is completely open and free and thus re- quires no registration or paperwork, and the same is true for all the software used in its construction and also for other software developed within the project. In the present paper, we follow the Introduction by describing the background to the treebank, whose origins lie in three different projects. Several aspects of the material in the treebank are then discussed – the selection of texts, their quality, and their conversion to modern Icelandic spelling. We then explain our decision to build a Penn style treebank and we offer an overview of the annotation process. following a case study which shows how the treebank can be used to investigate SÖGULEGI ÍSLENSKI TRJÁBANKINN

Blaðsíða 1
Blaðsíða 2
Blaðsíða 3
Blaðsíða 4
Blaðsíða 5
Blaðsíða 6
Blaðsíða 7
Blaðsíða 8
Blaðsíða 9
Blaðsíða 10
Blaðsíða 11
Blaðsíða 12
Blaðsíða 13
Blaðsíða 14
Blaðsíða 15
Blaðsíða 16
Blaðsíða 17
Blaðsíða 18
Blaðsíða 19
Blaðsíða 20
Blaðsíða 21
Blaðsíða 22
Blaðsíða 23
Blaðsíða 24
Blaðsíða 25
Blaðsíða 26
Blaðsíða 27
Blaðsíða 28
Blaðsíða 29
Blaðsíða 30
Blaðsíða 31
Blaðsíða 32
Blaðsíða 33
Blaðsíða 34
Blaðsíða 35
Blaðsíða 36
Blaðsíða 37
Blaðsíða 38
Blaðsíða 39
Blaðsíða 40
Blaðsíða 41
Blaðsíða 42
Blaðsíða 43
Blaðsíða 44
Blaðsíða 45
Blaðsíða 46
Blaðsíða 47
Blaðsíða 48
Blaðsíða 49
Blaðsíða 50
Blaðsíða 51
Blaðsíða 52
Blaðsíða 53
Blaðsíða 54
Blaðsíða 55
Blaðsíða 56
Blaðsíða 57
Blaðsíða 58
Blaðsíða 59
Blaðsíða 60
Blaðsíða 61
Blaðsíða 62
Blaðsíða 63
Blaðsíða 64
Blaðsíða 65
Blaðsíða 66
Blaðsíða 67
Blaðsíða 68
Blaðsíða 69
Blaðsíða 70
Blaðsíða 71
Blaðsíða 72
Blaðsíða 73
Blaðsíða 74
Blaðsíða 75
Blaðsíða 76
Blaðsíða 77
Blaðsíða 78
Blaðsíða 79
Blaðsíða 80
Blaðsíða 81
Blaðsíða 82
Blaðsíða 83
Blaðsíða 84
Blaðsíða 85
Blaðsíða 86
Blaðsíða 87
Blaðsíða 88
Blaðsíða 89
Blaðsíða 90
Blaðsíða 91
Blaðsíða 92
Blaðsíða 93
Blaðsíða 94
Blaðsíða 95
Blaðsíða 96
Blaðsíða 97
Blaðsíða 98
Blaðsíða 99
Blaðsíða 100
Blaðsíða 101
Blaðsíða 102
Blaðsíða 103
Blaðsíða 104
Blaðsíða 105
Blaðsíða 106
Blaðsíða 107
Blaðsíða 108
Blaðsíða 109
Blaðsíða 110
Blaðsíða 111
Blaðsíða 112
Blaðsíða 113
Blaðsíða 114
Blaðsíða 115
Blaðsíða 116
Blaðsíða 117
Blaðsíða 118
Blaðsíða 119
Blaðsíða 120
Blaðsíða 121
Blaðsíða 122
Blaðsíða 123
Blaðsíða 124
Blaðsíða 125
Blaðsíða 126
Blaðsíða 127
Blaðsíða 128
Blaðsíða 129
Blaðsíða 130
Blaðsíða 131
Blaðsíða 132
Blaðsíða 133
Blaðsíða 134
Blaðsíða 135
Blaðsíða 136
Blaðsíða 137
Blaðsíða 138
Blaðsíða 139
Blaðsíða 140
Blaðsíða 141
Blaðsíða 142
Blaðsíða 143
Blaðsíða 144
Blaðsíða 145
Blaðsíða 146
Blaðsíða 147
Blaðsíða 148
Blaðsíða 149
Blaðsíða 150
Blaðsíða 151
Blaðsíða 152
Blaðsíða 153
Blaðsíða 154
Blaðsíða 155
Blaðsíða 156
Blaðsíða 157
Blaðsíða 158
Blaðsíða 159
Blaðsíða 160
Blaðsíða 161
Blaðsíða 162
Blaðsíða 163
Blaðsíða 164
Blaðsíða 165
Blaðsíða 166
Blaðsíða 167
Blaðsíða 168
Blaðsíða 169
Blaðsíða 170
Blaðsíða 171
Blaðsíða 172
Blaðsíða 173
Blaðsíða 174
Blaðsíða 175
Blaðsíða 176
Blaðsíða 177
Blaðsíða 178
Blaðsíða 179
Blaðsíða 180
Blaðsíða 181
Blaðsíða 182
Blaðsíða 183
Blaðsíða 184
Blaðsíða 185
Blaðsíða 186
Blaðsíða 187
Blaðsíða 188
Blaðsíða 189
Blaðsíða 190
Blaðsíða 191
Blaðsíða 192
Blaðsíða 193
Blaðsíða 194
Blaðsíða 195
Blaðsíða 196
Blaðsíða 197
Blaðsíða 198
Blaðsíða 199
Blaðsíða 200
Blaðsíða 201
Blaðsíða 202
Blaðsíða 203
Blaðsíða 204
Blaðsíða 205
Blaðsíða 206
Blaðsíða 207
Blaðsíða 208
Blaðsíða 209
Blaðsíða 210
Blaðsíða 211
Blaðsíða 212
Blaðsíða 213
Blaðsíða 214
Blaðsíða 215
Blaðsíða 216
Blaðsíða 217
Blaðsíða 218
Blaðsíða 219
Blaðsíða 220
Blaðsíða 221
Blaðsíða 222
Blaðsíða 223
Blaðsíða 224
Blaðsíða 225
Blaðsíða 226
Blaðsíða 227
Blaðsíða 228
Blaðsíða 229
Blaðsíða 230
Blaðsíða 231
Blaðsíða 232
Blaðsíða 233
Blaðsíða 234
Blaðsíða 235
Blaðsíða 236
Blaðsíða 237
Blaðsíða 238
Blaðsíða 239
Blaðsíða 240
Blaðsíða 241
Blaðsíða 242
Blaðsíða 243
Blaðsíða 244
Blaðsíða 245
Blaðsíða 246
Blaðsíða 247
Blaðsíða 248
Blaðsíða 249
Blaðsíða 250
Blaðsíða 251
Blaðsíða 252
Blaðsíða 253
Blaðsíða 254
Blaðsíða 255
Blaðsíða 256
Blaðsíða 257
Blaðsíða 258
Blaðsíða 259
Blaðsíða 260
Blaðsíða 261
Blaðsíða 262
Blaðsíða 263
Blaðsíða 264
Blaðsíða 265
Blaðsíða 266
Blaðsíða 267
Blaðsíða 268
Blaðsíða 269
Blaðsíða 270
Blaðsíða 271
Blaðsíða 272
Blaðsíða 273
Blaðsíða 274
Blaðsíða 275
Blaðsíða 276
Blaðsíða 277
Blaðsíða 278
Blaðsíða 279
Blaðsíða 280
Blaðsíða 281
Blaðsíða 282
Blaðsíða 283
Blaðsíða 284
Blaðsíða 285
Blaðsíða 286
Blaðsíða 287
Blaðsíða 288
Blaðsíða 289
Blaðsíða 290
Blaðsíða 291
Blaðsíða 292
Blaðsíða 293
Blaðsíða 294
Blaðsíða 295
Blaðsíða 296
Blaðsíða 297
Blaðsíða 298
Blaðsíða 299
Blaðsíða 300
Blaðsíða 301
Blaðsíða 302
Blaðsíða 303
Blaðsíða 304
Blaðsíða 305
Blaðsíða 306
Blaðsíða 307
Blaðsíða 308
Blaðsíða 309
Blaðsíða 310
Blaðsíða 311
Blaðsíða 312
Blaðsíða 313
Blaðsíða 314
Blaðsíða 315
Blaðsíða 316
Blaðsíða 317
Blaðsíða 318
Blaðsíða 319
Blaðsíða 320
Blaðsíða 321
Blaðsíða 322
Blaðsíða 323
Blaðsíða 324
Blaðsíða 325
Blaðsíða 326
Blaðsíða 327
Blaðsíða 328
Blaðsíða 329
Blaðsíða 330
Blaðsíða 331
Blaðsíða 332
Blaðsíða 333
Blaðsíða 334
Blaðsíða 335
Blaðsíða 336
Blaðsíða 337
Blaðsíða 338
Blaðsíða 339
Blaðsíða 340
Blaðsíða 341
Blaðsíða 342
Blaðsíða 343
Blaðsíða 344
Blaðsíða 345
Blaðsíða 346
Blaðsíða 347
Blaðsíða 348
Blaðsíða 349
Blaðsíða 350
Blaðsíða 351
Blaðsíða 352
Blaðsíða 353
Blaðsíða 354
Blaðsíða 355
Blaðsíða 356
Blaðsíða 357
Blaðsíða 358
Blaðsíða 359
Blaðsíða 360
Blaðsíða 361
Blaðsíða 362
Blaðsíða 363
Blaðsíða 364
Blaðsíða 365
Blaðsíða 366
Blaðsíða 367
Blaðsíða 368
Blaðsíða 369
Blaðsíða 370
Blaðsíða 371
Blaðsíða 372
Blaðsíða 373
Blaðsíða 374
Blaðsíða 375
Blaðsíða 376
Blaðsíða 377
Blaðsíða 378
Blaðsíða 379
Blaðsíða 380
Blaðsíða 381
Blaðsíða 382
Blaðsíða 383
Blaðsíða 384
Blaðsíða 385
Blaðsíða 386
Blaðsíða 387

Gripla

Gripla

Beinir tenglar