Změny mezi verzí 36 a verzí 37 u NerDataset
- Časová značka:
- 29. 3. 2023 22:43:30 (před 16 měsíci)
Vysvětlivky:
- Nezměněno
- Přidáno
- Odstraněno
- Změněno
-
NerDataset
v36 v37 146 146 147 147 == Corpus == 148 149 148 The file [https://nlp.fi.muni.cz/projekty/ahisto/ner-dataset/corpus.vert.gz corpus.vert.gz] (1.3G compressed) contains [https://www.sketchengine.eu/my_keywords/vertical/ a vertical file] with the results of optical character recognition, named entity recognition, language identification, and lemmatization.[[BR]]See also [https://nlp.fi.muni.cz/projekty/ahisto/ner-dataset/corpus.schema the schema of the vertical file]. ''(Warning: The corpus is a work in progress and may change. Last modified: 2023-03-09)''[=#corpus.vert] 150 149 151 150 == Citing == 152 If you use our dataset in your work, please cite the following article: 153 154 TODO 155 156 If you use LaTeX, you can use the following BibTeX entry: 157 158 {{{ 159 TODO 160 }}} 151 An article describing our dataset is currently under review. Preprint is available [mailto:witiko@mail.muni.cz on request].