Frantext – francouzský korpus
Jana Subiková
Přístupný na:
http://www.atilf.fr → ressources linguistiques → informatisées → Frantext
Jen pro předplatitele (310 € pro společnost, 35 € pro jedince na rok)
Vznik
Produkt ATILFu (Analyse et Traitement Informatique de la Langue Française), r. 1992.
Poslední aktualizace 31.10.2002
Původně pro účely redaktorů článků pro Trésor de la langue française
Typ
rozsáhlý jednojazyčný psaný korpus (3737 textů)
diachronní (lit. próza z XVI-XX. století, z toho 1940 textů prózy z XIX. a XX. lematizovaných)
full-textový
otevřený
částečně lemmatizovaný a tangovaný
Obsah
3737 textů (210 mil. výskytů, asi mil. autorů) z oblasti věd, umění, literatury, techniky
80 % literatura krásná, 20 % technická z různých vědních oborů
22 textů ze středověku, 218 textů z XIV. a XV. století
Subkorpusy
Vlastní korpus Frantextu (3650 textů z XVI.-XX. st., 940 soudobých textů lemmatizováno)
Frantext technique (volně přístupný, obsahuje 1083 norm Asociation fr. de normalisation, neoznačkován)
Moyen français : Bases du Moyen Français (220 středověkých textů)
Části vlastního korpusu
2 verze:
Obsahující všechny databáze (3737 textů, přibližně 210 mil. výskytů, asi tisíc autorů)
Vlastní subkorpus (1940 prozaických děl z XIX. a XX. století, 127 výskytů, označkovaný)
Užití
Možnost zkoumání podle bibl. údajů (název, autor, rok, žánr)
Pomocí dotazů
Možnost vytvořit si vlastní soubor, gramatiku, slovník. Studium okolí jednoho slova, užití filtrů, zjištění frekvence, atd.
Pokrytí slovních druhů
|
SLOVNÍ DRUH |
LEMMATA / SLOVA |
|
Podst. jména |
42981 / 85552 |
|
Příd. jména |
15211 / 60498 |
|
Slovesa |
7387 / 376851 |
|
Příslovce |
1579 / 1579 |
|
Spojky a částice |
139 / 139 |
|
Vlastní jména |
41 |
|
Celkem (včetně poddruhů) |
176 |
Další užitečné volně přístupné nástroje Atilfu
Le Trésor de la Langue Française informatisé (mnohostranný slovník)
Morphalou (morfologický analyzátor)
Dictionnaire de l'Académie française (8. a 9. vydání)
BHVF : Base Historique du Vocabulaire Français (datace a dohledávání slov)
FÉMININ : Femme, j'écris ton nom... (tvoření feminin)
Lexikální databáze středověké fr., Guillauma de Machauta a Livre de deablerie
Borneo 1 a 2 (databáze neologismů)