Podrobné pokyny k volbě tématu programátorského úkolu do IB030

Doporučené knihovny

Příklady úkolů pro inspiraci

U všech témat je důležité si rozmyslet na jaké konkrétní datové sadě proběhne vyhodnocení úspěšnosti vlastního řešení.

Rady a tipy

  1. Morfologický analyzátor majka můžete instalovat a spustit lokálně (s menším slovníkem), nebo spouštět na strojích NLPC.
    Parametry zjistíte pomocí přepínače -h:
        /nlp/projekty/ajka/bin/majka -h
    Například pro generování všech tvarů slova můžete použít
        /nlp/projekty/ajka/bin/majka -f /nlp/projekty/ajka/lib/majka.l-wt
  2. Morfologický analyzátor majka má k dispozici Python wrapper: https://github.com/petrpulc/python-majka
  3. Při využití balíčku chatterbot, můžete použít tento tutoriál:
    https://hackernoon.com/using-flask-to-build-a-rule-based-chatbot-in-python.
    Korpus konverzací nepoužívejte, místo něj využijte ListTrainer
    https://chatterbot.readthedocs.io/en/stable/tutorial.html
        trainer = ListTrainer(chatbot)
        trainer.train([
          'How are you?',
          'I am good.',
          'That is good to hear.',
          'Thank you',
          'You are welcome.',
        ])
    Kdyby se nedařilo instalovat současnou verzi, verze 1.0.4 by měla fungovat dobře.
  4. Pro datové zdroje nebo programy k porovnání můžete využít repozitář LINDAT/CLARIAH (https://lindat.cz/cs).
  5. Různé problémy, na které můžete narazit při zpracovávání češtiny, řeší API na Language Services.
    https://nlp.fi.muni.cz/projekty/languageservices/
    Klidně API použijte nebo kontaktujte vyučující, abyste se dostali rovnou ke skriptům.
  6. Při programování pro Peppera vám pomůžou stránky
    https://nlp.fi.muni.cz/projekty/pepper/




Zpět na stránku předmětu.