Opisy przedmiotów
WSTĘP DO JĘZYKOZNAWSTWA KOMPUTEROWEGO
- PROS
- III rok, semestr zimowy i letni: 2 godz./tyg., razem 60 godzin
- prof. dr hab. Krzysztof BOGACKI
- Zakład Językoznawstwa Romańskiego
Program nauczania:
Kurs wprowadzający w wybrane zagadnienia językoznawstwa komputerowego. Pierwsza jego część poświęcona jest wprowadzeniu do systemu operacyjnego Linux, część druga prezentuje platformę NooJ oraz niektóre elementy platform INTEX i UNITEX, część trzecia wprowadza wybrane zagadnienia rozpatrywane w językoznawstwie komputerowym.
1. Wprowadzenie do Linuxa obejmuje:
Komendy służące do uzyskiwania pomocy, informacje o systemie, podstawowe operacje, zarządzanie plikami, przeglądanie i edycja plików, odnajdywanie plików, odnajdowanie motywów w pliku tekstowym, podstawy X-window, aplikacje sieciowe, (de)kompresja plików, zarządzanie procesami, podstawowe polecenia administracyjne, instalacja programów, dostęp do napędów/partycji.
2. Platforma NooJ/INTEX/UNITEX
Architektura systemu. Słowniki elektroniczne i ich typy. Co to są FST ? Priorytety w analizie lingwistycznej tekstów. Konkordancje.
3. Panorama tematów NLP.
Badania korpusowe. Typy korpusów i sposoby ich przeszukiwania.
Tłumaczenie automatyczne: krótka historia, typy programów. Architektura programów Systran.
Programy streszczające: SumUm.
Metody i formy oceny:
1. rozwiązanie testu praktycznego opanowania podstawowych komend Linuxa
2. opracowanie fragmentu słownika elektronicznego compositów dla platformy NooJ (plik źródłowy i jego kompilacja)
3. ocena krótkiej prezentacji dot. wybranego i przygotowanego w domu tematu z zakresu NLP
4. Opracowanie i prezentacja w formie grafu gramatyki lokalnej wybranego zjawiska gramatycznego
Efekty kształcenia:
1. Podstawowa umiejętność pracy w środowisku Linux
2. Umiejętność posługiwania się omówionymi na zajęciach programami służącymi do obróbki tekstu.
3. Umiejętność tworzenia słowników dwujęzycznych w systemie NooJ
4. Umiejętność opisania prostych zjawisk gramatycznych typowych dla języka polskiego i francuskiego w systemie Unitex/Intex za pomocą grafów.
5. Umiejętność tworzenia gramatyk lokalnych opisujących rekcję w języku polskim i francuskim w systemie NooJ.
Bibliografia:
Derwojedowa, M., Rudolf, M., Świdziński, M.: "Dehomonimizacja i desynkretyzacja w procesie automatycznego przetwarzania wielkich korpusów tekstów polskich". [W:] Biuletyn Polskiego Towarzystwa Językoznawczego LVIII, Warszawa 2002. 187-199.
Jurafsky D., Martin J. (2000). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Upper Saddle River: Prentice Hall.
Kennedy, G. (1998). An Introduction to Corpus Linguistics. London: Addison Wesley Longman.
Laver, J. and Dry, H. (1998). Using Computers in Linguistics. London: Routlege.
Frédéric Pascal - Petit Manuel d'utilisation de LINUX, Université Paris-Sud
version 04.2 : septembre 2004
Mitkov, R. (2003). The Oxford Handbook of Computational Linguistics. Oxford: OUP.
Sinclair, J. (1991). Corpus, Concordance, Collocation. Oxford: OUP.
http://www.math.u-psud.fr/~pascal/linux4-1/linux4-1.pdf
http://www.nothing2hide.net/fr/unixlinux/ubuntu-pocket-guide-manuale-di-linux-ubuntu-gratis/
Opisy przedmiotów:
Program studiów oraz opisy przedmiotów dotyczą zarówno studiów wieczorowych, jak i dziennych |
|
---|---|
Pokaż wszystkie | |
Pokaż tylko zakład: |
Zakład Dydaktyki i Metodyki Języków Romańskich Zakład Językoznawstwa Romańskiego Zakład Literaturoznawstwa Francuskiego |
Pokaż rok: | I, II, III, IV, V |
Przedmioty: | EKO, FIL, GK, GO, GO-FON, HF, HLF, JH, LEKT-DJ, LIC, ŁAC, MAG, MBJ, MBL, MET, MONO, NPJ, NPL, PED, PNJF, PNJF-ATL, PNJF-LABO, PP, PROS, PSY, PU, SOC, TEM, TLD, TnF, TnP, TP, UF, WF, WJ, WL, WoKF, ZHJ |