Uniwersytet Warszawski » Wydział Neofilologii » Instytut Romanistyki

Opisy przedmiotów

WSTĘP DO JĘZYKOZNAWSTWA KOMPUTEROWEGO

Program nauczania:

Kurs wprowadzający w wybrane zagadnienia językoznawstwa komputerowego. Pierwsza jego część poświęcona jest wprowadzeniu do systemu operacyjnego Linux, część druga prezentuje platformę NooJ oraz niektóre elementy platform INTEX i UNITEX, część trzecia wprowadza wybrane zagadnienia rozpatrywane w językoznawstwie komputerowym.

1. Wprowadzenie do Linuxa obejmuje:

Komendy służące do uzyskiwania pomocy, informacje o systemie, podstawowe operacje, zarządzanie plikami, przeglądanie i edycja plików, odnajdywanie plików, odnajdowanie motywów w pliku tekstowym, podstawy X-window, aplikacje sieciowe, (de)kompresja plików, zarządzanie procesami, podstawowe polecenia administracyjne, instalacja programów, dostęp do napędów/partycji.

2. Platforma NooJ/INTEX/UNITEX

Architektura systemu. Słowniki elektroniczne i ich typy. Co to są FST ? Priorytety w analizie lingwistycznej tekstów. Konkordancje.

3. Panorama tematów NLP.

Badania korpusowe. Typy korpusów i sposoby ich przeszukiwania.

Tłumaczenie automatyczne: krótka historia, typy programów. Architektura programów Systran.

Programy streszczające: SumUm.

Metody i formy oceny:

1. rozwiązanie testu praktycznego opanowania podstawowych komend Linuxa

2. opracowanie fragmentu słownika elektronicznego compositów dla platformy NooJ (plik źródłowy i jego kompilacja)

3. ocena krótkiej prezentacji dot. wybranego i przygotowanego w domu tematu z zakresu NLP

4. Opracowanie i prezentacja w formie grafu gramatyki lokalnej wybranego zjawiska gramatycznego

Efekty kształcenia:

1. Podstawowa umiejętność pracy w środowisku Linux

2. Umiejętność posługiwania się omówionymi na zajęciach programami służącymi do obróbki tekstu.

3. Umiejętność tworzenia słowników dwujęzycznych w systemie NooJ

4. Umiejętność opisania prostych zjawisk gramatycznych typowych dla języka polskiego i francuskiego w systemie Unitex/Intex za pomocą grafów.

5. Umiejętność tworzenia gramatyk lokalnych opisujących rekcję w języku polskim i francuskim w systemie NooJ.

 

Bibliografia:

Derwojedowa, M., Rudolf, M., Świdziński, M.: "Dehomonimizacja i desynkretyzacja w procesie automatycznego przetwarzania wielkich korpusów tekstów polskich". [W:] Biuletyn Polskiego Towarzystwa Językoznawczego LVIII, Warszawa 2002. 187-199.

Jurafsky D., Martin J. (2000). Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Upper Saddle River: Prentice Hall.

Kennedy, G. (1998). An Introduction to Corpus Linguistics. London: Addison Wesley Longman.

Laver, J. and Dry, H. (1998). Using Computers in Linguistics. London: Routlege.

Frédéric Pascal - Petit Manuel d'utilisation de LINUX, Université Paris-Sud

version 04.2 : septembre 2004

Mitkov, R. (2003). The Oxford Handbook of Computational Linguistics. Oxford: OUP.

Sinclair, J. (1991). Corpus, Concordance, Collocation. Oxford: OUP.

http://www.math.u-psud.fr/~pascal/linux4-1/linux4-1.pdf

http://www.nothing2hide.net/fr/unixlinux/ubuntu-pocket-guide-manuale-di-linux-ubuntu-gratis/



Opisy przedmiotów:
Program studiów oraz opisy przedmiotów dotyczą zarówno studiów wieczorowych, jak i dziennych
Pokaż wszystkie
Pokaż tylko zakład: Zakład Dydaktyki i Metodyki Języków Romańskich
Zakład Językoznawstwa Romańskiego
Zakład Literaturoznawstwa Francuskiego
Pokaż rok: I, II, III, IV, V
Przedmioty: EKO, FIL, GK, GO, GO-FON, HF, HLF, JH, LEKT-DJ, LIC, ŁAC, MAG, MBJ, MBL, MET, MONO, NPJ, NPL, PED, PNJF, PNJF-ATL, PNJF-LABO, PP, PROS, PSY, PU, SOC, TEM, TLD, TnF, TnP, TP, UF, WF, WJ, WL, WoKF, ZHJ