Eesti keeles: Tekstialgoritmid I
Inglise keeles: Text algorithms I
Kood: MTAT.03.165
Maht: 2 ap
Loengud ja praktikumid - Jaak Vilo - vilo at egeen.ee
Toimumine: 2003 kevadsemester
Kolmapäeviti, kell 14-16 ja praktikumid kell 16-18. Liivi tn. L206.
Eksam toimub esmaspäeval, 2. juunil kell 14:00 A405
Eksam on kirjalik, kestab 3 tundi
Eksamiküsimused
Osalenud üliõpilaste kommentaare kursusele.
Loeng: 18 t
Praktikum: 16 t
Iseseisev töö 46 t.
Eeldusaine: MTAT.03.003 "Algoritmid ja andmestruktuurid"
Kursuse käigus tutvustatakse sõnede täpse ja ligikaudse otsimise
algoritme, tekstide indekseerimise meetodeid, andmete pakkimise
meetodeid, andmetes mustrite tuvastamist, tekstide
kaevandamist ja tekstinfo otsinguid.
Hindamine toimub kolme komponendi järgi:
- Iganädalased praktikumid - osalemine ja ülesannete lahendamine
- Programmeerimistöö ja praktiline algoritmivõrdlus
- Eksam
Praktikumid - 30p - miinimum 50% kohaleolekut ja 50% lahendatud ülesandeid
Programmeerimistöö - 20p - (Teemad)
Eksam - 50p
Boonusülesanded - vastavalt välja pakutud punktide arvule
------------------------------
100+ p
Hindevahemikud nagu ette nähtud - % maksimum 100 punktst.
Loengute ja praktikumide ajad (2003 kevad)
- 12.2. Täpne otsimine - jõu-, KMP, BM meetodid
- 5.3. Täpne otsimine - Rabin-Karp, Shift-OR, Aho-Corasick
19.2. ja 26.2 loengut/praktikumi EI TOIMU
- 16.3. Regulaaravaldistega otsimine
19.3 ja 26.3. loengut/praksi EI TOIMU.
- 2.4. 2-D otsimine ja sõnede teisenduskaugus
- 9.4. Ligikaudne otsimine
- 16.4. Staatilistest tekstidest otsimine (sufiksipuud)
- 23.4. Pakkimismeetodid
30.4 loengut/praksi EI TOIMU (Volbriöö).
- 7.5. Information Retrieval, bioinformaatika jmt.
- Kodused projektid
- Information Retrieval
- PWM, HMM, SCFG
- 14.5. Pattern discovery
Loengukonspekt teemade järgi
Täpsustatud teemade loetelu ja loengukonspekt
18 t = 9 nädalat
Terminoloogia/sõnastik
- String
- Sõne, string
- Stringology
- Stringoloogia (huhhh...)
- Edit distance
- Teisenduskaugus
- Brute-force
- Jõumeetod
Kirjanduse loetelu:
- Gusfield, Dan: Algorithms on Strings, Trees, and Sequences
(Cambridge University Press, 1997)
- A. Aho: Algorithms for finding patterns in strings. In Handbook of
Theoretical Computer Science, Vol. A, Elsevier, 1990, 255-300.
- Cormen, T.H., Leiserson, C.E., Rivest, R.L. Introduction to
Algorithms (MIT Press 1990), Chapter 34 (String Matching).
- Pevzner, P.A. Computational Molecular Biology - An Algorithmic
Approach (MIT Press, 2000)
- Baldi, Pierre, and Brunak, Soren, Bioinformatics - the Machine
Learning Approach 2nd edition, (MIT Press, 2001)
- Durbin, R., Eddy, S., Krogh, A., Mitchison - Biological sequence
analysis - Probabilistic models of proteins and nucleic acids
(Cambridge University Press, 1998)
- Jorma Tarhio, Merkkijonomenetelmät (luentomoniste) ~ 1995
University of Helsinki
- Ricardo Baeza-Yates, Berthier Ribeiro-Neto:
Modern Information Retrieval, Addison Wesley
- jt.
Veebis kättesaadavaid materjale
Abiks materjalide kirjutamisel
© Jaak Vilo, 2003