Itv0060 2007 arhiiv
Sisukord
NB! Tegu on 2007 aasta kevadsemestri arhiiviga, mitte hetkel loetava kursusega!
Ainekood: ITV0060
Link: http://www.lambda.ee/index.php/Teadmiste_otsing,_formaliseerimine_ja_hoidmine ehk http://www.lambda.ee/index/itv0060
Lektor: Tanel Tammet
Kontakt: tammet@staff.ttu.ee, 6203457, TTÜ AK223
Kursuse materjalid eelmisest aastast leiad siit ja veel varasemad leiad siit.
Eksam
Järeleksam toimub neljapäeval 30 augustil ruumis VI-224 kell 10-13. Eksamile pääsemiseks on hiljemalt 29 augustil vaja registreerida ennast instituudi sekretäri Varje Vainu juures arvutuskeskus hoones ruumis 224.
Eksam toimus 23. mail kell 10.00.
Eksami teemad ja materjalid:
- RDF RDF õpik, ühe rdf tutoriali lisa: tabelid ja loogika, XML süntaksit ei pea peast teadma, peamised põhimõtted peaks olema selged
- RDFa: Media:portaalidekoosvoime.ppt, http://www.w3.org/TR/xhtml-rdfa-primer/ või uuem http://www.w3.org/2006/07/SWD/RDFa/primer/
- Microformats: mis asi on, detaile ei pea mäletama, vt http://www.microformats.org
- Järelduste tegemine resolutsioonimeetodi näitel: http://wwwhomes.doc.ic.ac.uk/~sgc/teaching/v231/lecture8.html ja http://wwwhomes.doc.ic.ac.uk/~sgc/teaching/v231/lecture9.html, lisaks võib lugeda (ei ole otse kohustuslik) http://www.cs.miami.edu/~geoff/Courses/CS63S-05M/CS63SNotes.pdf
- SCL kiirülevaade: mis asi on. Vt http://www.ihmc.us/users/phayes/SCL_for_Harry.ppt
- Praktikumiülesande sisu oskamine: lihtsa andmebaasi-tüüpi teadmiste info kodeerimine RDFa-s ja mõne mõtestatud reegli lisamine: ise formaliseerida reeglid ja faktid, mis eksamil ette antakse.
- Freimiprobleem: kus tekib ja miks, mõni näide (kasvõi blocks worldi näitel). Blocks worldi ja freimiprobleemi näide otsi ise (abiks: Hayes ja McCarthy)
- Default loogika näited.
- Stringiotsingu klassikaline algoritm: Boyer Moore.
- Stringide indekseerimine otsingu jaoks.
- Termide indekseerimine.
- Kuidas kodeerida ja kasutada infot selle kohta, et keegi teab midagi.
Aeg, koht, tulemus
Semester: kevad
Tulemus: eksam
Punkte: 3.5
Loengud: Igal kolmapäeval kell 10.00-11.30 arvutuskeskuse ruumis IT-140.
Harjutused: igal kolmapäeval paaritutel nädalatel kell 12.00-13.30
Paaritud nädalad algavad: 1 veebruar, 12 veebruar, 26 veebruar jne
Praktikumid annavad hinde aluseks olevatest punktidest kumbki 1/3, eksam samuti 1/3.
Kursuse eesmärk ja lühikokkuvõte
Kursuse fookus on loogikareeglitega seostatud andmebaaside ja semantilise webi tehnoloogiatel. Teemad:
- andmebaaside ja loogika seos
- rdf(s), owl jms semantilise veebi keeled, nende seos xml-i ja html-ga
- erinevate mittestandardsete loogikasüsteemide kasutamine
- konkreetsed, praktiliseks kasutuseks mõeldud reeglikeeled ja -mootorid
Kursuses toodavad probleemid, lahendusvariandid, süsteemid jms baseeruvad kahel konkreetsel valdkonnal:
- infovahetus robotiparvedes.
- andmete lugemine, automaatne täiendamine, päringud annoteeritud veebilehtedelt
Praktikumiülesanded
Praktilisi töid on kaks. Eksamile lubatakse ainult neid tudengeid, kes on mõlemad tööd realiseerinud. Hilinemine vähendab töö väärtust eksamil poole võrra. Töid võtab juhendaja vastu praktikumiaegadel AK arvutiklassis: need tuleb töötavana ette näidata, ning veidi selgitada lähtekoodi.
Töid võib teha kas üksi või kaheinimeselistes gruppides.
Esimene praktiline töö
Tähtaeg: 14 märts. Soovitav teha varem.
Töö sisuks on realiseerida süsteem, mis suudab lugeda sisse RDFa standardi põhiosade järgi annoteeritud html-i ja teisendada seda rdf kolmikuteks. Näitelehtede tegemine on ülesande üks osa: selleks tuleb valida vähemalt kolm erinevat reaalset veebilehte ja need (vähemalt osaliselt) ära annoteerida. Rdf kolmikute süntaks on csv.
Loe:
- Media:portaalidekoosvoime.ppt või pdf kujul Media:portaalidekoosvoime.pdf
- http://www.w3.org/TR/xhtml-rdfa-primer/ või uuem http://www.w3.org/2006/07/SWD/RDFa/primer/
- http://www.w3.org/2006/07/SWD/RDFa/syntax/
Teine praktiline töö
Teise praktilise töö sisuks on esimesele praktilisele tööle täiendavalt reeegli- ja päringusüsteemi ehitamine. Detailid ilmuvad veebruari lõpuks.
Loe siit: Teadmiste teine praktiline töö
Loengud
- 1. Loeng. Sissejuhatus ja ülevaade. RDFa ja sissejuhatus esimesse praktikumiülesandesse.
- Aeg: 7. veebruar.
- Loe
- 2. Loeng. Hariliku relatsioonilise baasi semantika.
- Aeg: 14. veebruar.
- Info harilikus relatsioonilises andmebaasis ja selle "harilik" tähendus
- Relatsioonilises andmebaasis oleva info "harilik" tähendus loogika mõttes.
- Keerukama info (disjunktsioonid, eitus, valemid) hoidmise viise relatsioonilises andmebaasis.
- 3. Loeng. Andmete lugemine ja seostamine annoteeritud veebilehtedelt.
- Aeg: 22. veebruar.
- microformats ja nende sarnasused/erisused rdfa-ga
- loe: http://www.microformats.org
- 4. Loeng. Esimest järku loogika kasutamine päringumootorites
- resolutsioonimeetod kui põhialus
- Aeg: 29. veebruar.
- Sissejuhatus: http://www.cs.miami.edu/~geoff/Courses/CS63S-05M/CS63SNotes.pdf
- Alternatiivne sissejuhatus: Simon Coltoni kursuse materjalid http://wwwhomes.doc.ic.ac.uk/~sgc/teaching/v231/
- 5. Loeng. Erinevad 1st järku loogika süntaksid ja täiendused
- KIF, CL, restricted english jms.
- KIF
- CL üldlehekülg, SCL vana presekas, kontekst ja ajalooline taust
- CG
- Draftid: ECL ja ELM
- 6. Loeng. Reeglimootorid, teisendajad, vahetükid andmebaasidele.
- Alustame teise praktikumiülesandega.
- Jätkame teise praktikumiülesandega.
- RDFS, OWL ja nende teisendus 1st järku loogikasse
- keerukamad detailid.
X. Mitu loengut: roboti baasnäide, selle juures vajalikud andmed, reeglid, teisendused, keeled jne. X. Mitu loengut: reegleid kasutavate ja xml-rdf andmebaaside tehnoloogia küsimused.
- 8. Materjale täisteksti indeksite kohta
- Taust: stringiotsing: Boyer-Moore, vt http://en.wikipedia.org/wiki/Boyer-Moore
- Täistektsi otsingumeetodid pikemalt: http://www.lambda.ee/index.php/Pilt:Stringsearch2.ppt
- Täisteksti-indeksid: http://www.lambda.ee/index.php/Pilt:Fulltext_indexes.ppt
- Pikem presentatsioon erienvate indeksimeetodite kohta: http://www.lambda.ee/index.php/Pilt:String_Indexing.ppt
- 9. Materjale termide indekseerimise kohta
- Sissejuhatus http://www.lambda.ee/index.php/Pilt:Schulz_indexing_overview.pdf
- Path indexing http://www.lambda.ee/index.php/Pilt:Pathindexingcspp20.pdf
- Subsumption and context trees http://www.lambda.ee/index.php/Pilt:FastindexingctreesJAR.pdf
- Skip lists http://www.lambda.ee/index.php/Pilt:Skipliststpugh90skip.pdf
- 10 Materjale teadmiste loogika kohta
- pikk versioon ja lühem versioon, vaata ka ghostscripti saiti .ps jaoks
Abimaterjalid disjunktide kujule viimiseks (ei ole kohustuslik lugeda):
- Hea ülevaade: http://www.cs.miami.edu/~geoff/Papers/Journal/1996_SM96_SACJ.pdf
- FLOTTERi kohta master thesis http://www.dfki.de/vse/papers/rock95.ps.gz
- FLOTTERi kohta artikkel: http://www.dfki.de/vse/papers/nrw98.ps.gz