Notes about numerical confidence, popularity, etc measures
Allikas: Lambda
Numbrilised dimensioonid faktidele:
- tõenäosus:
klassikaline kombinatsioonidega:
mis tõenäosus on, et kahe täringu viske summa
tuleb 2 (1/36, väike)? Aga summa 4 (3/36, suurem)?
Bayesi reeglid, ...
mis tõenäosus on, et täna 15:00 ja 15:10 vahel tuleb
troll peatusse?
statistilne mõõtmine, aasta otsa loeme kokku,
saame keskmine 0.7
mis tõenäosus on, et täna 15:00 ja 15:10 vahel tuleb
troll peatusse, KUI ei ole samal päeval elektrikatkestust?
kui tihti on elektrikatkestused?
- usaldusväärsus: kui veendunud ma olen mingis faktis Pikk(john)
ise: panen numbri
küsitlus 100 tudengi hulgas: kui suur protsent ütleb, et õige
- tugevus (fuzzy parameeter): kui "väga" see fakt kehtib (a la Pikk(john))
küsitlus 100 tudengi hulgas: kui suur protsent ütleb, et õige
usaldusväärsus(80%,tugevus(90%,p(john(pikk))):
80% tudengeid ütleb, et 90% tudengite jaoks on john pikk.
- küsimus: mis protsent tudengeid vastab, et john on pikk?
92,80,100,70,.... (vbl võtta usaldusväärsuseks keskmine?)
- küsimus: kas vähemalt 90% tudengeid vastab, et john on pikk?
jah,ei,jah,jah,ei, ... (jahide protsent ongi usaldusväärsus)
- tuntus: kui paljud inimesed seda teavad
küsitlus 100 tudengi hulgas: kui suur protsent ütleb, et õige
kaks varianti küsimustest:
- tuntus: kas sa tead johni pikkust?
- usaldusväärsus: kas john on pikk?
küsime mill inimest üle maailma:
- kas sa tead, mis on maailma kõrgeim mägi?
saame a la 80% ütleb "jah"
palju false positive, a la Munamägi, Kazbek, K2, ...
küsime mill inimest üle maailma:
- kas sa tead, et Dzhomolungma on maailma kõrgeim mägi?
saame a la 70% ütleb "jah"
tuntust saab justkui mõõta objektide kohta (kas tead johni)
usaldusväärsust nende omaduste kohta (kas on Pikk(john))
usaldusväärsus: need inimesed, kellelt me küsime õiget vastust,
kui paljud neist vastasid jah esimesele küsimusele
usaldusväärsus: protsent, kes vastasid jah mõlemale
- populaarsus: kui paljudele inimestele see vahel pähe tuleb
- küsimus: kas sa see nädal oled mõelnud, et
Dzhomolungma on maailma kõrgeim mägi?
a la 2%
- vastuolulisus: "maa on lame"
summa:
need inimesed, kellelt me küsime õiget vastust,
ja kes vastasid ei, (a la 20%: nad ei tea õiget vastust)
aga samas vastasid jah esimesele küsimusele (nad
on veednud vales vastuses, a la K2)
protsent: summa / need, kes vastasid jah esimesele küsimusele
Bayesian: "päris tõenäosused" aga tingimuslikud
Fuzzy logic: predikaadid on sujuvad
99%: Punane(õun2ülenipunane) 95%: Punane(õun1) 50%: Punane(õun1laiguline) 95% Pikk(john,190) 70% Pikk(john,185) 1% Pikk(john,160)