Iti0210lab12
Sisukord
Närvivõrk: pildituvastus
Sissejuhatus
Selle ülesande eesmärgiks on katsetada närvivõrgu treenimist. Ülesandes teeme objektituvastust pildilt.
Endale sobiv närvivõrk vali ise, juhendi näited kasutavad sklearn
paketti.
Kõigepealt treenime närvivõrgu, kasutades Fashion-MNIST andmestikku. See sisaldab 60000 rasterformaadis pilti treenimiseks ning 10000 samas formaadis pilti testimiseks.
Siis proovime närvivõrku rakendada suvaliste piltide tuvastamiseks.
Ettevalmistus
Vali endale sobiv närvivõrgu implementatsioon:
- scikit-learn. Kõige lihtsam: on Anacondas juba sees, kõik näited on sellega tehtud. Miinus: närvivõrkude tegemiseks väga piiratud.
- Keras. Suht lihtne kasutada.
- PyTorch.
- Deeplearning4j. Java.
Andmed:
- Loe läbi "Why we made Fashion-MNIST".
- Laadi andmed alla: juhend / lingid.
- Tee selgeks, kuidas andmefaile avada ja pildiandmeid sisse laadida]. Näiteks Pythoni ja
scikit-learn
kasutamisel on abi sellest skriptist.
import mnist_reader X_train, y_train = mnist_reader.load_mnist('', kind='train') X_test, y_test = mnist_reader.load_mnist('', kind='t10k')
-
X_train
- treeningpildid (60000x784 massiiv, iga pilt on 784 pikslit) -
y_train
- pildi klassifikaator (0-9) -
X_test
- testpildid klassifitseerimiseks -
y_test
- testpildi õige klassifikatsioon, et kontrollida närvivõrgu väljundi õigsust
Närvivõrgu treenimine sklearn
paketiga
Kui kasutad muud paketti, uuri selle juhendit ja näiteid Internetist (Keras,PyTorch).
Kasutame mitmekihilist perceptron tüüpi närvivõrku (dokumentatsioon).
Kuna tegu on 8-bitiste piltidega, kus iga piksli väärtus on 0 kuni 255, siis on soovitatav sisendid normaliseerida vahemikku (0, 1).
from sklearn.neural_network import MLPClassifier clf = MLPClassifier(max_iter = 50, hidden_layer_sizes=(10,), random_state=1) X_train = X_train / 255.0 X_test = X_test / 255.0 clf.fit(X_train, y_train) print(clf.score(X_test, y_test))
Huvitavad parameetrid:
-
max_iter
- mitu treenimise "epohhi" tehakse. Vähem on kiirem, aga mudeli parameetrid ei pruugi konvergeeruda. -
hidden_layer_sizes
- annab närvivõrgu struktuuri. Toodud näites on ühe peidetud kihiga (10 sõlme) struktuur. Sisendite ja väljundite arv leitakse automaatselt treeningandmete pealt.
Katseta peidetud kihtide arvu, suuruse ja treeningiteratsioonide arvu muutmisega.
Põhimõtteliselt on võimalik kiiruse huvides ka treeningandmete suurust vähendada, aga lõplik treenimine tuleks kindlasti teha täisandmete pealt.
import random X_small, y_small = zip(*random.sample(list(zip(X_train, y_train)), 6000)) clf.fit(X_small, y_small)
Katsetamine
Otsi Google pildiotsinguga sobivaid pilte (umbes 5-15 tk) ja konverteeri need 28x28, grayscale formaati. Pane tähele kuidas MNIST-Fashion treeningandmetes on kujundid esitatud: taust on must ja objektid on heledad, seetõttu on tõenäoliselt vajalik inverteerimine.
Enne:
Pärast (märkus: testis on kasutatud BMP formaati, wiki seda ei toeta):
Proovime laadida ja klassifitseerida. Pildifail tuleks saada ühemõõtmelise massiivi kujule ning iga piksli väärtus normaliseerida samuti kui treenimisel.
import numpy as np #from scipy.misc import imread from imageio import imread bla = imread("test1_28.bmp", pilmode='L') X = np.reshape(bla, (1,28*28)) / 255.0 print(X.shape)
[sklearn]
print(clf.predict(X))
Märkus: predict()
meetod tahab parameetrina sisendite massiivi ja annab vastuseks ka klasside massiivi. Antud näites on aga üks pilt ja seega mõlema massiivi pikkuseks 1.
Klassifikaatorite tähendused.