Iti0210lab12

Allikas: Lambda

Närvivõrk: pildituvastus

Sissejuhatus

Selle ülesande eesmärgiks on katsetada närvivõrgu treenimist. Ülesandes teeme objektituvastust pildilt.

Endale sobiv närvivõrk vali ise, juhendi näited kasutavad sklearn paketti.

Kõigepealt treenime närvivõrgu, kasutades Fashion-MNIST andmestikku. See sisaldab 60000 rasterformaadis pilti treenimiseks ning 10000 samas formaadis pilti testimiseks.

Siis proovime närvivõrku rakendada suvaliste piltide tuvastamiseks.

Ettevalmistus

Vali endale sobiv närvivõrgu implementatsioon:

  • scikit-learn. Kõige lihtsam: on Anacondas juba sees, kõik näited on sellega tehtud. Miinus: närvivõrkude tegemiseks väga piiratud.
  • Keras. Suht lihtne kasutada.
  • PyTorch.
  • Deeplearning4j. Java.

Andmed:

  1. Loe läbi "Why we made Fashion-MNIST".
  2. Laadi andmed alla: juhend / lingid.
  3. Tee selgeks, kuidas andmefaile avada ja pildiandmeid sisse laadida]. Näiteks Pythoni ja scikit-learn kasutamisel on abi sellest skriptist.
import mnist_reader

X_train, y_train = mnist_reader.load_mnist('', kind='train')
X_test, y_test = mnist_reader.load_mnist('', kind='t10k')
  • X_train - treeningpildid (60000x784 massiiv, iga pilt on 784 pikslit)
  • y_train - pildi klassifikaator (0-9)
  • X_test - testpildid klassifitseerimiseks
  • y_test - testpildi õige klassifikatsioon, et kontrollida närvivõrgu väljundi õigsust

Närvivõrgu treenimine sklearn paketiga

Kui kasutad muud paketti, uuri selle juhendit ja näiteid Internetist (Keras,PyTorch).

Kasutame mitmekihilist perceptron tüüpi närvivõrku (dokumentatsioon).

Kuna tegu on 8-bitiste piltidega, kus iga piksli väärtus on 0 kuni 255, siis on soovitatav sisendid normaliseerida vahemikku (0, 1).

from sklearn.neural_network import MLPClassifier

clf = MLPClassifier(max_iter = 50,
                     hidden_layer_sizes=(10,), random_state=1)

X_train = X_train / 255.0
X_test = X_test / 255.0

clf.fit(X_train, y_train)
print(clf.score(X_test, y_test))

Huvitavad parameetrid:

  • max_iter - mitu treenimise "epohhi" tehakse. Vähem on kiirem, aga mudeli parameetrid ei pruugi konvergeeruda.
  • hidden_layer_sizes - annab närvivõrgu struktuuri. Toodud näites on ühe peidetud kihiga (10 sõlme) struktuur. Sisendite ja väljundite arv leitakse automaatselt treeningandmete pealt.

Katseta peidetud kihtide arvu, suuruse ja treeningiteratsioonide arvu muutmisega.

Muud parameetrid.

Põhimõtteliselt on võimalik kiiruse huvides ka treeningandmete suurust vähendada, aga lõplik treenimine tuleks kindlasti teha täisandmete pealt.

import random

X_small, y_small = zip(*random.sample(list(zip(X_train, y_train)), 6000))
clf.fit(X_small, y_small)

Katsetamine

Otsi Google pildiotsinguga sobivaid pilte (umbes 5-15 tk) ja konverteeri need 28x28, grayscale formaati. Pane tähele kuidas MNIST-Fashion treeningandmetes on kujundid esitatud: taust on must ja objektid on heledad, seetõttu on tõenäoliselt vajalik inverteerimine.

Enne:

kott

Pärast (märkus: testis on kasutatud BMP formaati, wiki seda ei toeta):

kott, 28x28

Proovime laadida ja klassifitseerida. Pildifail tuleks saada ühemõõtmelise massiivi kujule ning iga piksli väärtus normaliseerida samuti kui treenimisel.

import numpy as np
#from scipy.misc import imread
from imageio import imread

bla = imread("test1_28.bmp", pilmode='L')
X = np.reshape(bla, (1,28*28)) / 255.0
print(X.shape)

[sklearn]

print(clf.predict(X))

Märkus: predict() meetod tahab parameetrina sisendite massiivi ja annab vastuseks ka klasside massiivi. Antud näites on aga üks pilt ja seega mõlema massiivi pikkuseks 1.

Klassifikaatorite tähendused.