Taula de continguts:

Anàlisi de components principals: 4 passos
Anàlisi de components principals: 4 passos

Vídeo: Anàlisi de components principals: 4 passos

Vídeo: Anàlisi de components principals: 4 passos
Vídeo: StatQuest: Principal Component Analysis (PCA), Step-by-Step 2024, Desembre
Anonim
Anàlisi de components principals
Anàlisi de components principals

L’anàlisi de components principals és un mètode estadístic que converteix un conjunt de variables possiblement correlacionades en un conjunt de valors linealment no correlacionats mitjançant transformacions ortogonals. En paraules senzilles amb un conjunt de dades amb diverses dimensions, ajuda a reduir el nombre de dimensions i, per tant, facilita la lectura de les dades.

Pas 1: Plans originals

Vaig entrar a aquesta classe amb la idea que volia entendre i, amb sort, escriure un algorisme que pogués realitzar el reconeixement facial quan se’m subministrés amb imatges. No tenia experiència ni coneixements anteriors sobre res a veure amb el reconeixement facial i no tenia ni idea del difícil que és aconseguir una cosa així. Després de parlar amb el professor Malloch, em vaig adonar que he d’aprendre moltes coses abans de poder entendre completament la tasca que finalment vaig planejar assolir.

Després d'una mica d'investigació, finalment vaig decidir que més que res necessitava aprendre àlgebra lineal i alguns conceptes bàsics de l'aprenentatge automàtic i em vaig basar en PCA (anàlisi de components principals) per ser el meu objectiu per a aquesta classe.

Pas 2: investigació

Recerca
Recerca

El primer pas va ser visitar la Biblioteca i trobar qualsevol llibre que em fes conèixer l'aprenentatge automàtic i, més concretament, el processament d'imatges. Va resultar ser molt més difícil del que pensava i no vaig acabar amb res. Aleshores vaig decidir preguntar-li a un amic que treballava al Vision Lab que em va demanar que examinés l’àlgebra lineal i, més concretament, els vectors propis i els valors propis. Vaig tenir certa experiència amb l'àlgebra lineal d'una classe que havia cursat en el segon any de carrera, però no entenia com els vectors propis o els valors propis podrien ser útils quan es tractaven imatges. A mesura que investigava més, vaig entendre que les imatges no eren res més que grans conjunts de dades i, per tant, es podien tractar com a matrius i em va resultar una mica més clar per què els vectors propis eren rellevants pel que feia. En aquest moment, vaig decidir que hauria d'aprendre a llegir imatges amb python, ja que anava a utilitzar python per al meu projecte. Inicialment, vaig començar fent servir CV2.imread per llegir les imatges, però va resultar ser molt lent i, per tant, vaig decidir utilitzar glob i PIL.image.open per fer-ho, ja que és molt més ràpid. Aquest procés en paper sembla relativament lent, però realment va trigar una bona quantitat de temps, ja que vaig haver d'aprendre a instal·lar i importar diferents biblioteques a PyCharm (IDE) i després llegir la documentació en línia de cada biblioteca. En el procés de fer-ho, també vaig aprendre a fer servir instruccions d’instal·lació de pip a l’indicador d’ordres.

Després d’això, el següent pas va ser esbrinar què volia fer i aprendre exactament en el processament d’imatges i, inicialment, tenia intenció de fer coincidències de plantilles, però, mentre investigava, vaig aprendre sobre PCA i vaig trobar que era més interessant, així que vaig decidir aneu amb PCA. El primer terme que va aparèixer va ser l'algorisme K-NN (K- veí més proper). Aquesta va ser la meva primera exposició a un algorisme d'aprenentatge automàtic. Vaig aprendre sobre les dades de formació i proves i què significa "l'entrenament" d'un algorisme. Comprendre l’algorisme K-NN també va ser un repte, però va ser molt satisfactori comprendre finalment com funciona. Actualment estic treballant perquè el codi de K-NN funcioni i estic molt a prop de finalitzar.

Pas 3: dificultats afrontades i lliçons apreses

La primera gran dificultat va ser l’abast del propi projecte. Es tractava més d’una investigació que física. A mesura que passaven les setmanes, observava el progrés que feien els meus companys i sentia que no feia prou o que no avançava prou ràpidament i que de vegades era molt desmotivador. Parlar amb el professor Malloch i tranquil·litzar-me que estava aprenent coses que per a mi eren molt noves, em va ajudar a seguir endavant. Un altre problema era que conèixer coses teòriques i aplicar-les són dues coses diferents. Tot i que sabia el que havia de fer, codificar-lo en python era una història diferent. Aquí és on només llegir documentacions en línia i preguntar-los als amics que en sabien més ajudava molt a definir finalment un pla d’acció.

Personalment, crec que tenir una biblioteca més gran de llibres i documents a M5 podria ajudar les persones que treballen en projectes. Tenir un registre digital en temps real dels projectes que realitzen els estudiants perquè altres estudiants i personal puguin veure-ho i participar-hi si els interessa és una bona idea per a M5.

En acabar el projecte, he après molt en un període de temps tan curt. He adquirit un coneixement pràctic sobre l’aprenentatge automàtic i sento que he fet els primers passos per implicar-m’hi més. M'he adonat que m'agrada la visió per computador i que potser voldria continuar amb això fins i tot en el futur. El més important és que he après què és l'APC, per què és tan important i com fer-ne ús.

Pas 4: passos següents

Per a mi, això només estava ratllant la superfície d’alguna cosa molt més extensa i que és molt important en el món actual, és a dir, l’aprenentatge automàtic. Tinc previst fer cursos relacionats amb l’aprenentatge automàtic en un futur proper. També tinc previst construir el meu camí cap al reconeixement facial, ja que aquí va començar tot aquest projecte. També tinc idees per a un sistema de seguretat que utilitzi funcions combinades (una d’elles és la cara de la persona) per fer-lo realment segur i això és el que vull treballar en el futur quan tinc una comprensió més àmplia de les coses..

Per a qualsevol persona com jo que estigui interessada en l’aprenentatge automàtic i el processament d’imatges, però que no tingui experiència prèvia, us suggeriria molt primer aprendre i comprendre l’àlgebra lineal juntament amb les estadístiques (especialment distribucions). En segon lloc, suggeriria llegir el reconeixement de patrons i l’aprenentatge automàtic de Christopher M. Bishop. Aquest llibre m’ha ajudat a entendre els conceptes bàsics del que em dedicava i s’estructura molt bé.

Recomanat: