Sistema Camara compatible amb els altaveus (SPACS): 8 passos

Taula de continguts:

Pas 1: materials
Pas 2: maquinari: impressió 3D
Pas 3: Maquinari: components electrònics
Pas 4: programari
Pas 5: Programari: so
Pas 6: programari: detecció de rostres i parla
Pas 7: Programari: motor giratori
Pas 8: millores futures

2025 Autora: John Day | [email protected]. Última modificació: 2025-01-23 14:38

Imagineu una trucada de conferència en què diversos altaveus envolten una càmera. Sovint ens trobem on l’angle de visió limitat d’una càmera sovint no mira la persona que parla. Aquesta limitació de maquinari degrada significativament l’experiència de l’usuari. Si la càmera pot mirar altaveus actius, el públic remot participaria més en una conversa durant la trucada. En aquest projecte, proposem un sistema de càmera (prototip) que detecta i segueix l’altaveu actiu girant la càmera cap a l’altaveu. El sistema utilitza un enfocament visual i àudio. Quan es detecten les cares des de la càmera, determina la persona que parla i calcula l’angle per girar. Quan les cares no es detecten en l'angle actual, el sistema busca l'altaveu en funció de la direcció dels senyals d'àudio d'arribada.

Pas 1: materials

Ploma d'Adafruit nRF52840 Express X 1

www.adafruit.com/product/4062

Amplificador de micròfon Electret: MAX4466 X 2

www.adafruit.com/product/1063

Micro Servo Motor X 1

www.adafruit.com/product/169

Smartphone Android X 1

Pas 2: maquinari: impressió 3D

Per a una implementació ràpida, vam decidir imprimir en 3D els recintes que necessitem. Hi ha dos components principals per als tancaments; un tocadiscs i un suport per a telèfons intel·ligents. Hem fet servir el plat giratori d’aquest enllaç (https://www.thingiverse.com/thing:141287), on proporciona una funda Arduino a la part inferior i una taula giratòria que es pot connectar amb un servomotor. Hem fet servir un suport per a telèfons intel·ligents d’aquest enllaç (https://www.thingiverse.com/thing:2673050), que es pot plegar i ajustar l’angle de manera que ens permet calibrar l’angle convenientment. La figura següent mostra les parts impreses en 3D reunides.

Pas 3: Maquinari: components electrònics

Hi ha quatre components per cable; Ploma d'Adafruit, dos micròfons i un motor. Per als envasos compactes, hem soldat (cercles grisos) els cables sense fer servir una placa de tall. A continuació es descriu el diagrama de circuits i l’artefacte real.

Pas 4: programari

El nostre sistema utilitza principalment la informació visual del reconeixement facial per seguir l’altaveu, ja que és més precisa. Per tal que Feather obtingui informació visual de l’aplicació per a Android, fem servir Bluetooth Low Energy com a mètode principal de comunicació.

Quan es detecta qualsevol cara, l'aplicació calcula l'angle que el motor ha de girar per enfocar l'altaveu al centre del quadre. Vam descompondre els possibles escenaris i els vam gestionar de la manera següent:

Si es detecten i parlen rostres, calcula el punt mitjà dels altaveus i retorna l'angle relatiu a la Ploma.
Si es detecten cares però cap d'elles parla, també calcula el punt mitjà de les cares i retorna l'angle en conseqüència.
Si no es detecta cap cara, el sistema canvia la lògica de seguiment dels altaveus del visual al de l'àudio.

El programari SPACS es troba a

Pas 5: Programari: so

So (YH)

Per localitzar la font del so entrant, primer vam intentar utilitzar la diferència horària entre els dos micròfons. Però no va ser exacta tant com esperàvem, ja que la freqüència de mostreig (~ 900Hz) d'Arduino Leopard, on vam provar els senyals de so, era lenta de manera que no pot captar la diferència horària entre els micròfons separats per 10 cm.

Vam canviar el pla per utilitzar la diferència d’intensitat entre els dos senyals de so d’entrada. Com a resultat, la ploma pren dos senyals sonors i els processa per detectar d’on provenia el so. El processament es pot descriure mitjançant els passos següents:

Agafeu les entrades de dos micròfons i resteu el desplaçament per obtenir les amplituds dels senyals.
Acumuleu els valors absoluts de les amplituds per MIC per a 500 pastilles.
Deseu la diferència dels valors acumulats a la cua amb 5 espais.
Retorna la suma de les cues com a valor diferencial final.
Compareu el valor final amb els llindars per decidir d’on prové el so.

Hem trobat el llindar traçant el valor final en diverses circumstàncies, inclòs el so provinent d’esquerra i dreta. A més dels llindars del valor final, també establim un altre llindar per a la mitjana de les amplituds acumulades al pas 2 per filtrar els sorolls.

Pas 6: programari: detecció de rostres i parla

Per al reconeixement facial, vam utilitzar ML Kit per a Firebase publicat per Google (https://firebase.google.com/docs/ml-kit). ML Kit proporciona l'API de detecció de cares que retorna la caixa delimitadora de cada cara i les seves fites, inclosos els ulls, el nas, les orelles, les galtes i els diferents punts de la boca. Un cop detectades les cares, l'aplicació fa un seguiment del moviment de la boca per determinar si la persona parla. Utilitzem un enfocament senzill basat en llindars que proporciona un rendiment fiable. Vam aprofitar el fet que el moviment de la boca augmenta tant en horitzontal com en vertical quan una persona parla. Calculem la distància vertical i horitzontal de la boca i calculem la desviació estàndard de cada distància. La distància es normalitza a la mida de la cara. Una desviació estàndard més gran indica parlar. Aquest enfocament té la limitació que totes les activitats que impliquen el moviment de la boca, inclòs menjar, beure o badallar, es poden reconèixer com a parlants. Però té una taxa de falsos negatius baixa.

Pas 7: Programari: motor giratori

La rotació del motor no va ser tan directa com esperàvem a causa del control de la velocitat de rotació. Per controlar la velocitat, declarem una variable de comptador global tal que permet que el motor giri només quan la variable assoleixi un valor determinat. També vam declarar una altra variable global que indica si el motor es mou per avisar els micròfons perquè puguin evitar el so que prové de la rotació del motor.

Pas 8: millores futures

Una de les limitacions és que el motor es mou en certs angles. Sembla que el motor no és prou potent per superar el parell generat en girar el telèfon intel·ligent. Es pot resoldre mitjançant un motor més potent o ajustant la posició del telèfon intel·ligent cap al centre de la rotació per reduir el parell.

La detecció de direcció de so basada en àudio es podria millorar amb un mètode més sofisticat. Ens agradaria provar un enfocament acústic de formació de feixos per determinar la direcció del so entrant. Hem intentat amb l'hora d'arribada dels senyals d'àudio. Però, la freqüència de mostreig de la Ploma es limita per detectar la diferència horària quan els micròfons només es troben a uns 10 cm.

L’última peça que falta d’aquest prototip és l’avaluació de la usabilitat. Una forma prometedora d’avaluar és integrar el sistema amb la plataforma de videotrucades existent i observar les respostes dels usuaris. Aquestes respostes ajudaran a millorar el sistema i a fer la següent iteració d’aquest prototip.

Recomanat:

Altaveus de prestatge amb suport per a iPod (Part I - Caixes d’altaveus): 7 passos

Altaveus de prestatge amb moll d’iPod (primera part: caixes d’altaveus): vaig aconseguir un iPod nano al novembre i des d’aleshores he desitjat un sistema d’altaveus atractiu per a això. Un dia a la feina em vaig adonar que els altaveus de l’ordinador que feia servir funcionaven força bé, així que vaig anar cap a Goodwill més tard i vaig trobar un parell d’altaveus d’ordinador per $

Distribuïu els vostres instructables, els temes del fòrum i els vostres preferits a Twitter i Facebook: 3 passos

Distribuïu els vostres instructables, els temes del fòrum i els vostres preferits a Twitter i Facebook: mitjançant els canals RSS del vostre compte i d'un parell de llocs web útils, és possible sindicar i compartir els vostres instructables, els temes del fòrum, els preferits i tota la resta de la vostra activitat a Instructibles a Facebook o Twitter. Aquesta és una gran manera

Com modificar els altaveus Sony Ericsson per treballar amb un iPod .: 4 passos

Com es modifiquen els altaveus Sony Ericsson per treballar amb un iPod: en aquest instructiu us mostraré com modificar un parell d’altaveus Sony Ericsson perquè funcionin amb iPods, MP3 o qualsevol cosa que tingui un endoll per a auriculars. Aquest és el meu primer instructable, així que espero que us agradi! Equipament: qualsevol cable amb una ja

Altaveus portàtils / altaveus amb bateria: 7 passos

Altaveus portàtils / altaveus amb bateria: Hola nois, aquest és el meu primer instructable. Així que avui tinc gong per mostrar-vos com fer des dels altaveus antics del PC fins als altaveus amb bateria. És bastant bàsic i tinc moltes imatges .;)

Ball of Death: o com vaig aprendre a deixar de preocupar-me i estimar els altaveus d'Apple Pro: 11 passos (amb imatges)

Ball of Death: o Com vaig aprendre a deixar de preocupar-me i estimar els altaveus d’Apple Pro: ” Sempre he dit que, des de l’eliminació de la caixa de color beix, Apple sempre ha liderat l’àrea de disseny industrial. La integració de forma i funció no la pot tocar cap altre fabricant de cap indústria (Porsche s’acosta). És

Sistema Camara compatible amb els altaveus (SPACS): 8 passos

Taula de continguts:

Pas 1: materials

Pas 2: maquinari: impressió 3D

Pas 3: Maquinari: components electrònics

Pas 4: programari

Pas 5: Programari: so

Pas 6: programari: detecció de rostres i parla

Pas 7: Programari: motor giratori

Pas 8: millores futures

Recomanat:

Altaveus de prestatge amb suport per a iPod (Part I - Caixes d’altaveus): 7 passos

Distribuïu els vostres instructables, els temes del fòrum i els vostres preferits a Twitter i Facebook: 3 passos

Com modificar els altaveus Sony Ericsson per treballar amb un iPod .: 4 passos

Altaveus portàtils / altaveus amb bateria: 7 passos

Ball of Death: o com vaig aprendre a deixar de preocupar-me i estimar els altaveus d'Apple Pro: 11 passos (amb imatges)

Termòmetre digital DHT11 amb ESP8266: 4 passos

Com fer que Alexa digui amor amb mi: 7 passos

Com utilitzar un Teensy per imprimir imatges a Splatoon 2 amb la impressora SplatPost: 10 passos

Bricolatge envoltant del controlador de l’altaveu: 4 passos

Universial Radio iPod Dock: 4 passos

Estil Ipogo Pogo barat (no amb paper d'alumini!): 6 passos

Instruccions per completar la maqueta del disseny de diapositives de via per elevar / baixar els reposapeus muntats al centre de les cadires de rodes elèctriques: 9 passos (amb ima

Tripwire portàtil: 9 passos

Funda per a portàtil de cartró ondulat: 5 passos

Provador d'alimentació d'ordinador simple: 5 passos

Feu un filtre Flash per afegir drama a les vostres fotos: 8 passos

Elevador de portàtils per a menys d’1 € en 5 minuts: 5 passos

LLUM DEL TUB LED (CA): 3 passos

Provador de capacitat de bricolatge d'ions Li: 8 passos (amb imatges)

Drone Arduino amb GPS: 16 passos

Comptador de puntuacions Arduino: 5 passos