Universitatea Tehnică din Berlin
Technische Universität Berlin Facultatea I Institutul de limbă și comunicare Departamentul de comunicare audio Evaluarea calității audiovizuale a difuzoarelor Teză de master prezentată de Paul Mainz Număr student 225610 Berlin, 18 martie 2015 Primul recenzent: Prof. Dr. Stefan Weinzierl Al doilea recenzor: Dr. Hans-Joachim Maempel

Afidavit Prin prezenta declar în locul jurământului că am pregătit prezenta lucrare independent și personal, fără ajutor extern neautorizat și folosind exclusiv sursele și resursele enumerate. Berlin, 18 martie 2015 Paul Mainz
Cuprins 1 Introducere 1 2 Starea cercetării 3 2.1 Percepția multimodală. 3 2.2 Percepția audiovizuală. 4 2.2.1 Evaluarea audiovizualului. 7 2.2.2 Percepția audiovizuală a difuzoarelor. 9 3 Test de ascultare 11 3.1 Obiectul investigației. 11 3.2 Proiectarea testului. 12 3.2.1 Paradigma co-prezenței. 12 3.2.2 Paradigma stimulului conic. 12 3.3 Difuzoare. 14 3.4 Configurarea testului structural. 17 3.5 Măsurare. 19 3.6 Conținut audio. 23 3.7 Instrument de sondaj. 24 3.8 Construcție la scară. 25 3.9 Configurarea experimentului tehnic. 29 3.9.1 Achiziționarea datelor. 29 3.9.2 Simulare acustică. 32 3.9.3 Platan. 35 3.10 Implementare. 36 4 Evaluare 39 4.1 Paradigma co-prezenței. 41 4.1.1 Atribute auditive. 44 4.1.2 Atribute vizuale. 49 I.
4.1.3 Atribute audiovizuale. 50 4.2 Paradigma stimulului conic. 52 4.2.1 Atribute auditive. 53 4.2.2 Atribute vizuale. 57 4.2.3 Atribute audiovizuale. 58 4.3 Relațiile dintre variabile. 60 4.3.1 Paradigma coprezenței. 60 4.3.2 Paradigma stimulului conic. 65 5 Sumar 70 Bibliografie 73 Lista figurilor 76 Lista tabelelor 79 O analiză a varianței 82 A.1 Paradigma co-prezenței. 82 A.2 Paradigma stimulului conic. 85 B Regresia 89 B.1 Paradigma co-prezenței. 89 B.2 Stimul conic. 91 C polaritate prole 93 C.1 paradigmă de coprezență. 93 D LimeSurvey 97 D.1 Instrucțiuni de testare. 97 D.2 Chestionare. 98 D.3 osc-web. 99 E Funcții Matlab 100 E.1 reset_turntable.m. 100 E.2 move_turntable.m. 102 E.3 setup_righttable.m. 105 E.4 outline_callback.m. 106 II
1. INTRODUCERE Percepția sunetului reprodus de aceștia, precum și asupra evaluării calității întregului produs difuzor. Dacă există o legătură aici, ar trebui făcută o încercare de a o cuantifica. Percepția audiovizuală ca domeniu științific de cercetare primește o atenție tot mai mare, dar este o disciplină tânără care oferă multe întrebări deschise. Scopul acestei lucrări este de a contribui la o mai bună înțelegere a relațiilor dintre auzit și văzut obiecte. În plus, cunoașterea acestor relații în legătură cu difuzoarele poate fi utilă la fabricarea difuzoarelor. 2
2.2. PERCEPȚIA AUDIOVISUALĂ 2. STAREA CERCETĂRII aranjate una împotriva celeilalte. Astfel, din interior spre exterior, există o diferență tot mai mare între stimulul vizual și auditiv. Înainte de experiment, subiecții testului au fost informați că ambele difuzoare produc același sunet și, prin urmare, nu pot auzi un sunet stereo și că sună ca și cum semnalul ar fi venit din centru. Cu toate acestea, rămâne discutabil dacă acest anunț face ca stimulul conictului să fie plauzibil pentru sistemul perceptiv și are sens să se efectueze un experiment similar în condiții care reprezintă o situație care este mai familiară pentru subiecții testați și experiențele naturale de zi cu zi atunci când se aud semnalele audio prin difuzoare. hărți mai bine. În experimentul lor, autorii au întrebat întotdeauna despre calitatea sunetului în toate condițiile (inclusiv cele pur vizuale). Aceștia subliniază, de asemenea, că poate fi de interes să se investigheze ce factori individuali sunt importanți pentru percepția generală a produsului difuzorului. 10
3.4. CONFIGURAREA EXPERIMENTALĂ STRUCTURALĂ (a) Coloana Adam Classic Mk3 (c) JVC SP-E5 Al 3-lea TEST DE ASCULTARE (b) B&W DM601 S2 (d) Braun L420/1 (e) Heco Victa 201 Figura 3.1: Boxe utilizate în testul de ascultare 18
3.5. MĂSURAREA A 3-A TEST DE ASCULTARE Figura 3.4: Robot de măsurare FABIAN pe scaun pentru subiecții testați înainte de măsurarea BRIR ren echipează căștile cu un tracker de cap care înregistrează mișcarea capului. Pe baza datelor de poziție ale urmăritorului de cap, un BRIR adecvat pentru poziția curentă a capului poate fi apoi selectat pentru pliere cu semnalul de intrare. Aceasta creează o sursă de sunet virtuală pentru ascultător care nu se mișcă atunci când capul este întors, dar rămâne în poziția sa. Robotul de măsurare FABIAN dezvoltat de departamentul de comunicații audio a fost utilizat pentru măsurarea BRIR [24]. Robotul oferă o modalitate simplă de măsurare automată a BRIR pe o gamă de poziții ale capului de ± 80. Rezoluția de aici a fost 1. BRIR-urile au fost astfel măsurate în trepte de 1 de la o rotație a capului cu 80 la stânga la 80 la dreapta. Astfel, la sfârșitul măsurării unei surse, obțineți 80 BRIR în fiecare direcție plus unul în poziția zero, adică poziția capului în care robotul privește drept înainte. Deci asta dă 2 80 + 1 = 161 BRIR (stereo) pe sursă. Fiecare difuzor dintr-o pereche stereo a fost măsurat separat. Deci, în cele din urmă, există 2.161 = 322 BRIR per model de difuzoare
3.6. CUPRINS AUDIO Al treilea TEST DE ASCULTARE Figura 3.6: Funcția de transfer a difuzorului stâng respectiv în cameră atunci când măsurați cu robotul de măsurare și un unghi de 30 (adică vedere frontală a robotului la difuzor), difuzorul urechii drepte până sub pânza de pe platan. Figurile 3.5 și 3.6 prezintă exemple de funcții de transfer ale setării experimentale pentru toate cele cinci difuzoare calculate din răspunsurile la impuls ale difuzorului stâng pentru un unghi de 30 (robotul de măsurare, prin urmare, privește atent difuzorul). 3.6 Conținut audio Ar trebui făcută o încercare de a crea o situație de ascultare pentru subiecții de test cât mai normal posibil. Conținutul stimulilor care urmează să fie evaluați de subiecții testați, adică materialul audio care este pliat cu BRIR, ar trebui, prin urmare, să fie selectat dintr-un gen care este destul de familiar pentru mulți ascultători. În același timp, acest semnal ar trebui să poată descoperi punctele slabe dintr-un difuzor și să le facă audibile sau să sublinieze punctele forte, astfel încât subiecții de test să aibă ocazia să audă diferențele dintre cele cinci modele de difuzoare. Așa cum este descris la 3.2 23
3.9. CONFIGURAREA TESTULUI TEHNIC Al treilea TEST DE ASCULTARE Figura 3.7: Configurarea tehnică schematică în timpul interfeței testului de ascultare. Exemple de pagini individuale de întrebări pot fi găsite în Anexa D. Pentru toate diferitele părți ale experimentului (pur acustice, pur optice și optoacustice), paginile de întrebări cu atributele corespunzătoare au fost create în LimeSurvey. Acest lucru asigură faptul că subiecții testului văd doar atributele care sunt adecvate în prezent. Fiecare pagină poate fi alocată unui grup de randomizare în LimeSurvey. În cadrul unui astfel de grup, paginile individuale sunt apoi afișate în ordine aleatorie. În același timp, grupurile pot fi aranjate în orice ordine specifică. În acest caz, a fost creat un grup pentru partea pur acustică, pur optică și optoacustică a experimentului. Acest lucru face foarte ușor setarea secvenței dorite de stimuli în experiment (mai întâi acustic, apoi optic, apoi 30
3.9. CONFIGURAREA TEHNICĂ EXPERIMENTALĂ Al 3-lea EXPERIMENT DE ASCULTARE Figura 3.8: Calea datelor audio din simularea acustică prin căști folosind un subwoofer care a fost plasat într-un colț al camerei în spatele celorlalte difuzoare. Așa că a fost dificil de văzut pentru subiecții testați și nici o explozie posibilă de aer prin mișcările membranei nu a putut fi observată de către participanți. Prin urmare, subwooferul nu a fost recunoscut în mod clar, deoarece o componentă implicată activ în experiment și localizarea acustică a cutiei nu a fost posibilă din cauza reproducerii frecvențelor joase. Întrucât scopul utilizării subwooferului a fost reproducerea componentelor secvențiale animale ale semnalelor, dar numai până la punctul din spectrul de frecvență la care căștile pot prelua din nou și, în același timp, nivelul semnalului pentru subwoofer a trebuit, de asemenea, să fie ajustat. Pentru a se asigura că se potrivește cu nivelul părții de simulare a căștilor la poziția subiecților de testare, semnalul de ieșire de mai jos, adică semnalul pliat cu BRIR, a fost trimis către software-ul JACKRack 9. JACKRack oferă 9 Bob Ham și colab., Http://jack-rack.sourceforge.net/ 33
3.10. REALIZAREA A 3-A ÎNCERCARE DE ASCULTARE Corectați simularea acustică a stimulului curent. 3.10 Implementare Cursul experimentului a avut în vedere prezentarea mai întâi a subiecților testați cu stimuli pur acustici, adică permițându-le doar să audă difuzoarele, dar să nu le vadă, apoi să genereze stimuli pur vizuali, adică doar să arate difuzoarele fără a utiliza simularea acustică. Redați mostre de sunet și prezentați în cele din urmă stimulii optoacustici. Această ordine asigură faptul că participanții nu sunt încă influențați de apariția difuzoarelor în timpul evaluării pur auditive. Deoarece nu puteți vedea niciun difuzor atunci când ascultați prima dată, nu este posibil să atribuiți pur și simplu mostrele de sunet auzite anterior difuzoarelor afișate optic pentru evaluarea ulterioară pur vizuală. Stimulii au fost prezentați aleatoriu în cadrul fiecăruia dintre aceste trei grupuri (vezi 3.9.1). Figura 3.10: Structura de vârstă a subiecților testului În test, un total de 20 de persoane aveau cetățenia germană 36
3.10. IMPLEMENTARE 3. ÎNCERCARE DE ASCULTARE că un semnal va fi redat din nou prin căști mai târziu, motiv pentru care ar trebui să păstrați căștile pornite pentru întregul experiment. De asemenea, a fost anunțat oamenilor că vor auzi fiecare difuzor de mai multe ori și că, datorită diferitelor setări electroacustice utilizate, același difuzor ar putea suna diferit de fiecare dată. Prin urmare, ar trebui să încerce să asculte sau să vadă și să evalueze din nou de fiecare dată. Pentru a permite difuzoarelor să fie evaluate pur auditive, difuzoarele au fost acoperite cu cârpe la începutul experimentului. Prin urmare, oamenii nu i-au putut vedea. După cei cinci stimuli pur acustici, subiecților li sa cerut să facă o scurtă pauză până când experimentatorul a îndepărtat coperțile. 38
4.1. PARADIGMA COPESENȚEI 4. EVALUARE Toate variabilele sunt codificate cu valorile -2-2. Cea mai mică sau cea mai negativă valoare pe o scală corespunde valorii -2, cea mai mare sau cea mai pozitivă valorii 2. 4.1 Paradigma copresenței Sunt în paradigma copresenței după cum s-a explicat deja, conțin toți stimulii care nu produc un stimul conic. Modalitatea celor doi factori (3 niveluri de factor) și difuzorul (5 niveluri de factor) sunt variate aici. Pentru toate variabilele dependente, valorile medii au fost calculate mai întâi și astfel au fost create profiluri de polaritate pentru toate difuzoarele și toate modalitățile pentru a ilustra datele. Acestea oferă o imagine de ansamblu bună a evaluărilor înregistrate și unele lucruri atrag atenția atunci când se uită la Prole. Prolele pentru difuzorul B&W și pentru modul auditiv sunt prezentate aici ca exemplu (figurile 4.1 și 4.2). Prolele pentru celelalte difuzoare și modalitățile pot fi găsite în anexă. Figura 4.1: Profilul de polaritate al modelului B&W DM601 S2 în paradigma coprezenței Schimbarea de la modalitatea auditivă la cea audiovizuală pare a fi o schimbare majoră
4.1. COPREZENȚA-PARADIGMA 4. EVALUAREA, este, de asemenea, utilizată în paradigma coprezenței de acest tip III, pentru a menține simplitatea și uniformitatea. În cazurile în care acest lucru este de interes, au fost efectuate, de asemenea, comparații individuale de perechi (fără ajustare) între nivelurile individuale ale factorilor. 4.1.1 Atribute auditive Așa cum era de așteptat, majoritatea atributelor auditive arată rezultate semnificative atunci când factorul difuzorului este variat. Acesta nu este un rezultat surprinzător, deoarece reproducerea semnalelor acustice și generarea de impresii auditive bune este sarcina principală a unui difuzor. Figura 4.3: Valorile medii ale atributelor auditive ridicate, scăzute, duritate și volum reprezentate grafic peste modalitate; valorile individuale sunt conectate cu linii pentru o mai bună lizibilitate, liniile nu reprezintă valori între modalități. Cu toate acestea, variația factorului difuzorului nu are ca rezultat o diferență semnificativă în evaluarea înalte. Acest lucru poate fi văzut și în Figura 4.3. În această figură și în următoarele reprezentări ale valorilor medii, abscisa este scalată nominal și un factor este reprezentat pe fiecare. Aceasta înseamnă că între punctele marcate pe axa X, desigur, nu 44
4.1. PARADIGMA COPESENȚEI 4. EVALUARE Valorile au fost măsurate. Cu toate acestea, a fost trasată o linie de legătură între valorile introduse pentru a ușura citirea graficelor. Valorile pentru înălțimi sunt toate apropiate. Subiecții testului au observat cu greu diferențe în reproducerea înălțimii. În plus față de sonoritate, atributul înalte este singurul auditiv care nu prezintă observații semnificative în paradigma coprezenței. Acest lucru se aplică și factorului de modalitate. Deși difuzoarele prezintă și diferențe în înalte, este posibil ca acestea să nu fi fost atât de ușor de auzit de către participanți. Cu toate acestea, pentru factorul difuzor, rezultatul este doar marginal nesemnificativ (p = 0,080). Rezistența testului nu este, de asemenea, deosebit de mare la 0,539. Prin urmare, s-ar putea ca influența scontată a difuzoarelor să nu fi fost găsită aici. Proporția minimilor perceptive arată rezultate foarte semnificative pentru factorul difuzor (p