O aplicație pentru a-ți menține vocea în viață în ciuda cancerului laringian - Sciences et Avenir
Postat pe 14.01.2019 8:00 a.m.

Două universități cehe au dezvoltat o aplicație text-to-speech care permite pacienților cu cancer laringian să continue să vorbească cu propria voce, chiar și după ce organele și corzile vocale au fost îndepărtate.
Ilustrație a traheostomiei în 1874.
Persoanele cu cancer laringian trebuie adesea să fie îndepărtat. Cu riscul corzilor vocale, situate exact în laringe. Pacienții își pierd astfel vocea. Cu toate acestea, un proces de înaltă tehnologie dezvoltat de două universități cehe face posibilă conservarea acestuia. Mai precis, pentru a-l simula, grație înregistrărilor vocale făcute înainte de operație, care fac posibilă modelarea fină a timbrului sonor! Datorită unei tablete sau a unui smartphone și a unui instrument text-to-speech, este posibil să vorbești din nou cu cei apropiați. Și asta, cu vocea lui „reală” !
Text către vorbire mai degrabă decât proteză vocală
În 2018, Vlastimil Gular se aștepta la o intervenție chirurgicală minoră la corzile vocale, dar medicii l-au diagnosticat cu cancer și au planificat să-i îndepărteze laringele. Trebuia să-și piardă folosirea vocii. Cu toate acestea, îl auzim și astăzi. Tatăl a patru ani, în vârstă de 51 de ani, continuă să discute, făcând să-și audă propria voce mai degrabă decât clopotul metalic al unui robot, datorită unei aplicații de pe telefonul său mobil: trebuie doar să tasteze ceea ce vrea să spună pe tastatură.
„Nu mă pricep foarte bine la proteza vocală”, adaugă el, arătând spre o gaură de mărimea unei monede în gât. Această proteză este un mic dispozitiv din silicon implantat în trahee care permite oamenilor să vorbească apăsând pe ea cu degetele pentru a varia fluxul de aer. El preferă aplicația, care a fost dezvoltată pentru pacienții supuși ablației laringiene, o intervenție clasică pentru combaterea cancerului avansat.
300 de propoziții înregistrate înainte de operație pot fi suficiente
Acest proiect comun al Universității din Boemia de Vest din Pilsen, Universitatea Charles din Praga și două companii private, CertiCon și SpeechTech, a fost lansat în urmă cu mai puțin de doi ani. El a fost numit Laryngo Voice. Tehnologia constă în utilizarea înregistrărilor vocii pacientului pentru a crea una sintetică care poate fi transmisă de pe telefon, tabletă sau laptop, printr-o aplicație.
În mod ideal, pacienții ar trebui să înregistreze mai mult de 10.000 de propoziții pentru a oferi oamenilor de știință suficient material. Dar cercetătorii au descoperit cum să reducă numărul de înregistrări necesare, care apoi scade la 3.500. Un număr care poate fi redus chiar și în unele cazuri la 300. Modele statistice avansate, inclusiv rețelele neuronale artificiale, apoi trec prin înregistrări. "Utilizați modele de vorbire cu anumiți parametri pentru a genera vorbire sintetică. Cu cât trebuie să începeți mai multe date, cu atât mai bine, dar puteți obține o calitate decentă din materiale relativ limitate", explică Jindrich. Matousek, un specialist în vorbire, care conduce proiectul în Pilsen. Sistemul lor funcționează pentru cehă, dar și pentru engleză, rusă și slovacă.