Advanced search options

Advanced Search Options 🞨

Browse by author name (“Author name starts with…”).

Find ETDs with:

in
/  
in
/  
in
/  
in

Written in Published in Earliest date Latest date

Sorted by

Results per page:

Sorted by: relevance · author · university · dateNew search

You searched for subject:(Fonemes). Showing records 1 – 2 of 2 total matches.

Search Limiters

Last 2 Years | English Only

No search limiters apply to these results.

▼ Search Limiters


Universitat Pompeu Fabra

1. Dzhambazov, Georgi. Knowledge-based probabilistic modeling for tracking lyrics in music audio signals.

Degree: Departament de Tecnologies de la Informació i les Comunicacions, 2017, Universitat Pompeu Fabra

La tesi aquí presentada proposa metodologies d’aprenentatge automàtic i processament de senyal per alinear automàticament el text d’una cançó amb el seu corresponent enregistrament d’àudio. La recerca duta a terme s’engloba en l’ampli camp de l’extracció d’informació musical (Music Information Retrieval o MIR). Dins aquest context la tesi pretén millorar algunes de les metodologies d’última generació del camp introduint coneixement específic de l’àmbit. L’objectiu d’aquest treball és dissenyar models que siguin capaços de detectar en la senyal d’àudio l’aspecte seqüencial d’un element particular dels textos musicals; els fonemes. Podem entendre la música com la composició de diversos elements entre els quals podem trobar el text. Els models que construïm tenen en compte el context complementari del text. El context són tots aquells aspectes musicals que complementen el text, dels quals hem utilitzat en aquest tesi: la estructura de la composició musical, la estructura de les frases melòdiques i els accents rítmics. Des d’aquesta prespectiva analitzem no només les característiques acústiques de baix nivell, que representen el timbre musical dels fonemes, sinó també les característiques d’alt nivell en les quals es fa patent el context complementari. En aquest treball proposem models probabilístics específics que representen com les transicions entre fonemes consecutius de veu cantanda es veuen afectats per diversos aspectes del context complementari. El context complementari que tractem aquí es desenvolupa en el temps en funció de les característiques particulars de cada tradició musical. Per tal de modelar aquestes característiques hem creat corpus i conjunts de dades de dues tradicions musicals que presenten una gran riquesa en aquest aspectes; la música de l’opera de Beijing i la música makam turc-otomana. Les dades són de diversos tipus; enregistraments d’àudio, partitures musicals i metadades. Des d’aquesta prespectiva els models proposats poden aprofitar-se tant de les dades en si mateixes com del coneixement específic de la tradició musical per a millorar els resultats de referència actuals. Com a resultat de referència prenem un reconeixedor de fonemes basat en models ocults de Markov (Hidden Markov Models o HMM), una metodologia abastament emprada per a detectar fonemes tant en la veu cantada com en la parlada. Presentem millores en els processos comuns dels reconeixedors de fonemes actuals, ajustant-los a les característiques de les tradicions musicals estudiades. A més de millorar els resultats de referència també dissenyem models probabilistics basats en xarxes dinàmiques de Bayes (Dynamic Bayesian Networks o DBN) que respresenten la relació entre la transició dels fonemes i el context complementari. Hem creat dos models diferents per dos aspectes del context complementari; la estructura de la frase melòdica (alt nivell) i la estructura mètrica (nivell subtil). En un dels models explotem el fet que la duració de les síl·labes depén de la seva posició en la frase… Advisors/Committee Members: [email protected] (authoremail), true (authoremailshow), Serra, Xavier (director), true (authorsendemail).

Subjects/Keywords: Signal processing; Machine learning; Music information retrieval; Singing voice; Lyrics; Lyrics-to-audio alignment; Phonemes; Music scores; Turkish makam music; Beijing Opera; Hidden Markov models; Dynamic Bayesian Networks; Processament de senyal; Extracció d’informació musical; Aprenentatge automàtic; Veu de cant; Text del la cançó; Alineament de text amb àudio; Fonemes; Partitura; Música makam turc-otomana; Opera de Beijing; Models ocults de Markov; Xarxes dinàmiques de Bayes; 62

Record DetailsSimilar RecordsGoogle PlusoneFacebookTwitterCiteULikeMendeleyreddit

APA · Chicago · MLA · Vancouver · CSE | Export to Zotero / EndNote / Reference Manager

APA (6th Edition):

Dzhambazov, G. (2017). Knowledge-based probabilistic modeling for tracking lyrics in music audio signals. (Thesis). Universitat Pompeu Fabra. Retrieved from http://hdl.handle.net/10803/404681

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

Chicago Manual of Style (16th Edition):

Dzhambazov, Georgi. “Knowledge-based probabilistic modeling for tracking lyrics in music audio signals.” 2017. Thesis, Universitat Pompeu Fabra. Accessed January 21, 2020. http://hdl.handle.net/10803/404681.

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

MLA Handbook (7th Edition):

Dzhambazov, Georgi. “Knowledge-based probabilistic modeling for tracking lyrics in music audio signals.” 2017. Web. 21 Jan 2020.

Vancouver:

Dzhambazov G. Knowledge-based probabilistic modeling for tracking lyrics in music audio signals. [Internet] [Thesis]. Universitat Pompeu Fabra; 2017. [cited 2020 Jan 21]. Available from: http://hdl.handle.net/10803/404681.

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

Council of Science Editors:

Dzhambazov G. Knowledge-based probabilistic modeling for tracking lyrics in music audio signals. [Thesis]. Universitat Pompeu Fabra; 2017. Available from: http://hdl.handle.net/10803/404681

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

2. Larsson, Johan P. Modelling neuronal mechanisms of the processing of tones and phonemes in the higher auditory system.

Degree: Departament de Tecnologies de la Informació i les Comunicacions, 2012, Universitat Pompeu Fabra

Se ha investigado mucho tanto los mecanismos neuronales básicos de la audición como la organización psicológica de la percepción del habla. Sin embargo, en ambos temas hay una relativa escasez en cuanto a modelización. Aquí describimos dos trabajos de modelización. Uno propone un nuevo mecanismo de mejora de selectividad de frecuencias que explica resultados de experimentos neurofisiológicos investigando manifestaciones de forward masking y sobre todo auditory streaming en la corteza auditiva principal (A1). El mecanismo funciona en una red feed-forward con depresión sináptica entre el tálamo y la corteza, pero mostramos que es robusto a la introducción de una organización realista del circuito de A1, que a su vez explica cantidad de datos neurofisiológicos. El otro trabajo describe un mecanismo candidato de explicar el hallazgo en estudios psicofísicos de diferencias en la percepción de palabras entre bilinguës tempranos y simultáneos. Simulando tareas de decisión léxica y discriminación de fonemas, fortalecemos la hipótesis de que personas expuestas a menudo a variaciones dialectales de palabras pueden guardar éstas en su léxico, sin alterar representaciones fonémicas. Advisors/Committee Members: [email protected] (authoremail), true (authoremailshow), Deco, Gustavo (director), Montbrió, Ernest (director), true (authorsendemail).

Subjects/Keywords: Modelatge neuronal; Hodgkin-Huxley; Integrate-and-Fire; Xarxa atractor; Depressió sinàptica; Auditory streaming; Escorça auditiva; A1; Forward masking; Co-tuning; Tasca de decisió lèxica; Discriminació de fonemes; Bilingüisme; Neural Modelling; Attractor network; Synaptic depression; Auditory cortex; Lexical decision task; Phoneme discrimination; Bilingualism; 616.8

Record DetailsSimilar RecordsGoogle PlusoneFacebookTwitterCiteULikeMendeleyreddit

APA · Chicago · MLA · Vancouver · CSE | Export to Zotero / EndNote / Reference Manager

APA (6th Edition):

Larsson, J. P. (2012). Modelling neuronal mechanisms of the processing of tones and phonemes in the higher auditory system. (Thesis). Universitat Pompeu Fabra. Retrieved from http://hdl.handle.net/10803/97293

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

Chicago Manual of Style (16th Edition):

Larsson, Johan P. “Modelling neuronal mechanisms of the processing of tones and phonemes in the higher auditory system.” 2012. Thesis, Universitat Pompeu Fabra. Accessed January 21, 2020. http://hdl.handle.net/10803/97293.

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

MLA Handbook (7th Edition):

Larsson, Johan P. “Modelling neuronal mechanisms of the processing of tones and phonemes in the higher auditory system.” 2012. Web. 21 Jan 2020.

Vancouver:

Larsson JP. Modelling neuronal mechanisms of the processing of tones and phonemes in the higher auditory system. [Internet] [Thesis]. Universitat Pompeu Fabra; 2012. [cited 2020 Jan 21]. Available from: http://hdl.handle.net/10803/97293.

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

Council of Science Editors:

Larsson JP. Modelling neuronal mechanisms of the processing of tones and phonemes in the higher auditory system. [Thesis]. Universitat Pompeu Fabra; 2012. Available from: http://hdl.handle.net/10803/97293

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

.