Advanced search options

Advanced Search Options 🞨

Browse by author name (“Author name starts with…”).

Find ETDs with:

in
/  
in
/  
in
/  
in

Written in Published in Earliest date Latest date

Sorted by

Results per page:

Sorted by: relevance · author · university · dateNew search

You searched for subject:(Segmentation Linguistique ). Showing records 1 – 3 of 3 total matches.

Search Limiters

Last 2 Years | English Only

No search limiters apply to these results.

▼ Search Limiters


Université Laval

1. Roshani, Asra. Unsupervised segmentation of sequences using harmony search and hierarchical clustering techniques.

Degree: 2014, Université Laval

Dans le contexte de traitement automatique du langage naturel, les données le plus souvent sont présentées comme une longue séquence de caractères discrets. Donc, l'identification d'un modèle intéressant dans la longue séquence peut être une tâche difficile. En conséquence, la segmentation automatique de données serait extrêmement utile pour extraire les sous-séquences et les morceaux significatifs à partir d'une longue séquence de données. La segmentation de données est l'une des étapes de prétraitement les plus importantes dans plusieurs tâches de traitement du langage naturel. La segmentation de mots est considérée comme la tâche de trouver des morceaux significatifs dans le corpus de textes. L'objectif principal de cette étude est de présenter une technique de segmentation hiérarchique non supervisée en utilisant l'algorithme de recherche d'harmonie (Harmony Search algorithm) qui est une approche d'optimisation méta-heuristique. Dans la technique proposée, la tâche de segmentation de mots est réalisée à l'aide d'une recherche d'harmonie binaire (Binary Harmony search) qui une forme particulière de l'algorithme de recherche d'harmonie. La construction et la formation de modèles de langue sont accomplies par un lexique hiérarchique et un algorithme de Baum-Welch. De plus, pour améliorer la performance et la convergence de la recherche de l'harmonie binaire, quelques modifications innovantes sont appliquées. En général, cette étude présente un algorithme de segmentation de mots hiérarchique non supervisée basée sur une méthode recherche de l'harmonie et examine toutes les questions relatives y compris: la segmentation de mots représentées en format binaire, l'harmonie binaire, l'amélioration de la procédure de l'ajustement du lancement, la définition de la fonction objective en recherche d'harmonie et la politique de pénalité. La performance de l'algorithme est évaluée selon la précision de la segmentation, le rappel, la F-mesure et le temps d'exécution de l'algorithme. Une partie du corpus Moby Dick est utilisée comme étude de cas. Nos expérimentations montrent que l'approche de segmentation basée sur une recherche d'harmonie fournit plusieurs de bons segments, mais qu'il nécessite un long temps d'exécution.

In the context of natural language processing, data is presented most of the time as a long sequence of discrete characters. Therefore, identifying interesting patterns within the long sequence can be a challenging task. Consequently, automatic segmentation of data would be extremely useful to extract the meaningful sub-sequences and chunks from a long data sequence. Segmentation of raw data is one of the most important preprocessing steps in many natural language processing tasks. Word segmentation is considered as the task of finding meaningful chunks, i.e. words, within a text corpus. The main objective of this study is to present an unsupervised hierarchical segmentation technique using Harmony Search algorithm which is a meta-heuristic optimization approach. In the proposed technique, the word…

Advisors/Committee Members: Lamontagne, Luc D..

Subjects/Keywords: QA 76.05 UL 2014; Segmentation (Linguistique)  – Informatique; Harmonie (Système d'information)

Record DetailsSimilar RecordsGoogle PlusoneFacebookTwitterCiteULikeMendeleyreddit

APA · Chicago · MLA · Vancouver · CSE | Export to Zotero / EndNote / Reference Manager

APA (6th Edition):

Roshani, A. (2014). Unsupervised segmentation of sequences using harmony search and hierarchical clustering techniques. (Thesis). Université Laval. Retrieved from http://hdl.handle.net/20.500.11794/25350

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

Chicago Manual of Style (16th Edition):

Roshani, Asra. “Unsupervised segmentation of sequences using harmony search and hierarchical clustering techniques.” 2014. Thesis, Université Laval. Accessed August 22, 2019. http://hdl.handle.net/20.500.11794/25350.

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

MLA Handbook (7th Edition):

Roshani, Asra. “Unsupervised segmentation of sequences using harmony search and hierarchical clustering techniques.” 2014. Web. 22 Aug 2019.

Vancouver:

Roshani A. Unsupervised segmentation of sequences using harmony search and hierarchical clustering techniques. [Internet] [Thesis]. Université Laval; 2014. [cited 2019 Aug 22]. Available from: http://hdl.handle.net/20.500.11794/25350.

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

Council of Science Editors:

Roshani A. Unsupervised segmentation of sequences using harmony search and hierarchical clustering techniques. [Thesis]. Université Laval; 2014. Available from: http://hdl.handle.net/20.500.11794/25350

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation


Université du Québec à Montréal

2. Babineau, Mireille. Les mécanismes impliqués dans la segmentation des mots lors de l'acquisition langagière : le cas de la liaison en français.

Degree: 2016, Université du Québec à Montréal

Cette thèse examine les mécanismes utilisés lors de la segmentation de la parole et la manière dont les enfants et les adultes francophones résolvent l'ambiguïté lexicale. De nombreuses études ont démontré que les bébés utilisent différents indices de segmentation, tels que les indices statistiques, phonotactiques et acoustiques (Curtin, Mintz, et Byrd, 2001; Jusczyk, Houston, et Newsome, 1999; Mattys et Jusczyk, 2001a; Saffran, Aslin, et Newport, 1996; Shi, Cutler, Werker, et Cruickshank, 2006; Shi et Lepage, 2008). Les adultes sont aussi sensibles à divers indices statistiques, phonotactiques et prosodiques (par ex., Saffran, Newport et Aslin, 1996). Dans la présente thèse, nous nous sommes particulièrement intéressées à la forme lexicale encodée lorsqu'un pseudo-nom à voyelle initiale est présenté dans un ou plusieurs contextes de non-alignement (liaison; enchaînement). Le non alignement de la frontière du mot et de la syllabe en lien avec la liaison (par ex., les amis-> [le.zami]) peut poser un défi important pour la segmentation. L'étude du traitement de la liaison permet de déterminer le poids des différents indices de segmentation. Elle permet également de rendre compte des divers mécanismes favorisés par le système cognitif au fil du développement. Nous avons tout d'abord investigué les indices de segmentation utilisés par les adultes francophones. Nos résultats démontrent que l'utilisation des indices acoustiques distinguant les contextes de liaison (par ex., les beaux/z/inveurs) de ceux impliquant un mot à consonne initiale (par ex., les beaux zinveurs) est contrainte par le contexte syntaxique (c.-à-d. suite aux mots de contenu, mais pas suite aux mots de fonction tel que ces onches versus ces zonches). Ces résultats concordent avec le modèle hiérarchique proposé par Mattys, Laurence et Melhorn (2005) selon lequel les auditeurs favorisent les indices de type descendant au détriment des indices ascendants. Afin d'investiguer la forme lexicale encodée par les jeunes enfants, nous avons utilisé la procédure de regard préférentiel. Une série d'expériences perceptuelles a permis d'investiguer si la forme à voyelle initiale d'un pseudo-mot pouvaient être inférée à partir de contextes variables (par ex., ces/z/onches, un/n/onche, petit/t/onche, premier/r/onche). Nos résultats indiquent que vers l'âge de 24 mois les enfants apprennent à utiliser les indices statistiques sous-syllabiques à partir de contextes variables de liaison, ce qui leur permet d'acquérir une connaissance quant aux consonnes de liaison. Ils arrivent donc à extraire la forme à voyelle initiale, malgré la forme de surface à consonne initiale. De plus, les consonnes pouvant être utilisées comme des unités statistiques sous-syllabiques sont toujours limitées aux consonnes de liaison, excluant la possibilité que des paires minimales (par ex., chonche, guonche, ponche, vonche) puissent être erronément segmentées et liées entre elles. Les enfants de 20 mois n'ont pas encore développé cette sensibilité aux indices statistiques…

Subjects/Keywords: Segmentation (Linguistique); Reconnaissance des mots; Français (Langue)  – Prononciation; Français (Langue)  – Acquisition

Record DetailsSimilar RecordsGoogle PlusoneFacebookTwitterCiteULikeMendeleyreddit

APA · Chicago · MLA · Vancouver · CSE | Export to Zotero / EndNote / Reference Manager

APA (6th Edition):

Babineau, M. (2016). Les mécanismes impliqués dans la segmentation des mots lors de l'acquisition langagière : le cas de la liaison en français. (Thesis). Université du Québec à Montréal. Retrieved from http://archipel.uqam.ca/9367/1/D3184.pdf

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

Chicago Manual of Style (16th Edition):

Babineau, Mireille. “Les mécanismes impliqués dans la segmentation des mots lors de l'acquisition langagière : le cas de la liaison en français.” 2016. Thesis, Université du Québec à Montréal. Accessed August 22, 2019. http://archipel.uqam.ca/9367/1/D3184.pdf.

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

MLA Handbook (7th Edition):

Babineau, Mireille. “Les mécanismes impliqués dans la segmentation des mots lors de l'acquisition langagière : le cas de la liaison en français.” 2016. Web. 22 Aug 2019.

Vancouver:

Babineau M. Les mécanismes impliqués dans la segmentation des mots lors de l'acquisition langagière : le cas de la liaison en français. [Internet] [Thesis]. Université du Québec à Montréal; 2016. [cited 2019 Aug 22]. Available from: http://archipel.uqam.ca/9367/1/D3184.pdf.

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

Council of Science Editors:

Babineau M. Les mécanismes impliqués dans la segmentation des mots lors de l'acquisition langagière : le cas de la liaison en français. [Thesis]. Université du Québec à Montréal; 2016. Available from: http://archipel.uqam.ca/9367/1/D3184.pdf

Note: this citation may be lacking information needed for this citation format:
Not specified: Masters Thesis or Doctoral Dissertation

3. Longo, Laurence. Vers des moteurs de recherche "intelligents" : un outil de détection automatique de thèmes : méthode basée sur l'identification automatique des chaînes de référence : Toward "intelligent" search engines : an automatic topic detection tool : method based on automatic reference chains identification.

Degree: Docteur es, Sciences du langage, 2013, Université de Strasbourg

Cette thèse se situe dans le domaine du Traitement Automatique des Langues et vise à optimiser la classification des documents dans les moteurs de recherche. Les travaux se concentrent sur le développement d’un outil de détection automatique des thèmes des documents (ATDS-fr). Utilisant peu de connaissances, la méthode hybride adoptée allie des techniques statistiques de segmentation thématique à des méthodes linguistiques identifiant des marqueurs de cohésion. Parmi eux, les chaînes de référence – séquence d’expressions référentielles se rapportant à la même entité du discours (e.g. Paul…il…cet homme) – ont fait l’objet d’une attention particulière, car elles constituent un indice textuel important dans la détection des thèmes (i.e. ce sont des marqueurs d’introduction, de maintien et de changement thématique). Ainsi, à partir d’une étude des chaînes de référence menée dans un corpus issu de genres textuels variés (analyses politiques, rapports publics, lois européennes,éditoriaux, roman), nous avons développé un module d’identification automatique des chaînes de référence RefGen qui a été évalué suivant les métriques actuelles de la coréférence.

This thesis in the field of Natural Language Processing aims at optimizing documents classification in search engines. This work focuses on the development of a tool that automatically detects documents topics (ATDS-fr). Using poor knowledge, the hybrid method combines statistical techniques for topic segmentation and linguistic methods that identify cohesive markers. Among them, reference chains - sequences of referential expressions referring to the same entity (e.g. Paul ... he ... this man) - have been given special attention as they are important topic markers (i.e. they are markers of topic introduction, maintenance and change). Thus, from a study of reference chains extracted from a corpus composed of various textual genres (newspapers, public reports, European laws, editorials and novel) we developed RefGen, an automatic reference chains identification module, which was evaluated according to current coreference metrics.

Advisors/Committee Members: Schnedecker, Catherine (thesis director), Todiraşcu-Courtier, Amalia (thesis director).

Subjects/Keywords: Détection automatique de thèmes; Chaînes de référence; Traitement automatique des langues; Sémantique lexicale; Coréférence; Genres textuels; Segmentation thématique; Marqueurs linguistiques; Cohésion; Linguistique de corpus; Topic detection; Reference chains; Natural language processing; Lexical semantics; Coreference; Textual genre; Topic segmentation; Linguistic markers; Cohesion; Corpus linguistics; 401.4; 004.678

Record DetailsSimilar RecordsGoogle PlusoneFacebookTwitterCiteULikeMendeleyreddit

APA · Chicago · MLA · Vancouver · CSE | Export to Zotero / EndNote / Reference Manager

APA (6th Edition):

Longo, L. (2013). Vers des moteurs de recherche "intelligents" : un outil de détection automatique de thèmes : méthode basée sur l'identification automatique des chaînes de référence : Toward "intelligent" search engines : an automatic topic detection tool : method based on automatic reference chains identification. (Doctoral Dissertation). Université de Strasbourg. Retrieved from http://www.theses.fr/2013STRAC041

Chicago Manual of Style (16th Edition):

Longo, Laurence. “Vers des moteurs de recherche "intelligents" : un outil de détection automatique de thèmes : méthode basée sur l'identification automatique des chaînes de référence : Toward "intelligent" search engines : an automatic topic detection tool : method based on automatic reference chains identification.” 2013. Doctoral Dissertation, Université de Strasbourg. Accessed August 22, 2019. http://www.theses.fr/2013STRAC041.

MLA Handbook (7th Edition):

Longo, Laurence. “Vers des moteurs de recherche "intelligents" : un outil de détection automatique de thèmes : méthode basée sur l'identification automatique des chaînes de référence : Toward "intelligent" search engines : an automatic topic detection tool : method based on automatic reference chains identification.” 2013. Web. 22 Aug 2019.

Vancouver:

Longo L. Vers des moteurs de recherche "intelligents" : un outil de détection automatique de thèmes : méthode basée sur l'identification automatique des chaînes de référence : Toward "intelligent" search engines : an automatic topic detection tool : method based on automatic reference chains identification. [Internet] [Doctoral dissertation]. Université de Strasbourg; 2013. [cited 2019 Aug 22]. Available from: http://www.theses.fr/2013STRAC041.

Council of Science Editors:

Longo L. Vers des moteurs de recherche "intelligents" : un outil de détection automatique de thèmes : méthode basée sur l'identification automatique des chaînes de référence : Toward "intelligent" search engines : an automatic topic detection tool : method based on automatic reference chains identification. [Doctoral Dissertation]. Université de Strasbourg; 2013. Available from: http://www.theses.fr/2013STRAC041

.