Advanced search options

Advanced Search Options 🞨

Browse by author name (“Author name starts with…”).

Find ETDs with:

in
/  
in
/  
in
/  
in

Written in Published in Earliest date Latest date

Sorted by

Results per page:

Sorted by: relevance · author · university · dateNew search

You searched for +publisher:"Paris, ENST" +contributor:("Michiardi, Pietro"). Showing records 1 – 3 of 3 total matches.

Search Limiters

Last 2 Years | English Only

No search limiters apply to these results.

▼ Search Limiters

1. Pastorelli, Mario. Disciplines basées sur la taille pour la planification des jobs dans data-intensif scalable computing systems : Size-based disciplines for job scheduling in data-intensive scalable computing systems.

Degree: Docteur es, Informatique et réseaux, 2014, Paris, ENST

La dernière décennie a vu l’émergence de systèmes parallèles pour l’analyse de grosse quantités de données (DISC) , tels que Hadoop, et la demande qui en résulte pour les politiques de gestion des ressources, pouvant fournir des temps de réponse rapides ainsi qu’équité. Actuellement, les schedulers pour les systèmes de DISC sont axées sur l’équité, sans optimiser les temps de réponse. Les meilleures pratiques pour surmonter ce problème comprennent une intervention manuelle et une politique de planification ad-hoc , qui est sujette aux erreurs et qui est difficile à adapter aux changements. Dans cette thèse, nous nous concentrons sur la planification basée sur la taille pour les systèmes DISC. La principale contribution de ce travail est le scheduler dit Hadoop Fair Sojourn Protocol (HFSP), un ordonnanceur préemptif basé sur la taille qui tient en considération le vieillissement, ayant comme objectifs de fournir l’équité et des temps de réponse réduits. Hélas, dans les systèmes DISC, les tailles des job d’analyse de données ne sont pas connus a priori, donc, HFSP comprends un module d’estimation de taille, qui calcule une approximation et qui affine cette estimation au fur et a mesure du progrès d’un job. Nous démontrons que l’impact des erreurs d’estimation sur les politiques fondées sur la taille n’est pas significatif. Pour cette raison, et en vertu d’être conçu autour de l’idée de travailler avec des tailles estimées, HFSP est tolérant aux erreurs d’estimation de la taille des jobs. Nos résultats expérimentaux démontrent que, dans un véritable déploiement Hadoop avec des charges de travail réalistes, HFSP est plus performant que les politiques de scheduling existantes, a la fois en terme de temps de réponse et d’équité. En outre, HFSP maintiens ses bonnes performances même lorsque le cluster de calcul est lourdement chargé, car il focalises les ressources sur des jobs ayant priorité. HFSP est une politique préventive: la préemption dans un système DISC peut être mis en œuvre avec des techniques différentes. Les approches actuellement disponibles dans Hadoop ont des lacunes qui ont une incidence sur les performances du système. Par conséquence, nous avons mis en œuvre une nouvelle technique de préemption, appelé suspension, qui exploite le système d’exploitation pour effectuer la préemption d’une manière qui garantie une faible latence sans pénaliser l’avancement des jobs a faible priorité.

The past decade have seen the rise of data-intensive scalable computing (DISC) systems, such as Hadoop, and the consequent demand for scheduling policies to manage their resources, so that they can provide quick response times as well as fairness. Schedulers for DISC systems are usually focused on the fairness, without optimizing the response times. The best practices to overcome this problem include a manual and ad-hoc control of the scheduling policy, which is error-prone and difficult to adapt to changes. In this thesis we focus on size-based scheduling for DISC systems. The main contribution of this work is the Hadoop…

Advisors/Committee Members: Michiardi, Pietro (thesis director).

Subjects/Keywords: Système distribué; Planification des tâches par taille; MapReduce; Distributed system; Size-based job scheduling; MapReduce

Record DetailsSimilar RecordsGoogle PlusoneFacebookTwitterCiteULikeMendeleyreddit

APA · Chicago · MLA · Vancouver · CSE | Export to Zotero / EndNote / Reference Manager

APA (6th Edition):

Pastorelli, M. (2014). Disciplines basées sur la taille pour la planification des jobs dans data-intensif scalable computing systems : Size-based disciplines for job scheduling in data-intensive scalable computing systems. (Doctoral Dissertation). Paris, ENST. Retrieved from http://www.theses.fr/2014ENST0048

Chicago Manual of Style (16th Edition):

Pastorelli, Mario. “Disciplines basées sur la taille pour la planification des jobs dans data-intensif scalable computing systems : Size-based disciplines for job scheduling in data-intensive scalable computing systems.” 2014. Doctoral Dissertation, Paris, ENST. Accessed February 23, 2019. http://www.theses.fr/2014ENST0048.

MLA Handbook (7th Edition):

Pastorelli, Mario. “Disciplines basées sur la taille pour la planification des jobs dans data-intensif scalable computing systems : Size-based disciplines for job scheduling in data-intensive scalable computing systems.” 2014. Web. 23 Feb 2019.

Vancouver:

Pastorelli M. Disciplines basées sur la taille pour la planification des jobs dans data-intensif scalable computing systems : Size-based disciplines for job scheduling in data-intensive scalable computing systems. [Internet] [Doctoral dissertation]. Paris, ENST; 2014. [cited 2019 Feb 23]. Available from: http://www.theses.fr/2014ENST0048.

Council of Science Editors:

Pastorelli M. Disciplines basées sur la taille pour la planification des jobs dans data-intensif scalable computing systems : Size-based disciplines for job scheduling in data-intensive scalable computing systems. [Doctoral Dissertation]. Paris, ENST; 2014. Available from: http://www.theses.fr/2014ENST0048

2. Sha, Xiaolan. Personnalisation du contenu et tendances dans les médias sociaux : Personalizing trending content in social media.

Degree: Docteur es, Informatique et réseaux, 2013, Paris, ENST

En fonction des connexions entre utilisateurs de ces réseaux, certains contenus peuvent bénéficier d’une large audience et tout d’un coup se transformer en tendance. Comprendre comment du contenu peut se transformer en tendance est donc crucial pour pouvoir expliquer la propagation des opinions ainsi que pour établir des stratégies de marketing sociale. Les précédentes études se sont concentrées sur les caractéristiques du contenu pouvant se transformer en tendance et sur la structure du réseau d’individus dans les médias sociaux. Ce travail complète ces études en explorant les facteurs humains derrières la génération du contenu tendance. Nous nous appuyons sur cette analyse pour définir de nouveaux outils de personnalisation permettant aux individus de repérer le contenu qui les intéresse dans les médias sociaux. Les contributions de ce travail sont les suivantes:une analyse approfondie des individus créant du contenu tendance dans les médias sociaux ce qui permet de découvrir leurs caractéristiques distinctives; un nouveau moyen d’identifier le contenu tendance en s’appuyant sur la capacité des individus spéciaux qui le créent; un mécanisme d’élaboration de système de recommandation afin de personnaliser le contenu tendance.; et des techniques d’amélioration de la qualité des recommandations allant au-delà de la seule évaluation de la précision. Nos études montrent le rôle vital de certains utilisateurs spéciaux dans la création de contenu tendance dans les médias sociaux. Ces utilisateurs avec leur sagesse permettent aux autres individus de découvrir du contenu tendance à leur goût.

Fluctuating along user connections, some content succeeds at capturing the attention of a large amount of users and suddenly becomes trending. Understanding trending content and its dynamics is crucial to the explanation of opinion spreading, and to the design of social marketing strategies. While previous research has mostly focused on trending content and on the network structure of individuals in social media, this work complements these studies by exploring in depth the human factors behind the generation of this content. We build upon this analysis to investigate new personalization tools helping individuals to discover interesting social media content. This work contributes to the literature on the following aspects: an in depth analysis on individuals who create trending content in social media that uncovers their distinguishing characteristics; a novel means to identify trending content by relying on the ability of special individuals who create them; a mechanism to build a recommender system to personalize trending content; and techniques to improve the quality of recommendations beyond the core theme of accuracy. Our studies underline the vital role of special users in the creation of trending content in social media. Thanks to such special users and their ``wisdom'', individuals may discover the trending content distilled to their tastes. Our work brings insights in two main research directions - trending content in…

Advisors/Committee Members: Michiardi, Pietro (thesis director).

Subjects/Keywords: Médias sociaux; Sérendipité; Social media; Serendipity

Record DetailsSimilar RecordsGoogle PlusoneFacebookTwitterCiteULikeMendeleyreddit

APA · Chicago · MLA · Vancouver · CSE | Export to Zotero / EndNote / Reference Manager

APA (6th Edition):

Sha, X. (2013). Personnalisation du contenu et tendances dans les médias sociaux : Personalizing trending content in social media. (Doctoral Dissertation). Paris, ENST. Retrieved from http://www.theses.fr/2013ENST0026

Chicago Manual of Style (16th Edition):

Sha, Xiaolan. “Personnalisation du contenu et tendances dans les médias sociaux : Personalizing trending content in social media.” 2013. Doctoral Dissertation, Paris, ENST. Accessed February 23, 2019. http://www.theses.fr/2013ENST0026.

MLA Handbook (7th Edition):

Sha, Xiaolan. “Personnalisation du contenu et tendances dans les médias sociaux : Personalizing trending content in social media.” 2013. Web. 23 Feb 2019.

Vancouver:

Sha X. Personnalisation du contenu et tendances dans les médias sociaux : Personalizing trending content in social media. [Internet] [Doctoral dissertation]. Paris, ENST; 2013. [cited 2019 Feb 23]. Available from: http://www.theses.fr/2013ENST0026.

Council of Science Editors:

Sha X. Personnalisation du contenu et tendances dans les médias sociaux : Personalizing trending content in social media. [Doctoral Dissertation]. Paris, ENST; 2013. Available from: http://www.theses.fr/2013ENST0026

3. Tian, Yongchao. Acc?ler la pr?paration des donn?es pour l'analyse du big data : Accelerating data preparation for big data analytics.

Degree: Docteur es, Informatique et r?seaux, 2017, Paris, ENST

Nous vivons dans un monde de big data, o? les donn?es sont g?n?r?es en grand volume, grande vitesse et grande vari?t?. Le big data apportent des valeurs et des avantages ?normes, de sorte que l?analyse des donn?es est devenue un facteur essentiel de succ?s commercial dans tous les secteurs. Cependant, si les donn?es ne sont pas analys?es assez rapidement, les b?n?fices de big data seront limit?s ou m?me perdus. Malgr? l?existence de nombreux syst?mes modernes d?analyse de donn?es ? grande ?chelle, la pr?paration des donn?es est le processus le plus long de l?analyse des donn?es, n?a pas encore re?u suffisamment d?attention. Dans cette th?se, nous ?tudions le probl?me de la fa?on d?acc?l?rer la pr?paration des donn?es pour le big data d?analyse. En particulier, nous nous concentrons sur deux grandes ?tapes de pr?paration des donn?es, le chargement des donn?es et le nettoyage des donn?es. Comme premi?re contribution de cette th?se, nous concevons DiNoDB, un syst?me SQL-on-Hadoop qui r?alise l?ex?cution de requ?tes ? vitesse interactive sans n?cessiter de chargement de donn?es. Les applications modernes impliquent de lourds travaux de traitement par lots sur un grand volume de donn?es et n?cessitent en m?me temps des analyses interactives ad hoc efficaces sur les donn?es temporaires g?n?r?es dans les travaux de traitement par lots. Les solutions existantes ignorent largement la synergie entre ces deux aspects, n?cessitant de charger l?ensemble des donn?es temporaires pour obtenir des requ?tes interactives. En revanche, DiNoDB ?vite la phase co?teuse de chargement et de transformation des donn?es. L?innovation importante de DiNoDB est d?int?grer ? la phase de traitement par lots la cr?ation de m?tadonn?es que DiNoDB exploite pour acc?l?rer les requ?tes interactives. La deuxi?me contribution est un syst?me de flux distribu? de nettoyage de donn?es, appel? Bleach. Les approches de nettoyage de donn?es ?volutives existantes s?appuient sur le traitement par lots pour am?liorer la qualit? des donn?es, qui demandent beaucoup de temps. Nous ciblons le nettoyage des donn?es de flux dans lequel les donn?es sont nettoy?es progressivement en temps r?el. Bleach est le premier syst?me de nettoyage qualitatif de donn?es de flux, qui r?alise ? la fois la d?tection des violations en temps r?el et la r?paration des donn?es sur un flux de donn?es sale. Il s?appuie sur des structures de donn?es efficaces, compactes et distribu?es pour maintenir l??tat n?cessaire pour nettoyer les donn?es et prend ?galement en charge la dynamique des r?gles. Nous d?montrons que les deux syst?mes r?sultants, DiNoDB et Bleach, ont tous deux une excellente performance par rapport aux approches les plus avanc?es dans nos ?valuations exp?rimentales, et peuvent aider les chercheurs ? r?duire consid?rablement leur temps consacr? ? la pr?paration des donn?es.

We are living in a big data world, where data is being generated in high volume, high velocity and high variety. Big data brings enormous values and benefits, so that data analytics has become a critically…

Advisors/Committee Members: Vukolic, Marko (thesis director), Michiardi, Pietro (thesis director).

Subjects/Keywords: Big data; Base de donn?es; Syst?me distribu?; Nettoyage de donn?es; Big data; Database; Distributed system; Data cleaning

Record DetailsSimilar RecordsGoogle PlusoneFacebookTwitterCiteULikeMendeleyreddit

APA · Chicago · MLA · Vancouver · CSE | Export to Zotero / EndNote / Reference Manager

APA (6th Edition):

Tian, Y. (2017). Acc?ler la pr?paration des donn?es pour l'analyse du big data : Accelerating data preparation for big data analytics. (Doctoral Dissertation). Paris, ENST. Retrieved from http://www.theses.fr/2017ENST0017

Chicago Manual of Style (16th Edition):

Tian, Yongchao. “Acc?ler la pr?paration des donn?es pour l'analyse du big data : Accelerating data preparation for big data analytics.” 2017. Doctoral Dissertation, Paris, ENST. Accessed February 23, 2019. http://www.theses.fr/2017ENST0017.

MLA Handbook (7th Edition):

Tian, Yongchao. “Acc?ler la pr?paration des donn?es pour l'analyse du big data : Accelerating data preparation for big data analytics.” 2017. Web. 23 Feb 2019.

Vancouver:

Tian Y. Acc?ler la pr?paration des donn?es pour l'analyse du big data : Accelerating data preparation for big data analytics. [Internet] [Doctoral dissertation]. Paris, ENST; 2017. [cited 2019 Feb 23]. Available from: http://www.theses.fr/2017ENST0017.

Council of Science Editors:

Tian Y. Acc?ler la pr?paration des donn?es pour l'analyse du big data : Accelerating data preparation for big data analytics. [Doctoral Dissertation]. Paris, ENST; 2017. Available from: http://www.theses.fr/2017ENST0017

.