Estratégias de Escalonamento para Ambientes de Execução Guiada por Fluxo de Dados

membro de

orientado por

Leandro Augusto Justen Marzulo

produzido em

https://brcris.ibict.br/individual/cour_93743e92-8c10-4cee-b71d-bca2678bb7a6
CIÊNCIAS COMPUTACIONAIS Programa de Pós-Graduação

tipo

master thesis

autores

Rafael José do Nascimento Silva

abstrato

A Sucuri é uma biblioteca em Python que provê programação dataﬂow através de uma sintaxe razoavelmente simples. Ela permite uma execução transparente em clusters explorando de forma natural o paralelismo. Na Sucuri, o programador instancia o grafo dataﬂow, onde cada nó está associado a uma função e as arestas representam as dependências de dados entre os nós. A implementação original da Sucuri, utiliza um escalonador centralizado, que gera altos custos de comunicação, principalmente em clusters com um elevado número de máquinas. Neste trabalho nós modificamos a Sucuri de modo que cada máquina no cluster tenha seu próprio escalonador. Antes da execução, o Grafo dataﬂow é particionado e os nós são distribuídos entre as máquinas do cluster. Em tempo de execução os trabalhadores livres de cada máquina recebem tarefas da fila de prontos de seu escalonador local. Quando uma máquina termina de executar sua lista de nós, ela irá solicitar às outras máquinas, que estejam sobrecarregadas, parte das tarefas que estejam nas suas filas de prontos. Os resultados experimentais confirmam que a solução pode reduzir o tempo gasto com comunicação e aumentar o desempenho em grandes clusters
Sucuri is a minimalistic Python library that provides dataﬂow programming through a reasonably simple syntax. It allows transparent execution on computer clusters and natural exploitation of parallelism. In Sucuri, programmers instantiate a dataﬂow graph, where each node is assigned to a function and edges represent data dependencies between nodes. The original implementation of Sucuri adopts a centralized scheduler, which incurs high communication overheads, specially in clusters with a large number of machines. In this paper we modify Sucuri so that each machine in a cluster will have its own scheduler. Before execution, the dataﬂow graph is partitioned, so that nodes can be distributed among the machines of the cluster. In runtime, idle workers will grab tasks from a ready queue in their local scheduler. When a machine finishes running their list of nodes, it will request the other machines, which are overloaded, the tasks of their ready queue. Experimental results confirm that the solution can reduce communication overheads, improving performance in larger clusters

data de publicação

2016-01-01

prêmio patrocinado pela

Universidade do Estado do Rio de Janeiro- Organização

Estratégias de Escalonamento para Ambientes de Execução Guiada por Fluxo de Dados Documento

Visão geral

membro de

orientado por

produzido em

tipo

autores

abstrato

data de publicação

prêmio patrocinado pela

Pesquisas

áreas de investigação

palavras-chave

Identidade

identificador BrCris

identificador Capes

identificador Oasisbr