Banco de dados
Por: SonSolimar • 14/9/2017 • 1.964 Palavras (8 Páginas) • 618 Visualizações
...
Para a resolução de um modelo de rede de filas, deve se encontrar o solução em forma fechada para a função de geração (também conhecido como a constante de normalização) L(M) , onde M = ( m1 , m2 , ..., mR ) para as classes de R emprego com Mi empregos nas classes Ith. Todas as estatisticas/probabilidades de medidas de desempenho podem então ser deriv' adas a partir de G(M).
No decorrer dos resultados vão sendo mostradas outras equações, como por exemplo:
[pic 1]
onde ( M - 1 r ) é o mesmo que M mas com um trabalho levado da classe rth e Eir é a relação visita de um trabalho da classe rth no nó Ith. A segunda igualdade é válida quando a migração do trabalho não é permitida.
4. Modelo de sistema
Na figura abaixo é mostrado um modelo de rede de filas fechada composta por 2 R + 3 nodos de filas interconectada. As caixas de R pontilhada modelo de R núcleos superiores. Em cada núcleo, há dois nós na fila, um modelos de unidade de processamento central de núcleo (CPU) com taxa de serviço média μCPUi para o nucleo ith e o outro núcleo um cache privado com taxa de serviço média μ h,i.
[pic 2]
No geral, tem-se μcpu,i = μcpu,i(Ci,mi, ki), onde Ci, mi, e ki são o tamanho do nucleo, número de segmentos de hardware e número de hardware ativos para núcleo i, respectivamente. Uma vez que cada segmento de hardware consome uma certa quantidade de área do core, algo em torno de ε = 5-6%, μCPUi é um função decrescente de mI . Para um nucleo fine-grain ou coarse-grain, μCPUi, é independente de ki. Por outro lado, para um núcleo SMT, μCPUi é em geral uma função crescente do ki, devido ao potencial de compartilhamento de recursos de unidades funcionais entre segmentos ativos como ki aumenta. Em geral, a melhoria em μCPUi como irá reduzir ki torna-se grande.
5. Resultados e analises
Nessa parte são apresentados os resultados, mas sem provas. O interesse dos escritos desse artigo que está sendo resumido, é de apenas no limite de desempenho que pode ser avaliado analiticamente. Para este fim, é assumido que a caraceteristica da carga de trabalho para a parte paralelizável do programa mapeado para diferentes núcleos são os mesmos. Então tem-se pch,i = pch, pcs,i = pcs, e μh,i = μh. Sem perda de generalidade, assume-se ainda que um núcleo para o núcleo R - 1 são núcleos simétricos e núcleo R é um nucleo assimetrico. Então, novamente tem-se mi = mp, ph,i = ph(Cp,m), μcpu,i = μcpu(Cp,m)f (ki) (i = 1, 2, . . . , R − 1) para nucleos simetricos, e mR = ma, ph,R = ph(Ca,ma), e μcpu,R = μcpu(Ca,m)f (kR) para nucleos assimetricos.
No resultado um, para forte carga de trabalho ligada à memória, tanto a dinâmica como modelos assimétricos podem acelerar a parte seqüencial da carga de trabalho, principalmente por meio do aumento do tamanho do cache no núcleo assimétrico, não a taxa de serviço de core (ou seja, μcpu(Cs,ms, 1)). Agora serão exibidos resultados das equações.
No resultado dois, para forte carga de trabalho vinculado à CPU, tanto nos modelos dinâmico e assimetrico de métricas, podem acelerar a parte seqüencial da carga de trabalho usando núcleos com contagens da linha de baixo por núcleo. Note-se que para os modelos assimétricos e simétricos, deve-se ter cautela para equilibrar os aumentos de velocidade da parte seqüencial e a parte paralelizável da carga de trabalho para alcançar o melhor desempenho global acelerar.
No resultado três a aceleração super linear é alcançável quando tópicos expostos em afinidade de cache, a carga de trabalho é forte, e há contenção de recursos entre os segmentos.
No resultado quatro para forte carga de trabalho vinculado à CPU, a dinâmica e simetria dos modelos com núcleos de single-threaded de um BCE oferece a mais alta escala desempenho.
No resultado cinco o aumento de velocidade para uma MMP já não pode ser prevista pelos Modelo de escala de Amdahl, que só é dependente do processamento de contagens de unidade e a porcentagem de carga de trabalho paralelizável.
No resultado seis um termo sequencial surge quando há contenção de discussão para recursos compartilhados,ela é compartilhada em cache / memória / IO ou seções criticas.
No resultado sete os recursos compartilhados e seção crítica tem efeitos semelhantes na aceleração de desempenho e recursos de acesso de contenção é um dos fundamentais fatores limitantes para a escalabilidade dos processadores multicore para a computação paralela.
6. Conclusões e trabalhos futuros
O artigo que serviu de base para esse resumo, apresentou uma nova abordagem para a escalabilidade e para a análise dos processadores multicore multithreaded (MMPs). Os autores foram capazes de mostrar que a escala de desempenho para MMP é um forte função de tipos de carga de trabalho, de uma forte CPU-bound para forte ligação de memória, resultando em uma ampla gama de desempenho. Mostrou também que a speedup super-linear com relativo número total de segmentos pode ser conseguido, quando não há partilha de recursos entre os segmentos e da carga de trabalho é fortemente memória-bound. Mais importante, foi descoberto que um prazo seqüencial é garantido para sair da execução da parte paralelizável da carga de trabalho, desde que haja contenção de recursos entre os tópicos de todos os núcleos, seja devido a memória compartilhada / recurso IO ou seções críticas. Este prazo sequencial limita fundamentalmente a escalabilidade de MMPs para computação paralela mesmo para carga de trabalho escalável.
Concluiu-se que para minimizar o impacto negativo desse fenômeno,os recursos devem ser localizados, tanto quanto possível para minimizar o recurso de partilha ao nível do sistema. Com o modelo atual, o desempenho da aceleração do coarse-grain e fine-grain são idênticos. Para ter em conta o diferenças entre os dois, é preciso incorporar o custo de funções para o caso grosseiro de grãos devido a latência de acesso à cache local que podem criar bolhas no pipeline e troca de contexto que pode causar a parada do pipeline. No modelo atual, não pode considerar a mistura de diferentes tipos de núcleos.
Apendice
...