Lista de Exercicios 1 e 2

November 18, 2017 | Author: Soneka Abdu | Category: Computer Architecture, Computing, Technology, Electronics, Electronic Engineering
Share Embed Donate


Short Description

Download Lista de Exercicios 1 e 2...

Description

Lista de Exercícios 1 Prof. Rodrigo Amorim 1. Uma das características da arquitetura RISC é que a maioria das instruções possui tamanhos iguais. Quais as conseqüências e vantagens desta característica? Pg 519 R: Com o ganho de desempenho as conseqüências são o aumento da memória cache e respectivamente o aumento de custo. 2. Defina pipeline e sua importância no desempenho dos processadores. Pg 441 R: Pipeline é uma técnica de hardware que permite que a CPU realize a busca de uma ou mais instruções além da próxima a ser executada. Estas instruções são colocadas em uma fila de memória dentro do processador (CPU) onde aguardam o momento de serem executadas. A importancia do pipeline é que novas entradas são aceitas em uma extremidade antes que entradas aceitas previamente apareçam como saidas, aumentando o fluxo de informação. 3. Como funciona o pipeline vetorial? Pg 680 R: O pipeline vetorial é abordado para obter um melhor desempenho, onde ela inclui operações especiais para manipular um vetor de dados unidimensionais. 4. Explique a diferença de processamento entre os três modelos de máquina. Como funciona o processamento de informações dependentes. Pg 529 R:

Na máquina base o processamento de busca-decodifcação-execução-escrita é

realizado, e um novo ciclo se inicia durante a fase de decodificação do processamento anterior. Já na máquina com superpipeline o clico se inicia pela segunda vez já na metade da fase de busca do processamento anterior, levando apenas meio periodo para o inicio de cada processo. E na máquina Superescalar os ciclos de processamento são iguais aos da máquina Base, com a diferença de que ocorre o dobro de processamento no mesmo periodo. Um mesmo ciclo realiza duas buscas, duas decodificações, duas execuções e duas escritas. No processamento de informações dependentes uma segunda instrução pode ser buscada e decodificada antecipadamente, mas não pode ser executada até que seja completada a execução da primeira instrução. 5. O que é predição de desvio? Qual a diferença entre as técnicas de predição estáticas e as dinâmicas? Pg 450 É saber com antecedência se um desvio será tomado ou não. Para isso existem várias técnicas, podendo ser estáticas ou dinâmicas.

As estáticas não dependem do histórico de execução de instruções até o momento em que ocorre a instrução de desvio condicional. Já as dinâmicas dependem do histórico de execução. 6. Em que se baseia a classificação de arquiteturas paralelas proposta por Flynn? Você considera essa classificação abrangente o suficiente para englobar as novas arquiteturas paralelas? Pg 651

7. Qual a diferença entre as arquiteturas SMP (UMA), NUMA, COMA e CC-NUMA? Pg 676 8. Discuta duas maneiras de se estabelecer a rede de interconexão em arquiteturas SMP. 9. Por que em máquinas multiprocessadas a utilização de memória cache pode causar incoerências. Dê um exemplo em que pode ocorrer incoerência. Pg 664 e 677 Se os processos puderem atualizar suas copias livremente o resultado será uma imagem de memória incoerente. Inconsistência de E/S podem ocorrer quando acessam direto a memória principal causando a incoerência de cachê 10. Imagine que você tem um cluster com memória compartilhada e outro com memória distribuída. Em qual delas você usaria uma topologia de rede estática e em qual usaria uma topologia de rede dinâmica? Justifique. Pg 673 Na compartilhada usaria a estático pois esse método dedica um ip e banda para uma conexão e esse tipo de compartilhamento necessita de mais banda pois gera mais trafego em rede, já na distribuída o dinâmico é mais apropriado pois não há tanto trafego em rede. 11. Como é feita a comunicação entre processos em máquinas paralelas com memória distribuída? E com memória compartilhada? Pg 673 Processos em maquinas paralelas com a memória distribuída : necessita de um software de gerencimento ou escalonagem para atribuir aos servidores as requisições recebidas do cliente. Memória compartilhada : requer uso de alguma facilidade de bloqueio de acesso, para assegurar que os dados sejam usados apenas por um computador de cada vez . 12. Faça uma comparação entre as arquiteturas SMP e Cluster. Dê o exemplo de uma aplicação que pode obter um melhor desempenho sendo executada em uma SMP e

outra que pode obter um melhor desempenho sendo executada num Cluster. Pg 675 A vatagem da abordagem SMP é a fácil configuração e para a migração de um sistema convencional e a alocação de espaço físico para alocação do equipamento Já a longo prazo o cluster se mostra mais vantajoso pois supera o SMP em termos de escalabilidade absoluta e incremental e em disposição pois seus componentes de sistema podem tornar-se altamente redundante . Aplicação em SMP: Windowns datacenter. Aplicação em cluster : ambientes críticos de banco de dados como o SQLSERVER. 13. Calcule os períodos de clock (a-c) e as freqüências (d-f) de operação dos seguintes processadores: a) 700 MHz b) 1.6 GHz c) 2.8 GHz d) 1.6 ns e) 0.8 ns f) 0.2 ns

Lista de Exercícios 2 Prof. Rodrigo Amorim 1. Suponha que melhoramos uma ULA para que ela faça as operações 4 vezes mais rápida que a versão anterior. Se o tempo de execução de um benchmark antes da melhoria era 18 segundos, qual será o aumento da velocidade se ¾ do tempo do benchmark é gasto com operações da ULA? Busca 1,5 Decodificação 1,5 Execução  ULA  dividir 13,5 por 4  3,375+4,5  7,875s Escrita 1,5

2. Explique as relações entre os métodos de avaliação de sistemas computacionais.

3. Defina aplicações dos métodos de avaliação e sistemas que possam ser avaliados.

4. Quando o objetivo é comparar e avaliar arquiteturas, qual métrica você acha a melhor: vazão ou tempo de resposta?

5. Sabe-se que um processador tem freqüência de 3 GHz e que consome 2 ciclos de clock para processar 1 instrução. O total de instruções processadas por segundo é igual a 6000 MIPS. Qual é o tempo do processador?

6. Considere duas implementações diferentes de hardware M1 e M2 do mesmo conjunto de instruções. Existem três classes de instruções no conjunto de instruções: F, I e N. A taxa de clock de M1 é de 600 MHz. O ciclo de clock de M2 é 2ns. O CPI médio para essas três classes de instruções em M1 e M2 são os seguintes: Classe F I N

CPI para M1 5,0 2,0 2,4

CPI para M2 4,0 3,8 2,0

Comentários Ponto Flutuante Aritmética inteira Não Aritmética

a) Quais são os picos de desempenho para M1 e M2, em MIPS? b) Se 50% de todas as instruções executadas em um determinado programa são da classe N e as restantes são divididas igualmente entre F e I, qual máquina é mais rápida e por que fator? c) Projetistas de M1 planejam reprojetar a máquina para obter um desempenho melhor. Com as suposições da parte (b), qual das seguintes opções de projeto possui maior impacto em desempenho e por quê? c1. Utilizar uma unidade de ponto flutuante com o dobro da velocidade (CPI = 2,5 para classe F). c2. Adicionar uma segunda ULA de inteiros para reduzir a CPI de inteiros para 1,2. c3. Utilizar uma lógica mais rápida que permita uma taxa de clock de 750 MHz com os mesmos CPIs.

7. Considere dois compiladores que produzem códigos de máquina para um dado programa, que serão executados na mesma máquina. As instruções de máquina são divididas nas classes A (CPI = 1) e B (CPI = 2). Programas em linguagem de máquina produzidos pelos dois compiladores levam à execução do seguinte número de instruções para cada classe: Classe Instruções para Instruções para Comentários compilador 1 compilador 2 A 600M 400M CPI = 1 B 400M 400M CPI = 2 a) Quais são os tempos de execução para os dois programas, assumindo um clock de 1 GHz? b) Qual compilador produz um código mais rápido e por que fator? c) A saída de linguagem de máquina de qual compilador executa a uma taxa de MIPS maior?

View more...

Comments

Copyright ©2017 KUPDF Inc.
SUPPORT KUPDF