Nehalem
Ao contrário do Yorkfield, produzido pela combinação de dois Penryns, com dois núcleos cada um, o Nehalem será um processador quad-core nativo. Ele adotará dois recursos que até então eram exclusividade dos processadores AMD: um controlador de memória integrado (DDR3) e um barramento rápido (similar ao HyperTransport) para interligar os núcleos do processador e também ligá-lo ao chipset. Um detalhe importante sobre o controlador de memória é que além do tradicional suporte a dual-channel, estão em desenvolvimento também versões "tri-channel" e "quad-channel", com acesso simultâneo a até 4 módulos simultaneamente, alargando o barramento com a memória de forma a melhor atender os 4 núcleos. As quad-channel estarão inicialmente restritas aos servidores, mas pode ser que a Intel utilize o sistema em alguma série destinada a entusiastas (como os Core 2 Extreme). A questão é que usar 4 módulos de memória é muito custoso e o ganho de desempenho em relação a utilizar apenas dois tende a ser pequeno, de forma que não devemos ver o recurso se popularizar nos PCs domésticos em um futuro próximo. Assim como o Conroe e o Penryn, o Nehalem utilizará um sistema de cache compartilhado, onde todos os núcleos possuem um cache comum. Ainda não está claro se será mantida a arquitetura atual, onde cada núcleo possui um cache L1 próprio e o cache L2 é compartilhado, ou se será adotado um cache de 3 níveis, onde cada núcleo possui um pequeno cache L2 próprio e um grande cache L3 é compartilhado por todos. Ao contrário do deselegante Kentsfield, onde todos os núcleos operam sempre à mesma freqüência e usando a mesma tensão, o Nehalem oferecerá um sistema de gerenciamento independente, onde cada núcleo pode operar a uma freqüência condizente com seu nível de utilização. Dentro deste conceito, a idéia do cache de três níveis, onde cada núcleo possui caches L1 e L2 exclusivos me parece fazer mais sentido, pois permite que os núcleos não-utilizados, ou mesmo o próprio cache L3 (que consumiria boa parte da energia do processador) sejam completamente desligados, sem prejuízo para o desempenho dos núcleos que continuarem ativos. Podemos esperar uma configuração similar à do Athlon X2, onde temos um único controlador de memória, compartilhado entre todos os núcleos e uma interface de gerenciamento encarregada de distribuir a carga entre eles e monitorar o nível de carregamento de cada um. Buscando melhorar o aproveitamento dos 4 núcleos e maximizar o desempenho do processador nos momentos de inatividade, em que apenas um ou dois deles estiverem ativos, o Nehalem utilizará uma versão aperfeiçoada do Hyper-Threading, introduzido na época do Pentium 4. O Nehalem utilizará uma arquitetura mais modular, o que facilitará o desenvolvimento de versões com mais ou menos núcleos. Além da versão com 4 núcleos, existirão versões com 2 núcleos e 8 núcleos, embora ainda não esteja claro se a versão com 8 núcleos será um design octo-core "nativo", ou se será a combinação de dois processadores quad-core dentro do mesmo encapsulamento. Além da questão do gerenciamento de energia, a arquitetura escalável do Nehalem permitirá o lançamento de versões mais simples, com apenas 1 ou 2 núcleos, que podem ser usadas nas linhas de processadores de baixo custo. É de se esperar que, caso realmente lançada, a versão com apenas 1 núcleo não seja destinada a desktops, mas sim a sistemas móveis como os UMPCs e MIDs. Como de praxe, serão lançadas versões com configurações variadas de cache, de acordo com o preço e o público-alvo, como atualmente. A Intel divulgou também planos para produzir versões do Nehalem com aceleradores gráficos integrados, de forma similar ao Fusion da AMD. O principal problema é que, ao contrário da AMD (que agora possui a ATI), a Intel não possui sequer um acelerador gráfico competitivo. A Intel poderia desenvolver uma versão um pouco mais rápida do GMA3500 (o vídeo onboard utilizado no chipset G53) e integrá-la ao processador ao invés de no chipset, mas isso não seria uma grande evolução, já que o desempenho do vídeo integrado continuaria sendo baixo. No final de 2009 ou (mais provavelmente) início de 2010 está previsto o lançamento do Westmere (também chamado de Nehalem-C), uma versão aprimorada do Nehalem, produzido usando a técnica de 32 nanômetros que sucederá a de 45 nanômetros usada no Penryn. Ele será sucedido pelo Sandy Bridge (anteriormente chamado Gesher), uma nova arquitetura, sobre a qual pouco se sabe além de vagos anúncios que dão a entender que ele possuirá 8 núcleos nativamente, onde cada núcleo possuirá cache L1 e L2 próprios e todos compartilharão um grande cache L3 (o que reforça a tese do uso do design de 3 níveis no Nehalem) e de que ele será capaz de operar a 4.0 GHz ou mais. Essa última informação merece uma análise mais cuidadosa, pois 4 GHz não está muito acima dos processadores atuais. Como as versões iniciais do Penryn operarão na faixa dos 3.2 GHz, a meta de 4 GHz para o Sandy Bridge (que está duas gerações à frente) mostra que a própria Intel não acredita mais em grandes aumentos na freqüência de operação das próximas famílias de processadores e está por isso investindo no desenvolvimento de projetos com 4 e 8 núcleos, além do desenvolvimento de novos conjuntos de instruções (como o SSE4), novos compiladores e outras ferramentas que facilitem o desenvolvimento de softwares capazes de extrair ganhos reais de desempenho dos novos processadores. Uma coisa que está clara é que softwares não-otimizados, categoria que engloba a grande maioria dos programas que utilizamos hoje em dia, não rodarão muito mais rápido em um Nehalem ou Sandy Bridge do que rodam atualmente em um Core 2 Duo overclocado para 3.0 GHz ou mais. Será necessária toda uma safra de novos softwares para que o potencial de designs com 8 cores, como o Sandy Bridge, possa ser completamente explorado. Com o Sandy Bridge, já estamos em 2011. A partir deste ponto as informações oficiais acabam e passamos a depender apenas de especulações. Duas tendências que poderia antecipar, com uma razoável margem de certeza, são a introdução de uma técnica de fabricação de 22 nanômetros (0.022 micron) em algum ponto entre 2011 e 2013 e a introdução de chips "modulares", construídos a partir da combinação de um grande número de processadores x86, derivados da arquitetura do Nehalem e chips especializados em funções específicas, como processamento de vetores, unidades de processamento 3D (que complementarão, ou substituirão as placas 3D dedicadas) e assim por diante. Uma amostra deste "admirável mundo novo" foi a demonstração de um chip com 80 núcleos dada pela Intel em fevereiro de 2007, desenvolvido com o objetivo de oferecer 1 teraflop de poder de processamento. Cada um dos 80 núcleos é um chip relativamente simples, otimizado para processar instruções de ponto flutuante. Cada chip possui um "roteador" que o interliga aos vizinhos. Esta estrutura permite que as instruções sejam distribuídas entre os núcleos de forma bastante similar ao que acontece dentro de um cluster com várias máquinas. A principal diferença é que tudo é feito dentro de um único chip. Este slide exibido durante o Spring Intel Developer Forum de 2007 demonstra o conceito:
O chip de 80 núcleos é apenas um sistema de demonstração, que nunca virá a se tornar um produto. Embora o poder de processamento seja respeitável, a aplicação dele seria muito limitada, já que ele é capaz de processar apenas instruções de ponto flutuante. Futuros chips combinariam diversos tipos de unidades especializadas, formando chips capazes de executar todo tipo de instruções. O principal problema é que estes chips exigirão profundas modificações nos softwares, o que vai sem dúvida retardar sua popularização. Não é difícil de imaginar que eles serão introduzidos inicialmente como chips especializados, destinados a grandes servidores, para só depois de mais alguns anos descerem a pirâmide, chegando até os desktops.
» Próximo: Phenom e Barcelona Você está lendo um tópico de demonstração do livro Hardware, o Guia Definitivo:
Autor: Carlos E. Morimoto
Páginas: 848 Formato: 23 x 16 cm Editora: GDH Press e Sul Editores ISBN: 978-85-99593-10-2 Lançado em: Outubro de 2007 » R$ 84,00 + frete (Preço nas livrarias: R$ 108) » Compre o seu Descrição: Para quem não lembra, nosso último livro de hardware foi lançado em 2000 e era um tijolão com quase 600 páginas. Este livro está atualmente disponível para leitura online, embora brutalmente desatualizado. O Hardware, o guia definitivo é um novo projeto, escrito a partir do zero, sem aproveitar trechos do livro anterior. Ele nasce como um livro de hardware atualizado, que dá um maior destaque para manutenção e problemas do dia-a-dia, além de oferecer uma sólida base teórica para que o leitor possa realmente entender e diferenciar toda a gama de tecnologias utilizadas nos PCs atuais. |
|