ct

    AMD K6-3


    Apesar de desde o final da era 486 a AMD utilizar tecnologia própria, sempre conseguiu lançar bons processadores, que muitas vezes introduziam novas tecnologias que viriam a ser utilizadas apenas nas próximas gerações de processadores Intel, chegando muitas vezes até a superar os processadores Intel em performance, quase sempre custando menos. O problema é que sempre que a AMD conseguia lançar um processador novo, a Intel já estava dois ou três passos à frente, restando à AMD competir com chips obsoletos da Intel no mercado de PCs de baixo custo. Foi assim com o K5, com o K6, e até certo ponto com o K6-2. Vender chips de baixo custo pode ser uma boa maneira de aumentar a participação no mercado, mas definitivamente não é a melhor maneira de conseguir obter lucro.

    Lançado em novembro de 98, o Sharptooth, ou simplesmente K6-3 foi a primeira tentativa da AMD em competir diretamente com os processadores topo de linha da Intel, que na época eram os Pentium II de 500 e 550 MHz. Como o K6-3 possui uma arquitetura bem diferente do Pentium II, não é tão fácil fazer uma comparação direta, já que cada processador acaba saindo-se melhor em um tipo de aplicação.

    O cache de três níveis: O cache surgiu na época dos processadores 386, como uma forma de acelerar o acesso aos dados gravados na memória RAM. Inicialmente, tínhamos apenas alguns Kbytes de cache espetados na placa mãe, mas, quando a Intel desenvolveu o 486, embutiu uma pequena quantidade de memória cache dentro do processador. Tínhamos agora dois tipos de cache diferentes, um interno ao processador, e outro espetado na própria placa mãe. Para diferenciar os dois, o cache incorporado ao processador passou a ser chamado de cache nível um, ou “L1”, enquanto o cache da placa mãe passou a ser chamado de nível 2, ou “L2”.

    A diferença entre o cache L1 e o cache L2 reside na velocidade. Enquanto o cache L1 trabalha na frequência do processador, possuindo tempos de acesso extremamente baixos, o cache L2 trabalha na frequência da placa mãe, sendo bem mais lento do que o cache L1. Justamente por ser mais lento, o cache nível 2 é mais barato, possibilitando o uso de quantidades maiores. Mesmo nos processadores atuais, onde o cache L2 também faz parte do processador, a velocidade é mais baixa.

    Os dados mais requisitados pelo processador são inicialmente armazenados no cache L2, sendo os dados que o processador está processando no momento, juntamente com alguns outros dados importantes, transferidos para o cache L1.

    Assim que o processador termina de processar uma determinada rotina e passa para a próxima, são trocados os dados do cache L1, evitando ao máximo que o processador precise acessar dados contidos no cache L2 (que sempre será mais lento) e principalmente acessar diretamente a memória RAM, o que resultaria em uma grande perda de tempo. Nos processadores atuais, a velocidade e a quantidade de memória cache são muito mais importantes que a própria velocidade da memória RAM. Vou usar um exemplo tosco, só para tentar tornar mais claro este tema:

    Imagine que num sistema qualquer, 40% das vezes que o processador necessite de dados, encontre-os no cache L1, 45% da vezes precise recorrer ao cache L2, e em 15% dos casos os dados não estejam gravados no cache e o processador precise busca-los diretamente na memória RAM.

    Imagine que neste sistema, um acesso ao cache L1 demore 2 nanossegundos, um acesso ao cache L2 demore 6 nanos, e um acesso à memória RAM demore 50 nanos (é apenas um exemplo). Usando a estatística anterior (40-45-15), 1000 acessos à dados demorariam 12.800 nanos (400 x 2 + 450 x 6 + 150 x 50).

    Imagine agora que aumentamos o tamanho do cache L1 deste processador, aumentamos a velocidade do cache L2, mas foi mantida a mesma memória RAM. Neste caso, poderíamos imaginar que em 50% das vezes que o processador precisar de dados, os encontrará no cache L1 (já que agora é maior do que no exemplo anterior), em 40% das vezes encontrará os no cache L2 e em 10% das vezes será necessário um acesso à memória RAM. Imaginando que um acesso ao cache L1 continue demorando 2 nanos (já que aumentamos apenas seu tamanho, e não a velocidade), um acesso ao cache L2 passe a demorar 4 nanos depois de aumentarmos sua velocidade, e um acesso à memória RAM continue demorando os mesmos 50 nanos, 1000 acessos demorariam agora apenas 6600 nanos (500 x 2 + 400 x 4 + 100 x 50), uma diminuição de quase 50%, muito mais do que conseguiríamos aumentando a velocidade da memória RAM.

    Terminando, imagine agora, que fosse acrescentado um cache nível 3, um pouco mais lento do que o cache L2, mas em uma quantidade um pouco maior, e que um acesso a este novo cache demore 10 nanos. Manteríamos então um cache-hit de 50% no cache L1, 40% no cache L2, mas passaríamos a ter um cache-hit de (digamos) 5% no cache L3, fazendo com que em apenas 5% dos casos fosse necessário um acesso à memória RAM. Os 1000 acessos demorariam então apenas 5600 nanos (500 x 2 + 400 x 4 + 50 x 10 + 50 x 50), um aumento de quase 15% na velocidade de acesso, que certamente resultaria em um aumento considerável na velocidade global do equipamento.

    A idéia do K6-3 é justamente essa, aumentar o desempenho através de uma maior eficiência da memória cache. O K6-3 traz os mesmos 64 KB de cache L1 do K6-2, mas vem agora com 256 KB de cache L2 embutidos no encapsulamento do processador, cache que trabalha na mesma frequência do processador, assim como o cache usado no Celeron e no Pentium II Xeon. Ora, se apenas 128 KB de cache L2 trabalhando na frequência do processador, conseguiram transformar o anêmico Celeron sem cache, em um processador cujo desempenho chega até mesmo a superar o desempenho do Pentium II em alguns aplicativos, imagine o que o dobro dessa quantidade não pode fazer pelo K6-3.

    Para aumentar ainda mais o desempenho do K6-3, a AMD resolveu aproveitar também o cache L2 encontrado em todas as placas mãe Soquete 7, passando a usa-lo como um cache L3. O funcionamento do cache da placa mãe continua idêntico, apenas mudamos seu nome.

    O uso do cache L3 consegue aumentar de 3 a 8% o desempenho do K6-3, dependendo da quantidade usada. Não chega a ser nenhuma revolução, mas é um ganho bem perceptível, principalmente se lembrarmos que o Pentium II é apenas 3 ou 5% mais rápido do que o K6-2 em aplicativos de escritório.

    Testando o K6-3 em uma placa mãe com 512 KB de cache, o ganho de performance fica em cerca de 3.8%. Segundo números obtidos por outros usuários, o ganho de performance com 1024 KB de cache fica em torno de 6%, chegando a 8% no caso de placas mãe com 2048 KB de cache.

    Outras mudanças: Fora a inclusão do cache L2 trabalhando na mesma frequência do processador, e do uso do cache L3, o K6-3 trouxe poucas mudanças sobre o antigo K6-2. Foram feitas algumas alterações nos registradores do processador, mas nada gritante. O K6-3 continua utilizando as 21 instruções 3D-Now! e o mesmo coprocessador aritmético do K6-2.

    Este é o grande problema. O maior defeito do K6-2 não é o cache, mas sim o próprio coprocessador aritmético, com apenas uma unidade de execução, que apesar do reforço do 3D-Now! Não foi alterado desde o primeiro modelo do K6. Graças ao cache rápido, o K6-3 consegue até mesmo superar um Pentium III da mesma frequência em aplicativos de escritório, mas continua perdendo em jogos e aplicativos gráficos.

    Mantendo a idéia de deixar de ser uma mera coadjuvante e passar a realmente competir em pé de igualdade com a Intel, a AMD resolveu investir pesado para desenvolver um coprocessador decente para seu próximo processador, o Athlon, que veremos com mais detalhes adiante. Por sinal, o investimento valeu à pena, pois o coprocessador aritmético do Athlon consegue não apenas igualar o desempenho do coprocessador do Pentium III, mas chega a superá-lo. Realmente o desempenho do Athlon vem surpreendendo, principalmente pelo fato da AMD desta vez estar conseguindo lançar versões mais rápidas antes da Intel.

    Compatibilidade: Na época em que o K6-3 foi lançado, existia um enorme contingente de usuários de equipamentos baseados em placas mãe Super-7, entre usuários de processadores AMD e de processadores Cyrix, que sem dúvida se sentiam muito mais inclinados a trocar seu processador por outro que continuasse utilizando o soquete 7, permitindo um upgrade sem necessidade de troca da placa mãe. Percebendo isso, a AMD optou por tornar o K6-3 totalmente compatível com as placas mãe soquete 7, mantendo apenas a velha exigência de que a placa mãe seja capaz de fornecer a tensão correta para o processador e seja capaz de sinalizar o multiplicador correto.

    Qualquer placa mãe que suporte o AMD K6-2 de 400 MHz, suportará também o K6-3 de 400 e 450 MHz sem problema algum, dispensando inclusive upgrades de BIOS. A voltagem utilizada pelo K6-3 também é a mesma utilizada pelo K6-2: 2.2v, dispensando qualquer configuração adicional. Também não é preciso configurar nada relacionado ao cache L3, pois espetando o K6-3 na placa mãe, o cache da placa passa automaticamente a ser reconhecido como cache L3, novamente dispensando qualquer configuração adicional.

    Resumindo, basta configurar o multiplicador da placa mãe para 4x 100 MHz, ou 4.5x 100 (no caso do K6-3 de 450 MHz) e a voltagem para 2.2v para que tudo funcione.


    » Próximo: Cyrix 6x86MX





    Você está lendo o livro Hardware, Manual Completo (publicado em 2002):

    Se se está em busca de um livro atualizado sobre Hardware, leia o Hardware, o Guia Definitivo, que oferece informações atualizadas:

    Autor: Carlos E. Morimoto
    Páginas: 848
    Formato: 23 x 16 cm
    Editora: GDH Press e Sul Editores
    ISBN: 978-85-99593-10-2
    Lançado em: Outubro de 2007

    » R$ 84,00 + frete
    (Preço nas livrarias: R$ 108)

    » Compre o seu

    Descrição:

    Para quem não lembra, nosso último livro de hardware foi lançado em 2000 e era um tijolão com quase 600 páginas. Este livro está atualmente disponível para leitura online, embora brutalmente desatualizado.

    O Hardware, o guia definitivo é um novo projeto, escrito a partir do zero, sem aproveitar trechos do livro anterior. Ele nasce como um livro de hardware atualizado, que dá um maior destaque para manutenção e problemas do dia-a-dia, além de oferecer uma sólida base teórica para que o leitor possa realmente entender e diferenciar toda a gama de tecnologias utilizadas nos PCs atuais.

    Veja também nossos livros Redes, Guia Prático, Servidores Linux, Guia Prático, Smartphones, Guia Prático e Linux, Guia Prático, nossos outros lançamentos.





cb
HOME