Поколения процессоров AMD. О высоких технологиях

15.04.2019 Windows

Кажется, со времени 486 процессоров, когда и Intel и AMD сосуществовали бок о бок и практически не конкурировали между собой, пользуясь одними и теми же технологиями, AMD впервые имеет шанс положить Intel на лопатки. Почему? Ответ прост - на рынке появился новый процессор седьмого поколения AMD Athlon.

Но сначала обратимся к истории. Первым процессором, который AMD разрабатывала самостоятельно, был K5, выпущенный в 1996 году. Сейчас о нем уже мало кто помнит, правда и помнить там особо нечего. Как всегда, опоздав с выпуском этого кристалла, отставая по тактовой частоте и производительности, AMD не смогла тогда завоевать расположения пользователей.

После этого провала AMD приобрела забытую сейчас фирму NexGen, еще одного независимого разработчика x86 процессоров, который обладал передовой на то время технологией и в небольших количествах выпускал кристаллы без арифметического сопроцессора. Используя эти наработки, AMD спроектировала новое поколение своих CPU - K6. По операциям с целыми числами эти процессоры стали превосходить аналоги от Intel, однако блок операций с плавающей точкой все еще оставлял желать лучшего. А так как начинающие активно набирать популярность игры в жанре Action опирались в своих вычислениях именно на FPU, AMD K6 вновь ждал провал.

AMD не сдавалась и для нужд компьютерных игр предложила использовать не сопроцессор, а специально спроектированный набор SIMD-инструкций 3DNow!. Так появился процессор AMD K6-2, в котором к обычному ядру K6 добавился еще один блок операций с числами одинарной точности с плавающей точкой. Благодаря тому, что он мог выполнять однотипные вычисления с четырьмя парами операндов одновременно, на специально оптимизированных под 3DNow! приложениях K6-2 показывал неплохую производительность. Однако, из специально и как следует оптимизированных оказался только Quake2, а потому пользователи, в большинстве своем, остались недовольны.

Тогда AMD к своему процессору K6-2 добавила интегрированный в ядро кеш второго уровня, работающий на частоте кристалла. Это спасло производительность - полученный K6-III мог успешно конкурировать с аналогами, однако, Intel практически задавил это начинание ценами. Celeron обходился значительно дешевле, обеспечивая, тем не менее, вполне пристойное быстродействие.

В результате мы получили то, что получили. Находясь в состоянии ценовой войны, Intel и AMD пришли к тому, что самые дешевые Intel Celeron продаются практически по себестоимости, если не ниже, а на рынке дорогих процессоров обосновался другой продукт от Intel - Pentium III. Единственный оставшийся шанс выжить для измотанной и порастерявшей в борьбе свои капиталы AMD - вылезти на рынок дорогих и производительных процессоров. Причем, закрепиться на нем не за счет цены - этим оружием в совершенстве владеет Intel, который может сбрасывать цены значительно сильнее AMD, а за счет быстродействия. Именно это и попыталась сделать AMD, выбросив на рынок процессор нового поколения - Athlon.

Если подойти к архитектуре AMD Athlon поверхностно, то основные его параметры можно обрисовать следующим образом:

Следует иметь в виду, что когда в начале 2000 года начнет функционировать новая Дрезденская Fab30, выпускающая Athlon по 0.18 мкм технологии, на которую AMD возлагает особые надежды, что-то из перечисленных выше параметров может и поменяться.

Однако таким простым процессор AMD Athlon кажется только лишь на первый взгляд. На самом же деле за этими несколькими строками скрываются многочисленные архитектурные инновации, которые мы рассмотрим позднее. Однако и простые характеристики AMD Athlon впечатляют. Например, как нетрудно заметить, Athlon превосходит Intel не только по максимальной тактовой частоте (у Intel Pentium III она 600 МГц, да и к тому же при этом он работает на повышенном до 2.05В напряжении ядра), но и по размеру кеша первого уровня, который у Intel Pentium III всего 32 Кбайта.

Перейдем же к более подробному рассмотрению архитектуры AMD Athlon.

Системная шина

Прежде чем углубляться в сам процессор, посмотрим, чем же отличается системная шина EV6, примененная AMD, от привычной интеловской GTL+. Внешнее сходство бывает обманчиво. Хотя процессорный разъем Slot A на системных платах для процессора AMD Athlon выглядит также как и Slot 1, перевернутый на 180 градусов, шинные протоколы и назначения контактов у Intel Pentium III и AMD Athlon совершенно различны. Более того, различно даже число задействованных сигналов - Athlon использует примерно половину из 242 контактов, в то время как Pentium III всего четверть. Внешняя похожесть вызвана тем, что AMD просто хотела облегчить жизнь производителям системных плат, которым не придется покупать особенные разъемы для установки на Slot A системные платы. Только и всего.

На самом же деле, хоть EV6 и работает на частоте 100 МГц, передача данных по ней, в отличие от GTL+ ведется на обоих фронтах сигнала, потому фактическая частота передачи данных составляет 200 МГц. Если учесть тот факт, что ширина шины EV6 - 72 бита, 8 из которых используется под ECC (контрольную сумму), то получаем скорость передачи данных 64бита х 200 МГц = 1,6 Гбайт/с. Напомню, что пропускная способность GTL+, работающей на 100 МГц в два раза меньше - 800 Мбайт/с. Повышение частоты GTL+ до 133 МГц дает увеличение пропускной способности при этом только до 1,06 Гбайт/с. Казалось бы, как в случае с GTL+, так и с EV6 получаются внушительные значения пропускной способности. Однако, только современная PC100 память может отожрать от нее до 800 Мбайт/с, а AGP, работающий в режиме 2x - до 528 Мбайт/с. Не говоря уже о PCI и всякой другой мелочевке. Получается, что GTL+ уже сейчас может не справляться с передаваемыми объемами данных. У EV6 же в этом случае все в порядке, потому эта шина более перспективна.

При этом, как частота GTL+ может быть увеличена со 100 до 133 МГц, планируется, что и частота EV6 также впоследствии достигнет значения 133 (266), а затем и 200 (400) МГц. Однако планы эти могут и не осуществиться - реализовать работу на материнской плате EV6, требующую большего количества контактных дорожек, несколько сложнее, особенно на больших частотах. Хотя если у AMD все получится, пропускная способность системной шины может достичь 2.1 и 3.2 Гбайта/с соответственно, что позволит беспрепятственно применять в Athlon-системах, например, высокопроизводительную 266-мегагерцовую DDR SDRAM.

Еще одна интересная особенность EV6 заключается в поддержке многопроцессорных систем, на рынок которых AMD планирует выйти в наступающем году. В отличие от GTL+, EV6 обеспечивает соединение точка-точка между процессорами и чипсетом, что позволяет выделить всю пропускную способность шины для каждого процессора. Теоретически таким образом может подключаться до 14 процессоров. Ограничения же на количество процессоров в интеловских системах обусловлено, в частности, и тем фактом, что общая пропускная способность GTL+ делится поровну между CPU. Потому, EV6 кажется перспективной и при использовании в многопроцессорных системах.


EV6

GTL+

Кеш

Прежде чем переходить непосредственно к функционированию AMD Athlon, хочется затронуть тему L1 и L2 кешей.

Что касается кеша L1 в AMD Athlon, то его размер 128 Кбайт превосходит размер L1 кеша в Intel Pentium III аж в 4 раза, не только подкрепляя высокую производительность Athlon, но и обеспечивая его эффективную работу на высоких частотах. В частности, одна из проблем используемой Intel архитектуры Katmai, которая, похоже, уже не позволяет наращивать быстродействие простым увеличением тактовой частоты, как раз заключается в малом объеме L1 кеша, который начинает захлебываться при частотах, приближающихся к гигагерцу. AMD Athlon лишен этого недостатка.

Что же касается кеша L2, то и тут AMD оказалось на высоте. Во-первых, интегрированный в ядро tag для L2-кеша поддерживает его размеры от 512 Кбайт до 16 Мбайт. Pentium III, как известно, имеет внешнюю Tag-RAM, подерживающую только 512-килобайтный кеш второго уровня. К тому же, Athlon может использовать различные делители для скорости L2-кеша: 1:1, 1:2, 2:3 и 1:3. Такое разнообразие делителей позволяет AMD не зависеть от поставщиков SRAM определенной скорости, особенно при выпуске более быстрых моделей.

Благодаря возможности варьировать размеры и скорости кеша второго уровня AMD собирается выпускать четыре семейства процессоров Athlon, ориентированных на разные рынки.

Архитектура. Общие положения

Вот мы и подошли к рассказу о том, как же, собственно, работает Athlon. Как и процессоры от Intel с ядром, унаследованным от Pentium Pro, процессоры Athlon имеют внутреннюю RISC-архитектуру. Это означает, что все CISC-команды, обрабатываемые процессором, сначала раскладываются на простые RISC-операции, а потом только начинают обрабатываться в вычислительных устройствах CPU. Казалось бы, зачем усложнять себе жизнь? Оказывается, есть зачем. Сравнительно простые RISC-инструкции могут выполняться процессором по несколько штук одновременно и намного облегчают предсказание переходов, тем самым позволяя наращивать производительность за счет большего параллелизма. Говоря более просто, тот производитель, который сделает более "параллельный" процессор, имеет шанс добиться превосходства в производительности гораздо меньшими усилиями. AMD при проектировании Athlon, по-видимому, руководствовалась и этим принципом.

Однако перед тем, как начать работу над параллельными потоками инструкций, процессор должен их откуда-то получить. Для этого в AMD Athlon, как впрочем и в Intel Pentium III, применяется дешифратор команд (декодер), который преобразует поступающий на вход процессора код. Дешифратор в AMD Athlon может раскладывать на RISC-составляющие до трех входящих CISC-команд одновременно. Современные интеловские процессоры могут также обрабатывать до трех команд, однако если для Athlon совершенно все равно, какие команды он расщепляет, Pentium III хочет, чтобы две из трех инструкций были простыми и только одна - сложной. Это приводит к тому, что если Athlon за каждый процессорный такт может переварить три инструкции независимо ни от чего, то у Pentium III отдельные части дешифратора могут простаивать из-за неоптимизированного кода.

Перед тем, как попасть в соответствующий вычислительный блок, поступающий поток RISC-команд задерживается в небольшом буфере (Instruction Control Unit), который, что уже неудивительно, у AMD Athlon расчитан на 72 инструкции против 20 у Pentium III. Увеличивая этот буфер, AMD попыталась добиться того, чтобы дешифратор команд не простаивал из-за переполнения Instruction Control Unit.

Еще один момент, заслуживающий внимания - вчетверо большая, чем у Pentium III, таблица предсказания переходов размером 2048 ячеек, в которой сохраняются предыдущие результаты выполнения логических операций. На основании этих данных процессор прогнозирует их результаты при их повторном выполнении. Благодаря этой технике AMD Athlon правильно предсказывает результаты ветвлений где-то в 95% случаев, что очень даже неплохо, если учесть, что аналогичная характеристика у Intel Pentium III всего 90%.

Посмотрим теперь, что же происходит в Athlon, когда дело доходит непосредственно до вычислений.

Целочисленные операции

С целочисленными операциями у процессоров от AMD всегда все было в порядке. Со времен AMD K6 процессоры от Intel проигрывали именно в скорости целочисленных вычислений. Тем не менее, в Athlon AMD напрочь отказалась от старого наследия.

Благодаря наличию трех конвейерных блоков исполнения целочисленных команд (Integer Execution Unit) AMD Athlon может выполнять три целочисленные инструкции одновременно. Что же касается Pentium III, то его возможности ограничиваются одновременным выполнением только двух команд.

Отдельно хочется затронуть вопрос конвейеров. Оптимальной глубиной конвейера для процессоров с современными скоростями считается 9 стадий. Увеличение этого числа приводит к ускорению процесса обработки команд, так как скорость работы конвейера определяется работой самой медленной его стадии. Однако, в случае слишком большого конвейера при ошибках в предсказании переходов оказывается что большая часть работы по исполнению команд, уже вошедших на конвейер выполнена напрасно. Его приходится очищать и начинать процесс заново.

Потому в AMD Athlon глубина целочисленных конвейеров составляет 10 стадий, что близко к оптимуму. К сожалению, поклонники продукции Intel снова не услышат ничего утешительного, так как конвейер в Pentium III состоит из 12-17 стадий в зависимости от типа исполняемой инструкции.

Вполне закономерными в свете вышеизложенного выглядят результаты теста ZD CPUMark 99, измеряющего производительность операций с целыми числами и памятью:

Вот это да! Первый тест и первый крупный успех AMD Athlon - его превосходство над Intel Pentium III на той же тактовой частоте составляет более 20%! Вот что значит большой кеш плюс большее количество лучше организованных конвейеров! Однако пока не стоит особенно обольщаться, скорость работы современных приложений, особенно игр, зависит от целочисленной производительности не так сильно, как от вещественночисленной. Потому посмотрим, что же представляет из себя новый конвейерный FPU в Athlon.

Вещественные операции

С замиранием сердца обращаем наш взгляд на блок FPU, встроенный в Athlon. Как мы все хорошо помним, для предыдущих процессоров AMD операции с плавающей точкой были настоящей ахиллесовой пятой. Главной проблемой было то, что блок FPU в K6, K6-2 и K6-III был неконвейеризированый. Это приводило к тому, что хотя многие операции с плавающей точкой в FPU от AMD выполнялись за меньшее число тактов, чем на интеловских процессорах, общая производительность была катастрофически низкой, так как следующая вещественная операция не могла начать выполняться до завершения предыдущей. А что-то менять в своем FPU AMD в то время не хотела, призывая разработчиков к отказу от его использования в пользу 3DNow!.

Но, похоже, прошлый опыт научил AMD. В Athlon арифметический сопроцессор имеет конвейер глубиной 15 стадий против 25 у Pentium III. Не следует забывать, что, как уже говорилось выше, более длинный конвейер не всегда обеспечивает лучшую производительность. К тому же, существенным недостатком Intel Pentium III, которого в Athlon, естественно нет, является неконвейерезируемость операций FMUL и FDIV.

FPU в Athlon объединяет в себе три блока: один для выполнения простых операций типа сложения, второй - для сложных операций типа умножения и третий - для операций с данными. Благодаря такому разделению работы Athlon может выполнять одновременно по две вещественночисленные инструкциии. А ведь такого не умеет даже Intel Pentium III - он выполняет инструкции только последовательно!

Так что, как это ни странно, FPU интеловских процессоров оказался не таким уж замечательным, как это принято было считать ранее. Результаты теста ZD FPU WinMark это подтверждают - AMD переиграла Intel на чужом поле:

Только работая на частоте 650 МГц Pentium III удается догнать новый суперFPU AMD Athlon. Результат крайне непривычный, но многообещающий - наконец-то процессор от AMD должен задать жару и в 3D играх.

MMX

На первый взгляд с выполнением MMX-операций у Athlon по сравнению с K6-III изменений не произошло. Однако это не совсем так. Хотя и MMX-инструкции используются в крайне небольшом числе приложений, AMD добавила в этот набор еще несколько инструкций, которые также появились в MMX-блоке процессора Pentium III. В их число вошли нахождение среднего, максимума и минимума и изощренные пересылки данных.

Если обратить внимание на архитектурные особенности, то в AMD Athlon имеется по два блока MMX, потому на обоих процессорах - и на Athlon, и на Pentium III - может выполняться одновременно пара MMX-инструкций. Однако, MMX-блоки в AMD Athlon имеют большую, чем у Pentium III латентность, что теоретически должно приводить к отставанию этого CPU в MMX-приложениях. Для того, чтобы протестировать реальную скорость MMX мы воспользовались старым добрым тестом Intel Media Benchmark:

Странно, но, несмотря на теоретический проигрыш, Athlon на практике все равно остается на высоте. Этот успех можно отнести как на счет большего кеша или лучшего декодера инструкций. Однако, еще раз должен отметить, что реально используют MMX очень малое число программ, потому, если даже Athlon бы проигрывал Pentium III в повседневной работе это, скорее всего, заметно бы не было.

А вот что касается вещественных SIMD-инструкций, то они приобретают все большее и большее значение.

3DNow!

Блока 3DNow! в AMD Athlon коснулись сильные изменения. Хотя его архитектура и осталась неизменной - два конвейера обрабатывают инструкции, работающие с 64-битными регистрами, в которых лежат пары вещественных чисел одинарной точности, в сам набор команд было добавлено 24 новинки. Новые операции должны не только позволить увеличить скорость обработки данных, но и позволить задействовать технологию 3DNow! в таких областях, как распознавание звука и видео, а также интернет:) Кроме этого, по аналогии с SSE были добавлены и инструкции для работы с данными, находящимися в кеше. Поддержка обновленного набора 3DNow! уже встроена в Windows 98 SE и в DirectX 6.2.

Таким образом, в набор 3DNow! входит теперь 45 команд, против 71 инструкции в SSE от Intel. Причем, судя по всему, использование новых команд должно дать еще больший эффект от 3DNow! В доказательство этого факта AMD распространила дополнительный DLL для известного теста 3DMark 99 MAX, задействующий новые возможности процессора.

Специально для оценки эффективности процессора в 3D-играх, 3DMark 99 MAX предлагает индекс CPU 3DМark, просчитывающий 3D-сцены, но не выводящий их не экран. Таким образом, получается результат, зависящий только от возможностей процессора по обработке 3D-графики и от пропускной способности основной памяти. Мы изучили быстродействие AMD Athlon по этому тесту как с использованием старого 3DNow!, так и с новым Enhanced 3DNow! и без этой технологии вообще. Для сопоставления результатов был протестирован и Intel Pentium III, с включенной SSE-оптимизацией и без нее:

Как мы видим, AMD Athlon по этому тесту чрезвычайно силен. Даже без использования новых 3DNow! инструкций он остается в недосягаемости для процессоров Intel. Все это дает нам право ожидать выдающейся производительности в 3D-играх. А мы обратим взор на гораздо более актуальный вопрос - эффективность различных наборов SIMD-инструкций: SSE и 3DNow!. Для этого посмотрим на прирост производительности в 3DMark 99 MAX при включении соответствующей оптимизации:

Что же, результат показателен. Если старый набор 3DNow!, состоящий из 21 инструкции, обеспечивал выигрыш практически аналогичный приросту производительности от SSE, то новый 45-командный выводит SIMD инструкции от AMD далеко вперед. Правда, все это результаты синтетического теста, что будет в реальных приложениях зависит от разработчиков. А мы можем только лишь их призвать оптимизировать свои изделия как под SSE, так и под 3DNow!, тем более после выхода AMD Athlon оба набора стали гораздо более близки по своим возможностям.

Производительность

После того, как мы рассмотрели устройство AMD Athlon с разных позиций и протестировали его различные части синтетическими тестами, пришло время посмотреть, как он будет вести себя в реальной жизни. Пока фанаты AMD предвкушают высокие результаты их нового фетиша, опишем наши тестовые системы.

Система на базе AMD Athlon:

  • Процессор AMD Athlon 600 МГц;
  • Системная плата MSI MS-6167;
  • 128 Мбайт SEC PC-100 SDRAM

Система на базе Intel Pentium III:

  • Процессор Intel Pentium III 550 и 600 МГц. Данные по Intel Pentium III 650 МГц получены путем разгона до 6,5х100 МГц;
  • Системная плата ABIT BE6;
  • Видеокарта Diamond Viper V770 Ultra;
  • Звуковая карта Creative Sound Blaster Live!;
  • Жесткий диск IBM IBM DJNA 372200
  • 128 Мбайт SEC PC-100 SDRAM

Тесты проводились под управлением операционной системы MS Windows98 SE, во всех 3D-тестах было установлено разрешение 800x600x16.

Первым делом по сложившейся традиции посмотрим на скорость, обеспечиваемую AMD Athlon в офисных приложениях:

Скорость Athlon, работающего на частоте 600 МГц, оказывается практически такой же, как и у Pentium III 650 МГц. Да, лучшая работа с целыми числами и больший кеш обеспечивают превосходство Athlon над Pentium III в бизнес-приложениях при одинаковой тактовой частоте. Однако, толку от того что MS Word или MS Excel будет работать быстрее - немного. Где действительно нужна скорость, так это в современных 3D-играх. Но для начала прикинем скорость в 3D на синтетическом тесте 3DMark 99 MAX:

Athlon не разочаровал нас и здесь. Даже без специальной оптимизации под новые 3DNow!-инструкции этот процессор обеспечивает превосходство даже над Intel Pentium III, работающем на большой тактовой частоте. Но перейдем же, наконец, к реальным тестам - 3D-играм. Первой в списке будет OpenGL-игра Quake2, имеющая специально оптимизированный под 3DNow! минипорт:

Хотя в Quake2, на котором AMD ранее демонстрировала преимущества технологии 3DNow!, и процессоры K6-2 и K6-III вели себя неплохо, такого выигрыша в 25% от Athlon никто даже не ожидал. А ведь это не синтетический тест, а реальное приложение, причем во многом зависящее от возможностей видеокарты. При этом следует иметь в виду, что в нашей тестовой системе была установлена видеокарта на чипе nVidia Riva TNT2. Если бы это была 3dfx Voodoo3, то преимущество было бы еще больше! Но чтобы не подозревать AMD в жульничестве, мы воспользовались и другим игровым OpenGL приложением, к которому AMD руку приложить еще не успела - Quake3 Arena Test:

Ну что же, мы опять видим то самое 25-процентное преимущество AMD Athlon во всех режимах, кроме High Quality, где скорость ограничивается уже возможностями графической карты, а не процессора. Так что, высокоскоростной конвейерный FPU теперь не только не подводит AMD, но и дает возможность стать Athlon самым быстрым процессором для игр. Подтверждение этому можно найти и в результатах Direct3D-игр, например Expendable:

И снова даже Intel Pentium III 650 не может нагнать нашего героя. Ну и в заключение - результаты по одной из самых тяжелых для процессора игр, Unreal:

В принципе, сказать уже нечего - как не крути, AMD Athlon получается быстрее Intel Pentium III.

Что же, тот факт, что Athlon всегда обгоняет Pentium III, говорит сам за себя. Наличие прекрасного арифметического сопроцессора, высокая целочисленная производительность и качественная поддержка SIMD-инструкций превратили Athlon в отличный процессор для развлечений и повседневной работы.

Разгон

Делая всесторонний обзор нового процессора, нельзя не остановиться и на таком важном пункте, как разгон. Правда, поводов для оптимизма здесь немного.

Хотя ядро Athlon не имеет никакой внутренней фиксации ни умножения, ни частоты, номинальная скорость процессора задается расположением нескольких резисторов на процессорной плате. Потому, если вы хотите изменить какие-либо параметры CPU, вы вынуждены снимать картридж, автоматически теряя гарантию и рисковать собственным процессором, перепаивая детальки.

Правда, есть и другой способ. Процессорная плата Athlon снабжена технологическим разъемом, доступ к которому возможен, к слову сказать, опять-таки после снятия картриджа. Посредством этого разъема к CPU может быть подключен дополнительный адаптер, позволяющий изменить умножение и частоту шины. Огорчает одно - непонятно, где брать эти адаптеры. Пока мы не слышали ни о штучных, ни о серийных поставках этих деталей.

Что касается конкретных результатов, то Kryotech разгоняет в своих охлаждающих установках AMD Athlon 600 до 800 МГц, и это внушает оптимизм.

То есть, Athlon вполне разгоняем, но сделать это на практике очень непросто. Поэтому, похоже, разгон этого процессора не станет таким массовым спортом, как оверклокинг Intel Pentium III или Celeron. Тем не менее, недобросовестные продавцы, ищущие легкой наживы и имеющие необходимые навыки, легко могут заняться перемеркировкой процессоров Athlon. Против таких махинаций, к сожалению, AMD не предлагает никакой защиты.

Чипсеты

Прекратив разрабатывать процессоры под гнездо Super 7 и начав продвигать собственный Slot A и системную шину EV6, AMD оказалась отрезана от всех интеловских наработок на поприще чипсетов и системных плат. Теперь AMD придется самой создавать необходимую инфраструктуру, чтобы мы могли приобрести не только процессор, но и системную плату, оборудованную Slot A.

И, судя по первым успехам, ей это удалось. На первое время компания разработала собственный набор логики AMD 750, имеющий кодовое имя Irongate, а также собственный дизайн системной платы - Fester, который был растиражирован рядом тайваньских производителей.

Сам чипсет AMD 750 не представляет собой ничего особенного - по возможностям он аналогичен i440BX. Но большего, в принципе, и не надо. AMD Athlon, как мы видели, и так работает нормально и даже обгоняет по производительности конкурирующие продукты.

AMD 750 имеет традиционую архитектуру и состоит из северного моста AMD 751 и южного AMD 756. Северный мост обеспечивает взаимодействие посредством шины EV6 процессора с памятью и шинами PCI и AGP, поддерживая до 768 Мбайт оперативной памяти PC100 в не более чем трех модулях, AGP 2x и 6 PCI bus maser устройств. Южный мост, осуществляющий интерфейс со всей периферией, кроме обычных функций, умеет работать с UltraDMA/66 IDE-устройствами.

Здесь хочется затронуть еще одну волнующую всех проблему - совместимость. Все мы помним, что для функционирования предыдущих плат, ориентированных на процессоры AMD, требовалась установка специального минипорта, включающего AGP GART драйвер. Этот момент вызывал наибольшие нарекания пользователей, так как часто драйвер отказывался нормально работать с определенными видеокартами. Для корректной работы Athlon с AGP драйвер тоже надо устанавливать, однако можно сказать уверенно - его реализация во много раз изменилась к лучшему. Нам не удалось найти ни одной карты из современных, которая бы работала некорректно. И вообще, говоря о стабильности и совместимости - проблем AMD Athlon ни при работе под Windows 98, ни при работе под Windows NT не вызывал. Так что с надежностью и стабильностью Athlon-систем все должно быть в порядке.

Любопытно, но как оказалось из-за того, что шина EV6 используется и в процессорах Alpha, Irongate может применяться на системных платах и под этот процессор, в частности, системная плата UP1000 от API (для Alpha) основывается именно на этом чипсете.

Хотя на данный момент Irongate выглядит вполне современно, пройдет какое-то время, и его возможностей будет явно недостаточно. AMD, хотя и продолжает свои разработки, планируя внедрить в Irongate поддержку AGP 4x и памяти PC133 или Direct RDRAM, делает это крайне неохотно. По расчетам компании к проектированию Athlon-чипсетов должны быть привлечены тайваньские производители VIA, SiS и ALI, которые не отказались поучаствовать в продвижении нового процессора на рынок.

VIA уже объявила свой Athlon-чипсет KX133, который отличается от Irongate поддержкой памяти PC133 и AGP 4x. Архитектура KX133 также традиционная - северный мост VT8371 и любой южный мост от имеющихся у VIA чипсетов, например VT82C686A. Видимо, именно этот чипсет станет впоследствии самым массовым, на то есть все предпосылки. Обладая более широкими возможностями, например поддержкой до 2 Гбайт оперативной памяти, он появится на рынке уже в четвертом квартале.

Ну а если говорить о более далеких перспективах, то там нас ждут и SMP, и поддержка более скоростной системной шины, и решения с интегрированной графикой. Так что, видимо, с чипсетами под AMD Athlon все будет в порядке.

Системные платы

Для облегчения жизни разработчикам плат AMD разработала референс-дизайн Fester, который и был им передан в расчете на то, что к выходу Athlon тайваньские производители заполнят рынок платами своего изготовления. Сама AMD выпустила лишь небольшое количество плат, предназначенных только для демонстрации, а не для продажи. Однако, в действительности, все произошло не совсем так, как хотелось AMD.

Дело в том, что предложенный дизайн был шестислойным, в то время как практически все современные материнские платы - четырехслойные. Этот момент вызвал некоторые затруднения у производителей, и с платами получилась небольшая задержка. Более того, даже первые выпущенные серийно платы MSI пришлось отзывать из-за низкой стабильности. На производственные трудности наложилось и давление, оказываемое Intel, который во время дефицита чипсетов имеет неплохое влияние на производителей. Таким образом, к настоящему моменту объявлены только платы шести производителей - MSI, Gigabyte, FIC, Asus, Biostar, и GVC, а доступно и того меньше.

Есть информация, что ASUS и FIC работают в настоящий момент над созданием собственно, четырехслойного дизайна, однако, ждать плодов их творчества следует еще не скоро.

Нам удалось раздобыть образцы только двух плат под AMD Athlon - MSI MS-6167 и Gigabyte GA-7IX. Говорят, что уже доступны еще две платы - FIC SD11 и GVC QS750, однако нам их в продаже найти не удалось. Что же касается найденных нами образцов от MSI и Gigabyte, то они выполнены на основе дизайна Fester: MSI подошла к вопросу бесхитростно и просто повторила референс-дизайн. Gigabyte же подошел к делу более творчески и внес отдельные косметические изменения. Однако все равно в результате мы имеем две платы, похожие как капли воды.


Microstar MS-6167

Gigabyte GA-7IX

Обе платы выполнены в ATX-формате, основаны на чипсете AMD 750, поддерживают процессоры со скоростями до гигагерца и имеют по 5 слотов PCI, 2 - ISA, 1 - AGP и по три разъема под DIMM. Естественно, имеется поддержка UltraDMA/66. Системный мониторинг также присутствует и реализован контроллером W83782D. Единственные видимые отличия есть только в BIOS Setup - MS-6167 имеет большее число настроек для работы с памятью. Setup же 7IX более понятен для неискушенного пользователя.

Что касается скоростей работы обоих плат - то они практически идентичны и рассмотрение их различия не заслуживает внимания. Думается, наиболее логичным шагом в настоящий момент будет немного подождать выхода системных плат и от других фирм, которые занимались редизайном Fester. Эти платы как могут быть более скоростными, так и наделены новыми возможностями, например, опциями для беспрепятственного разгона Athlon.

Выводы

Пора подводить итоги. AMD Athlon является на сегодня самым быстрым x86-процессором с передовой архитектурой, что подтверждают наши тесты. Intel сейчас ничего не может противопоставить успеху AMD - архитектура Katmai практически исчерпала свои возможности, в то время как AMD может беспрепятственно увеличивать частоты своих кристаллов. Переход Intel на технологию 0.18 мкм вряд ли надолго сможет решить проблему: завод AMD в Дрездене, который будет выпускать Athlon по аналогичной технологии, но с применением медных проводников находится уже практически на стадии запуска. Кроме того, без изменения архитектуры ядра Intel неоткуда почерпнуть дополнительного прироста быстродействия, потому вся надежда микропроцессорного гиганта должна возлагаться на Willamette, который, впрочем, выйдет не очень скоро.

Длительное время Advanced Micro Devices, подобно Cyrix, производила центральные процессоры 286, 386 и 486, которые были основаны на разработках Intel. К5 был первым независимо созданным х86 процессором, на который AMD возлагала большие надежды.

Однако, покупка компанией AMD основанного в Калифорнии конкурента весной 1996 года, кажется, создала возможность лучше подготовиться к своей следующей атаке на Intel. К6 начал жизнь как Nx686, будучи переименованным после приобретения NextGen. Серия ММХ-совместимых процессоров К6 была запущена в середине 1997 года, за несколько недель до Cyrix 6х86МХ, и сразу была одобрена пользователями.

Изготовленный по 5-слойной 0.35-мкм технологии, К6 был почти на 20 % меньше, чем Pentium Pro и при этом содержал на 3.3 миллионов транзисторов больше (8.8 против 5.5 миллионов). Большинство этих дополнительных транзисторов находилось в кэше первого уровня на 64 Кбайт (на кэш команд 32 Кбайт и на кэш данных 32 Кбайт). Это равносильно четырем Pentium Pro или двум Pentium ММХ и Pentium 2.

Центральный процессор К6 поддерживал технологию ММХ Intel, включая 57 новых х86 команд, разработанных для развития мультимедийного программного обеспечения. Как и Pentium Pro, К6 был многим обязан классическим технологиям RISC. Используя суперскалярную микроархитектуру AMD RISC86, чип декодировал каждую х86-инструкцию в ряд более простых действий, которые могли быть обработаны, используя типичные принципы RISC - такие, как выполнение вне естественного порядка, переименование регистров, предсказание переходов, спекулятивное исполнение, опережающая выборка данных.

Центральный процессор К6 начинал с версий 166.200 и 233 МГц. Уровень его производительности был очень схож с Pentium Pro соответствующих частот с его максимальным 512 Кбайт кэшем второго уровня. Общее с чипом Cyrix MX (но в несколько меньшей степени) - работа с плавающей запятой - была областью относительной слабости по сравнению с Pentium Pro или Pentium 2. Однако проникновению процессора на рынок в конце 1997 - начале 1998 года препятствовали проблемы, которые возникли у AMD при перемещении ее нового производственного 0.25-мкм процесса из лабораторий на заводы-изготовители. Это привело к падению производства центральных процессоров на 200 и 233 МГц, задержке введения чипа 266 МГц и отмене чипа 300 МГц.

Процессор AMD К6-2

Процессоры AMD К6-2 с 9.3 миллионами транзисторов производились по 0.25-микронной технологии AMD. Процессор был упакован в 100 МГц Sирег7-совместимую, 321-контактную керамическую плату (ceramic pin grid array (CPGA) package).

K6-2 включает инновационную эффективную микроархитектуру RISC86, большой (64 Кбайт) кэш первого уровня (двухпортовый кэш данных на 32 Кбайт, кэш команд на 32 Кбайт с дополнительным предрасшифровывающим кэшем на 20 Кбайт), а также улучшенный модуль работы с плавающей запятой. Эффективная производительность при его запуске в середине 1998 года была оценена в 300 МГц, к началу 1999 года самым быстрым из доступных процессоров была версия 450 МГц.

Трехмерные возможности К6-2 представляли другое важное достижение. Они были воплощены в AMD технологии 3DNow!, как новый набор из 21 команды, который дополнял стандартные команды ММХ, уже включенные в архитектуру К6, что ускоряло обработку трехмерных приложений.

Процессор AMD K6-3

В феврале 1999 года AMD объявила о начале выпуска партии 400 МГц AMD К6-lll процессора под кодовым названием «Sharptooth» и опробовала 450 МГц версию. Ключевой особенностью этого нового процессора была инновационная разработка - «Трехуровневый кэш».

Традиционно процессоры персональных компьютеров использовали два уровня кэша:

  • кэш первого уровня (L1), который обычно расположен на кристалле;
  • кэш второго уровня (L2), который мог располагаться либо вне центрального процессора, на материнской плате или слоте, либо непосредственно на чипе центрального процессора.

Общее эмпирическое правило при проектировании подсистемы кэша - чем больше и быстрее кэш, тем выше производительность (ядро центрального процессора может быстрее получить доступ к инструкциям и данным).

Признавая выгоды большого и быстрого кэша в удовлетворении потребностей приложений, все более требовательных к производительности персональные компьютеры, «Трехуровневый кэш» компании AMD вводил архитектурные новшества кэша, разработанные для увеличения производительности персонального компьютера на основе платформы Super7:

  • внутренний L2-кэш (256 Кбайт), работающий на полной скорости процессора AMD-K6-3 и дополняющий кэш L1 (64 Кбайт), который был стандартен для всего семейства процессоров AMD-K6;
  • многопортовый внутренний кэш, позволяющий одновременное 64-битовое чтение и запись как кэшу L1, так и L2;
  • первичную процессорную шину (100 МГц), обеспечивающую соединение с резидентной кэш памятью на системной плате, расширяемой от 512 до 2048 Кбайт.

Таблица основных характеристик процессоров AMD

Тип процессора Архитектура Год выпуска Кодовое наименование Количество транзисторов, млн Ядро, мм L1 -кэш, Кбайт L2-кэш, Кбайт
AMD K5 K5 1996 SSA/5 4.3 271-161 8+16 Внешн.
1996 Godot 4.3 181 8+16 Внешн.
AMD К6 К6 1997 Nx686 (Model 6) 8.8 162 32+32 Внешн.
1998 Little Foot 8.8 88 32+32 Внешн.
K6-2 1998-2001 Chompers 9.3 81 64 Внешн.
К6 3 1999 Sharptooth 21.3 118 64 256
Athlon К7 1999 Argon 22.0 184 128 512
2000 Pluto 22.0 102 128 512
2000-2001 Thunderbird 37.0 120 64+64 256
Duron 2000-2001 Spitfire 25.0 100 64(|) + 64(D) 64-128
2001-2002 Morgan 25.18 106 128 64
2003 Applebred 37.2 85 128 64
Athlon ХР/МР 2001-2002 Palomino 37.5 130 128 256
2002 Thoroughbred 37.2 85 128 256
2003-2004 Barton 54.3 101 64+64 512
Sempron К7 2004 Thorton 54.3 101 128 256
2004 Thoroubred 37.2 85 128 256
2005 Winchester 68.5 84 128 128
Sempron К7 2005 Palermo 68-75 84 64+64 128-256
2006 Manila 103 81 128 128-256
Athlon 64 К8 2003-2004 Clawhammer 105.9 193 128 512-1024
2004 Newcastle 68.5 144 128 512
2004 Winchester 68.5 84 128 512
2005 Venice 76 84 128 512
2005 San Diego 114 115 128 512-1024
2006 Orleans 129 125 128 512
2006 Manchester 154 147 128 512
Opteron 2003 Sledgehammer 64+64 1024
2005 Venus, Troy, Athens 64+64 1024
Athlon 64 x 2 2-ядерные 2005 Manchester 154 147 128 x 2 512 x 2
2005 Toledo 233 199 128 x 2 512 x 2
2006 Windsor 243 220 128 x 2 512 x 2
2006 Brisbane 153.6 183 128 x 2 1024 x 2
Тип процессора Архитектура Размер минимальной структуры, мкм Тактовая частота шины, МГц Тактовая частота процессора, МГц Потребляемая мощность, Вт Интерфейс
AMD K5 K5 0.5-0.35 50-66 75-100 11-15 Socket 5/7
0.35 60-66 90-115 12-16 Socket 5/7
AMD К6 К6 0.35 CMOS 66 166-300 13-28 Socket 7
0.25 66 200-300 13-28 Socket 7
K6-2 0.25 66-100 266-550 15-30 Super7(321 p)
К6 3 0.25 100 400-450 18-30 Super7
Athlon К7 0.25 200 500-700 36-54 Slot A(575 p)
0.18 200 550-950 31-62 Slot A
0.18 200 700-1.4 ГГц 38-72 Socket A/Slot A
Duron 0.18 200 600-950 27-41 Socket A (Socket 462)
0.18 200 900-1.3 ГГц 44-60 S 462
0.13 266 1.4-1.8 57 S 462
Athlon ХР/МР 0.18 266 1.4-1.7 62-72 Socket 462
0.13 266 1.4-2.25 49-74 S 462
0.13 266-400 1.86-2.33 66-77 Socket A
Sempron К7 0.13 333 1.5-2.0 62 S 754/S 939
0.13 333 1.5-2.0 62 S462
0.09 400 1.6 62 S 754
Sempron К7 0.09 400 1.6-1.8 59-64.0 Socket А/ Socket 754
0.09 400 1.6-2.0 35-62 AM2
Athlon 64 К8 0.13 400 1.8-2.4 89 S 754
0.09 400 1.6-2.4 89 S754
0.09 400 1.8-2.2 67 S 939
0.09 400 2.0-2.4 16-89 S 754
0.09 400 2.2 89 S 939
0.09 400 1.8-2.4 35-62 AM2
0.09 400 2.0-2.2 67 S 939
Opteron 0.13 800/НТ 1.4-2.4 55-95 S 940
0.09 1000/НТ 1.6-3.0 55-95 S 940
Athlon 64 x 2 2-ядерные 0.09 667-800 2.0-2.4 69-110 S939
0.09 2.0-2.4 89-110 S 939
0.09 2.0-2.6 65-89 AM2
0.09 2.0-2.8 65-89 AM2

Проект многопортового внутреннего кэша процессора AMD-K6-3 позволил как кэшу L1 (64 Кбайт), так и кэшу L2 (256 Кбайт) выполнять одновременное 64-битовое чтение и запись операций за один такт процессора. В дополнение к этому многопортовому проекту кэша ядро процессора AMD-K6-I11 было в состоянии получить доступ к кэшам L1 и L2 одновременно, что увеличивало общую пропускную способность центрального процессора.

Процессор AMD Athlon

Выпуск процессора Athlon летом 1999 года был наиболее удачным ходом AMD. Это позволило им гордиться тем, что они произвели первый процессор седьмого поколения (у него было достаточно много радикальных архитектурных отличий от Pentium ll/lll и К6-3, чтобы заслужить название процессора следующего поколения), и это означало также, что они вырвали технологическое лидерство у Intel.

Древнегреческое слово Athlon означает «трофей», или «игры». Athlon - процессор, с помощью которого AMD надеялась увеличить реальное конкурентоспособное присутствие в корпоративном секторе, помимо его традиционного преимущества на потребительском рынке и рынке трехмерных игр. Ядро размещается на кристалле в 102 квадратных миллиметров и содержит приблизительно 22 миллиона транзисторов.

Основные элементы ядра Athlon

Многократные декодеры

Три полных декодера переводят х86-команды в макрооперации (MacroOPs) с фиксированной длиной для более высокой пропускной способности команд и увеличения мощности обработки. Вместо того чтобы выполнять х86 команды с длиной 1-15 байтов, процессор Athlon выполняет макрооперации фиксированной длины.

Блок контроля команд

Как только макрооперация расшифрована, за цикл посылаются до трех макроопераций блоку управления инструкциями (ICU). Это буфер перенаправления макроопераций с 72 входами (ROB), который управляет выполнением каждой макрооперации в целом, осуществляет переименование регистра для операндов, управляет любыми условиями исключения и действиями команды. ICU посылает макрооперацию планировщику исполнения.

Конвейеры исполнения

Athlon содержит 18-разрядный планировщик макроопераций и 36-разрядный планировщик операций мультимедиа и ПТ. Эти планировщики распределяют MacroOPs по девяти независимым конвейерам - три для вычислений с ФТ, три для вычисления адресов и три для выполнения команд ММХ, 3DNow! и операций ПТ для х87.

Супер скалярный блок плавающей точки FPT

Предыдущие центральные процессоры AMD были недостаточно производительными при работе с ПТ по сравнению с Intel. К этому недостатку более чем ответственно отнеслись в Athlon, который характеризуется суперскалярной архитектурой, включающей три конвейера выполнения команд с ПТ вне естественного порядка - FMUL (перемножение с ПТ), FADD (сложение с ПТ) и FSTORE (запись с ПТ). «Суперскалярность» означает способность центрального процессора выполнять более одной команды за такт процессора. Athlon же может выполнять одну операцию над 32-битовым числом с ПТ за такт процессора, что дает производительность в 2.4 Гфлопс при частоте в 600 МГц.

Прогнозирование переходов

Процессор Athlon предлагает сложную динамическую логику прогнозирования ветвления, чтобы минимизировать или устранить задержки из-за команд перехода, широко распространенные в программном обеспечении х86.

Системная шина

Системная шина Athlon - первая системная шина на 200 МГц для х86-платформ. Основанная на протоколе Digital Alpha EV6, первичная шина (FSB) - потенциально расширяемая до 400 МГц и более и, в отличие от разделяемой шины SMP (Symmetric Multi-Processing) проекта Pentium 3, использует архитектуру «точка-точка», чтобы обеспечить широкую полосу пропускания для одно- и многопроцессорных х86 платформ.

Архитектура кэша

Архитектура кэша Athlon существенно превосходит обычные центральные процессоры шестого поколения - полноценный кэш первого уровня 128 Кбайт, в 4 раза больший, чем у Pentium 3, и быстродействующий 64-битовый контроллер вторичного кэша 2-го уровня, поддерживающий от 512 Кбайт до 8 Мбайт.

Расширенный 3D Now

В ответ на Streaming SIMD Extensions (Intel Pentium 3) реализация 3DNow! в Athlon была модернизирована добавлением 24 новых команд к исходной 21 инструкции 3DNow!

Athlon был первоначально доступен в диапазонах скорости 500.550 и 600 МГц и 650 МГц немного позднее (все изготовлены по 0.25-мкм технологии). К концу 1999 года AMD еще более повысила частоту: его ядро К75 (750 МГц) является первым процессором, построенным с использованием алюминиевой 6-слойной технологии 0.18-мкм компании AMD.

Утверждение о том, что это был самый быстрый х86 совместимый центральный процессора тысячелетия, спорно, поскольку Intel быстро ответила объявлением 800 МГц Pentium 3. Однако AMD вскоре вернула лидерство в 2000 году выпуском версий на 800 и 850 МГц и преуспела в опережении Intel в преодолении барьера 1 ГГц буквально через несколько недель.

Процессор Thunderbird

В середине 2000 года была выпущена улучшенная версия Athlon с кодовым названием «Thunderbird».

Технология 0.18-мкм, кэш память 2-го уровня (L2) размером в 256 Кбайт расположена на плате процессора и работает на полной частоте процессора (первые процессоры Athlon имели кэш L2, работавшую на меньших частотах, например при частоте в 1 ГГЦ, память L2 работала на 330 МГц).

Интерфейсы - 462-контактный Socket А и Slot А. Частоты от 0.75 до 1 ГГц. Размещение 256 Кбайт памяти на кристалле привело к увеличению его размера до 120 квадратных миллиметров (102 квадратных миллиметров для ядра). Однако он меньше исходного (0.25-micron) К7 Athlon, который занимает 184 квадратных миллиметров. Добавление 256 Кбайт к L2-кэшу на кристалле весьма увеличивает число транзисторов. Центральный процессор Thunderbird включает 37 миллионов транзисторов, то есть 15 миллионов добавились для размещения кэша L2.

Осенью 2000 года был выпущен чипсет AMD760, обеспечивающий поддержку для памяти DDR SDRAM РС1600 (200 МГц FSB) и РС2100 (266 МГц FSB). Другие особенности - AGP 4-х, 4 порта USB , адресация памяти 8 Гбайт на 4 DIMM и поддержка АТА-100. С этого момента процессоры Athlon выпускались только для разъемов Socket А. Последние из процессоров Athlon/Thunderbird были выпущены летом 2001 года, достигнув частоты 1.4 ГГц.

Процессор Duron

В середине 2000 года был выпущен процессор Duron, предназначенный для дома и офиса. Название происходит от латинского «durare» - «вечный», «длительный». Кэш-память L1 (128 Кбайт) и L2 (64 Кбайт) размещается на плате. Первичная системная шина работает на частоте 200 МГц. Поддерживается улучшенная технология 3DNow! Технология 0.18-мкм, частоты 600.650 и 700 МГц. Интерфейс - 462-контактный разъем Socket А.

Процессор Palomino (Athlon ХР - EXtra Performance)

Процессор выполнен по 0.18-мкм технологии с использованием медных проводников на плате (вместо алюминия), содержит 37.5 миллионов транзисторов на кристалле в 128 квадратных миллиметров. Достигнуто понижение на 20 % энергопотребления сравнительно с Thunderbird. Введен ряд новшеств, в совокупности именуемых AMD как «QuantiSpeed Architecture»:

  • введение дополнительного буфера - буфера быстрого преобразования адреса (БПА, TLB - Processor`s Transition Lookaside Buffer). Это дополнительная кэш память, расположенная между L1 и L2. В частности, TLB содержит данные, которые используются для перевода виртуальных адресов в физические и наоборот;
  • поддержка SSE технологии Intel. В Palomino добавлены еще 52 новые команды SIMD по отношению к ранее имевшимся. Удвоено количество исходных 21 SIMD-команд, реализующих «3DNow!», и получена технология «Enhanced 3DNow!» («3DNow! Professional»);
  • использование технологии упаковки OPGA (organic PGA) для замещения CPGA (ceramic PGA), которая использовалась ранее. Использование пластмасс вместо керамики технологичнее, платы оказываются легче и обладают лучшими тепловыми свойствами. Кроме того, можно плотнее размещать навесные элементы, что уменьшает наводки и помехи. OPGA размещаются на уже известном разъеме Socket А.

Процессор Morgan

Morgan первоначально представлял собой ядро Palomino c удаленными 3/4 кэша L2 (64 Кбайт вместо 256 Кбайт). Размер кристалла - 106 квадратных миллиметров, число транзисторов - 25.18 миллионов. Напряжение питания было изменено с 1.6 до 1.75 В.

Процессор Thoroughbred

Летом 2002 года AMD начала поставлять первый процессор с 0.13-мкм технологией и медными соединениями. Площадь кристалла - 80 квадратных миллиметров (у его предшественников - 128 квадратных миллиметров). Питание - 1.65 В, размеры кэша на кристалле - 128 Кбайт для L1 и 256 Кбайт для L2, разъем - Socket А. Эквивалентная производительность Athlon ХР - 2400+ или 2600+.

Однако ядро Thoroughbred рассматривать как простую переделку Palomino с учетом новых норм технологического процесса все же не совсем верно. Thoroughbred по своей внутренней структуре значительно отличается от Palomino, в чем можно убедиться по микроснимкам процессорных ядер.

  • а - Palomino.
  • б - Thoroughbred.

Процессор Sempron

Летом 2004 года AMD объявила о выходе центрального процессора семейства Sempron. Первоначально задуманный как преемник успешного центрального процессора Duron и прямой конкурент процессору Celeron D (Intel, 90 нм), диапазон применения Sempron фактически перекрыл диапазон Athlon AMD ХР и поставил фирмы, выпускающие настольные и мобильные персональные компьютеры, перед выбором - либо Sempron, либо Athlon 64.

Все первые центральные процессоры базировались на 130 нанометровой технологии AMD. Наиболее мощные образцы (3100+) выпускаются в формате интерфейса Socket 754 (Athlon 64 - в формате Socket 939). Другие участники семейства - от 2 ГГц (2800+) до 1.5 ГГц (2200+) - используют Socket А.

В дальнейшем Sempron предполагается перевести на 90 нанометровую технологию и интерфейс Socket 939.

Архитектура процессора К8

Эта архитектура используется во всех современных серверных, настольных и мобильных процессорах AMD (Opteron, Athlon 64 и Athlon 64 Х2). Первым из процессоров К8 являлся Hammer (середина 2000 года).

Одним из главных новшеств К8 является 64-разрядная архитектура х86-64 ISA. Примером 64-разрядных процессоров (IA-64) является Intel Itanium. Однако между 64-разрядными архитектурами процессоров Itanium и К8 мало общего. Itanium - процессор, несовместимый с системой команд х86, тогда как К8, напротив, таковым является.

Стратегия AMD на 64 бита (х86-64) заключается в следующем - за основу взято производительное х86-ядро и расширен набор инструкций для возможности адресации 64-битового пространства памяти. Особенности архитектуры х86-64 (AMD64):

  • обратная совместимость с инструкциями х86;
  • 8 новых 64-битовых РОН плюс 64-битовые версии прежних 8 РОН х86 (доступны лишь в 64-битовом «длинном» режиме);
  • поддержка SSE и SSE2 помимо восьми новых регистров SSE2;
  • увеличен объем адресуемой памяти для приложений, работающих с большими объемами данных (доступно лишь в «длинном» режиме);
  • высокая производительность 32-битовых приложений плюс поддержка появляющихся 64-битовых приложений, хороший вариант переходного процессора.

Таблица режимов процессоров К8

Режим Подрежим Назначение Адресуемая память, Гбайт Операционная система Примечания
«Преемственности» (Legacy Mode) Нет Работа со всеми 16- или 32-бито-выми х86-прило-жениями 4 32-раз-рядная Используются только 32 разряда в 64-разрядных регистрах. Дополнительные 64-разрядные регистры не задействованы. Перекомпиляция ПО не требуется
«Длинный» (Long Mode) Полный (64 разряда) Работа с 64-разрядными приложениями (инструкции х86-64) Более 4 64-разрядная Используются 64-разрядные основные и дополнительные регистры. Требуется перекомпиляция старых программ
Совместимости (Compatibility Mode) Запуск 32-разрядных программ в 64-разрядной операционной системы 2 в 32-битовой операционной системе. 4 в 64-битовой операционной системе Используются только 32 разряда е 64-разрядных регистрах. Дополнительные 64-разрядные регистры не задействованы. Перекомпиляция ПО не требуется

Основные недостатки:

  • процессор продолжает поддерживать архитектуру х86, которая достаточно устарела;
  • новые РОН можно использовать лишь в 64-битовом режиме, что не позволяет повысить производительность 32-битовых приложений посредством улучшения архитектуры системы команд.

Для реализации возможности работы как с 32-битовыми, так и с 64-битовыми приложениями процессоры К8 поддерживают два режима работы - Long Mode и Legacy Mode. В режиме Long Mode также предусмотрено два подрежима - 64-битовый и Compability mode (режим совместимости).

Некоторые прочие особенности К8

  • контроллер памяти интегрирован в сам процессор. Традиционно он располагается в «северном мосте» чипсета на системной плате. Собственно, контроллер памяти - это основной функциональный блок «северного моста» (в чипсетах Intel его так и называют - МСН, Memory Controller Hub); встроенный порт («линк») шины HyperTransport - универсальной шины межчипового соединения. В процессорах К8 Opteron может быть до 3-4 линков НТ, что позволяет комбинировать их в кластерные структуры

  • архитектура К8 разработана с перспективой создания многоядерных процессоров и многопроцессорных систем: если центральные процессоры Intel Хеоn может продемонстрировать лишь 11 процентов увеличения производительности при переходе к двум процессорам, то в случае с Opteron оно составляет 24 процента;
  • усовершенствован блок предсказания переходов - для увеличения точности он содержит историю 16 000 переходов, а также 2000 адресов назначения.

Исполнение инструкций на конвейере К8 начинается с блока выборки инструкций. За один такт блок выбирает из кэша 16 байт данных и выделяет из них от одной до трех инструкций х86 - сколько в выбранных данных поместилось. Поскольку средняя длина команды х86 составляет 5-6 байт, то, как правило, блоку удается выбрать три команды за такт.

На втором такте конвейера выбранные команды распределяются по трем блокам декодирования инструкций. Самые сложные команды отправляются в декодер сложных команд (VectorPath), другие - в декодеры простых команд (DirectPath).

Исходные х86-инструкции на завершающих этапах работы декодера К7/К8 переводятся в макрооперации, или МакОПы (mOPs). Большинству х86-инструкций соответствует одна МакОП, некоторые преобразуются в 2 или 3, а наиболее сложные, например деление или тригонометрические, - в последовательность из нескольких десятков МакОП. Макрооперации имеют фиксированную длину и регулярную структуру.

Условно можно считать что в определенный момент МакОп может «расщепляться» на две микрооперации (МкОП). Как правило, в К7 и в К8 МакОП содержит две МкОП - одну для АЛУ (ALU) (или блока ПЗ - FPU), другую - для УВА (устройства вычисления адреса, AGU - Address Generation Unit).

За счет конвейеризации возможны ситуации, когда одновременно в разных блоках процессора будут выполняться до двух десятков команд - и в К7, и в К8 имеется десять исполнительных устройств - три ALU, три FPU, три AGU и отдельный блок умножения.

Подобно тому, как объединение двух отдельных МкОП в одну МакОП дает явные преимущества, точно так же дела обстоят и с самими МакОП - практически везде они выступают не в виде самостоятельных единиц, а в виде группы. Группу образуют три МакОП, которые одновременно запускаются на параллельные каналы.

Вся дальнейшая работа идет не с одиночными, а с «тройками» МакОП («линиями», line). Такая «линия», с точки зрения центрального управляющего блока процессора - ICU (Instruction Control Unit) воспринимается как единое целое: все основные действия выполняются именно над «линиями», в первую очередь выделение внутренних ресурсов.

Сгенерированные «линии» от декодеров по одной за такт поступают в блок управления командами - Instructions Control Unit (ICU), где подготовленные к исполнению линии накапливаются в специальной очереди (24 линии).

Из очереди в 24 линии по три МакОП в каждой ICU выбирает в наиболее удобной для исполнения последовательности (одна-три МакОП) и пересылает их либо на АЛУ, либо на блок ПЗ в зависимости от типа микрооперации. В случае АЛУ микрооперации сразу же попадают в очередь планировщика (шесть элементов по три МакОП), который подготавливает необходимые для исполнения микрооперации ресурсы, дожидается их готовности и только потом отправляет. Причем при исполнении одной МакОП на самом деле может происходить исполнение сразу двух действий (МкОП).

Процессор Athlon 64х2

AMD снова оказалась впереди Intel, продемонстрировав действующий экспериментальный образец двухъядерного процессора летом 2004 года и поэтому Intel вызвала всеобщее удивление, все же выйдя первой на рынок с двухъядерным процессором весной 2005 года Однако, мало того, что AMD 64 Х2 был только короткое время позади Pentium Extreme Edition и Pentium D по датам выхода на рынок, он значительно опережал их по показателям эффективности.

Athlon 64 Х2 включает все возможности, заложенные в единственном ядре Athlon 64 (такие, как HyperTransport и Enhanced Virus Protection - EVP). Когда центральный процессор работает под операционной системой Windows ХР (SP2), EVP интерпретирует области системной памяти как «только данные», так что любой находящийся здесь фрагмент кода может быть либо прочитан, либо записан, но не может быть выполнен как код программы. Тем самым EVP действует как профилактическая мера против обычных злонамеренных вирусов, локализуя и обезвреживая их.

Основная архитектура ядра Х2 по существу та же, как и у Athlon 64. Различие в том, что новые чипы, размещаемые на единственном кристалле в 199 квадратных миллиметров, причем каждый содержит более чем 233 миллиона транзисторов, изготовлены по 90 нанометровой технологии AMD.

Таким образом, спецификации первоначально объявленного диапазона Athlon 64 Х2 были эквивалентны таковым из существующих центральных процессоров на 3500+, 3700+, 3800+ и 4000+ с изменением кэша L2 и тактовой частоты. Модели с 512 Кбайт кэша на ядре базируются на двойном ядре «Winchecter», в то время как версии версии кэша L2 на 1 Мбайт используют дизайн «Toledo». К лету 2005 года диапазон был расширен с появлением нового чипа (3800 +).

Athlon 64 x2 модели 5200+ позиционировался производителем как двухъядерное решение среднего уровня на базе АМ2. Именно на его примере и будет изложен порядок разгона данного семейства устройств. Запас прочности у него достаточно неплохой, и при наличии соответствующих комплектующих можно было получить вместо него чипы с индексами 6000+ или 6400+.

Смысл разгона ЦПУ

Процессор AMD Athlon 64 x2 модели 5200+ можно легко превратить в 6400+. Для этого достаточно только повысить его тактовую частоту (в этом и заключается смысл разгона). Как результат - конечная производительность системы вырастет. Но при этом увеличится и энергопотребление компьютера. Поэтому не все так просто. Большинство компонентов компьютерной системы должно иметь запас по надежности. Соответственно, материнская плата, модули памяти, блок питания и корпус должны быть более высокого качества, это значит, что и стоимость у них будет выше. Также система охлаждений ЦПУ и термопаста должны быть специально подобраны именно для процедуры разгона. А вот со штатной системой охлаждения не рекомендуется экспериментировать. Она рассчитана на стандартный тепловой пакет процессора и с увеличенной нагрузкой не справится.

Позиционирование

Характеристики процессора AMD Athlon 64 x2 явно указывают на то, что он относился к среднему сегменту двухъядерных чипов. Были и менее производительные решения - 3800+ и 4000+. Это начальный уровень. Ну а выше в иерархии находились ЦПУ с индексами 6000+ и 6400+. Первые две модели процессоров теоретически можно было разогнать и получить из них 5200+. Ну а сам 5200+ можно было модифицировать до 3200 МГц, и за счет этого получить вариацию уже 6000+ или даже 6400+. Причем технические параметры у них были практически идентичными. Единственное что могло изменяться, так это количество кэша второго уровня и технологический процесс. Как результат уровень их производительности после разгона практически не отличался. Вот и получалось, что при меньшей стоимости конечный владелец получал более производительную систему.

Технические характеристики чипа

Характеристики процессора AMD Athlon 64 x2 могут существенно отличаться. Ведь было выпущено три его модификации. Первая из них носила кодовое название Windsor F2. Работала она на тактовой частоте в 2,6 ГГц, имела 128 кбайт кэша первого уровня и, соответственно, 2 Мб второго уровня. Изготавливался этот полупроводниковый кристалл по нормам 90 нм технологического процесса, а тепловой его пакет был равен 89 Вт. При этом максимальная температура его могла достигать 70 градусов. Ну и напряжение, подаваемое на ЦПУ, могло быть равно 1,3 В или 1,35 В.

Чуть позже появился в продаже чип с кодовым названием Windsor F3. В этой модификации процессора изменилось напряжение (в этом случае оно понизилось до 1,2 В и 1,25 В соответственно), увеличилась максимальная рабочая температура до 72 градусов и уменьшился тепловой пакет до 65 Вт. В довершение к этому изменился и сам технологический процесс - с 90 нм до 65 нм.

Последний, третий вариант процессора носил кодовое название Brisbane G2. В этом случае частота была поднята на 100 МГц и составляла уже 2,7 ГГц. Напряжение могло быть равным 1,325 В, 1,35 В или 1,375 В. Максимальная рабочая температура снижалась до 68 градусов, а тепловой пакет, как и в предыдущем случае, был равен 65 Вт. Ну и сам чип изготавливался по более прогрессивному 65 нм технологическому процессу.

Сокет

Процессор AMD Athlon 64 x2 модели 5200+ устанавливался в сокет АМ2. Второе его название - сокет 940. Электрически и в отношении программного обеспечения он совместим с решениями на базе АМ2+. Соответственно, приобрести для него материнскую плату пока еще возможно. Но вот сам ЦПУ уже купить достаточно сложно. Это неудивительно: процессор появился в продаже в 2007 году. С тех пор успело уже поменяться три поколения устройств.

Подбор материнской платы

Достаточно большой набор материнских плат на базе сокета АМ2 и АМ2+ поддерживал процессор AMD Athlon 64 x2 5200. Характеристики у них были самые разнообразные. Но вот чтобы по максимуму стал возможен разгон этого полупроводникового чипа, рекомендуется обращать внимание на решения на базе чипсета 790FX или 790Х. Стоили подобные материнские платы дороже среднего. Это логично, так как возможности для разгона у них были значительно лучше. Также плата должна быть изготовлена в форм-факторе АТХ. Можно, конечно, попытаться разогнать данный чип и на решениях мини-АТХ, но плотная компоновка радиодеталей на них может привести к нежелательным последствиям: перегреву материнской платы и центрального процессора и выходу их из строя. В качестве конкретных примеров можно привести PC-AM2RD790FX от Sapphire или 790XT-G45 от MSI. Также достойной альтернативой приведенным ранее решениям может стать M2N32-SLI Deluxe от Asus на базе чипсета nForce590SLI, разработанного NVIDIA.

Система охлаждения

Разгон процессора AMD Athlon 64 x2 невозможен без качественной системы охлаждения. Тот кулер, который идет в коробочной версии данного чипа, не подходит для этих целей. Он рассчитан на фиксированную тепловую нагрузку. При увеличении производительности ЦПУ его тепловой пакет возрастает, и штатная система охлаждения уже не будет справляться. Поэтому нужно покупать более продвинутую, с улучшенными техническими характеристиками. Можно порекомендовать для этих целей использовать кулер CNPS9700LED от Zalman. При наличии его данный процессор можно смело разгонять до 3100-3200 МГц. При этом особых проблем с перегревом ЦПУ точно не будет.

Термопаста

Еще один важный компонент, который нужно учитывать перед тем, AMD Athlon 64 x2 5200 +, это термопаста. Ведь чип будет функционировать не в режиме штатной нагрузки, а в состоянии увеличенной производительности. Соответственно, к качеству термопасты выдвигаются более жесткие требования. Она должна обеспечивать улучшенный теплоотвод. Для этих целей рекомендуется заменить штатную термопасту на КПТ-8, которая отлично подойдет для условий разгона.

Корпус

Процессор AMD Athlon 64 x2 5200 будет работать с увеличенной температурой в процессе разгона. В некоторых случаях она может подниматься до 55-60 градусов. Чтобы компенсировать эту увеличенную температуру, одной качественной замены термопасты и системы охлаждения будет недостаточно. Также нужен корпус, в котором воздушные потоки могли бы хорошо циркулировать, а за счет этого обеспечивалось бы дополнительное охлаждение. То есть внутри системного блока должно быть как можно больше свободного пространства, и это бы позволило за счет конвекции обеспечить охлаждение компонентов компьютера. Еще лучше будет, если в нем будут установлены дополнительные вентиляторы.

Процесс разгона

Теперь разберемся с тем, как разогнать процессор AMD ATHLON 64 x2. Выясним это на примере модели 5200+. Алгоритм разгона ЦПУ в это случае будет таким.

  1. При включении ПК нажимаем клавишу Delete. После этого откроется синий экран БИОСа.
  2. Затем находим раздел, связанный с работой оперативной памяти, и снижаем частоту ее работы до минимума. Например, задано значение для ДДР1 333 MHz, а мы опускаем частоту до 200 MHz.
  3. Далее сохраняем внесенные изменения и загружаем операционную систему. Потом с помощью игрушки или тестовой программы (например, CPU-Z и Prime95) проверяем работоспособность ПК.
  4. Опять перезагружаем ПК и заходим в БИОС. Здесь теперь находим пункт, связанный с работой шины PCI, и фиксируем ее частоту. В этом же месте необходимо зафиксировать данный показатель для графической шины. В первом случае значение должно быть установлено в 33 MHz.
  5. Сохраняем параметры и перезагружаем ПК. Заново проверяем его работоспособность.
  6. На следующем этапе выполняется перезагрузка системы. Заново входим в БИОС. Здесь находим параметр, связанный с шиной HyperTransport, и устанавливаем частоту работы системной шины в 400 МГц. Сохраняем значения и перезагружаем ПК. После окончания загрузки ОС тестируем стабильность работы системы.
  7. Потом перезагружаем ПК и входим заново в БИОС. Здесь необходимо теперь перейти в раздел параметров процессора и увеличить частоту системной шины на 10 МГц. Сохраняем изменения и перезагружаем компьютер. Проверяем стабильность системы. Затем, постепенно повышая частоту процессора, доходим до того момента, когда он перестает стабильно работать. Далее возвращаемся к предыдущему значению и опять тестируем систему.
  8. Затем можно попытаться дополнительно разогнать чип с помощью его множителя, который должен быть в этом же разделе. При этом после каждого внесения изменений в БИОС сохраняем параметры и проверяем работоспособность системы.

Если в процессе разгона ПК начинает зависать и вернуться к предыдущим значениям невозможно, то необходимо сбросить настройки БИОСа на заводские. Для этого достаточно найти в нижней части материнской платы, рядом с батарейкой, джампер с надписью Clear CMOS и переставить его на 3 секунды с 1 и 2 контакта на 2 и 3 контакты.

Проверка стабильности системы

Не только максимальная температура процессора AMD Athlon 64 x2 может привести к нестабильной работе компьютерной системы. Причина может быть вызвана рядом дополнительных факторов. Поэтому в процессе разгона рекомендуется проводить комплексную проверку надежности работы ПК. Лучше всего для решения этой задачи подходит программа Everest. Именно с ее помощью и можно проверить надежность и стабильность работы компьютера в процессе разгона. Для этого лишь достаточно после каждых внесенных изменений и после окончания загрузки ОС запускать эту утилиту и проверять состояние аппаратных и программных ресурсов системы. Если какое-то значение выходит за допустимые границы, то нужно перезагружать компьютер и возвращаться к предыдущим параметрам, а затем заново все тестировать.

Контроль системы охлаждения

Температура процессора AMD Athlon 64 x2 зависит от работы системы охлаждения. Поэтому по окончании процедуры разгона необходимо проверить стабильность и надежность работы кулера. Для этих целей лучше всего использовать программу SpeedFAN. Она и бесплатная, и уровень ее функциональности достаточный. Скачать ее из Интернета и установить на ПК не составит особого труда. Далее ее запускаем и периодически, в течение 15-25 минут, контролируем количество оборотов кулера процессора. Если это число стабильно и не уменьшается, то все в порядке с системой охлаждения ЦПУ.

Температура чипа

Рабочая температура процессора AMD Athlon 64 x2 в штатном режиме должна изменяться в диапазоне от 35 до 50 градусов. В процессе разгона этот диапазон будет уменьшаться в сторону последнего значения. На определенном этапе температура ЦПУ может даже превысить 50 градусов, и в этом ничего страшного нет. Максимально допустимое значение - 60 ˚С, приблизившись к которому, рекомендуется прекратить какие-либо эксперименты с разгоном. Более высокое значение температуры может негативно сказаться на полупроводниковом кристалле процессора и вывести его из строя. Для проведения замеров в процессе операции рекомендуется использовать утилиту CPU-Z. Причем регистрацию температуры необходимо осуществлять после каждого внесенного изменения в БИОС. Также нужно выдержать интервал в 15-25 минут, в течении которого периодически проверять, как сильно нагрелся чип.

С установленным на ней ядром процессора (во всех модификациях), а также микросхемами кеш-памяти BSRAM (во всех модификациях, кроме процессоров на ядре Thunderbird). Процессор предназначен для установки в 242-контактный щелевой разъём Slot A .

В процессорах, основанных на ядрах Argon, Pluto и Orion, кеш-память второго уровня работает на частоте от трети до половины частоты ядра , а в процессорах на ядре Thunderbird - на частоте ядра.

На процессорной плате также находится ножевой 40-контактный технологический разъём, закрытый картриджем. Разъём содержит контакты, отвечающие за установку напряжения питания и тактовой частоты. С помощью специального устройства, подключаемого к процессору, возможно изменение этих параметров.

Картридж состоит из двух частей: металлической теплоотводной пластины, контактирующей с кристаллом процессора и микросхемами кэш-памяти (в случае с процессорами, имеющими внешний кэш), а также пластикового кожуха, закрывающего процессорную плату и защищающего установленные на ней элементы от повреждений. Маркировка находится на верхней грани картриджа.

Процессоры Athlon в корпусе типа FCPGA предназначены для установки в системные платы с 462-контактным гнездовым разъёмом Socket A и представляют собой подложку из керамического материала с установленным на ней открытым кристаллом на лицевой стороне и контактами на обратной (453 контакта). Существовали также процессоры с органической подложкой, выпущенные ограниченной партией. На стороне ядра расположены SMD-элементы , а также контакты, задающие напряжение питания и тактовую частоту (обычно называемые мостиками). Контакты располагаются группами, которые имеют обозначения L1 - L7. Маркировка нанесена на кристалл процессора.

Изначально кристалл не был защищён от сколов, которые могли происходить в результате перекоса радиатора при его неправильной установке неквалифицированными пользователями, однако вскоре появилась защита от перекосов в виде четырёх круглых прокладок, расположенных в углах подложки. Несмотря на наличие прокладок, при неаккуратной установке радиатора неопытными пользователями кристалл всё же мог получать трещины и сколы (процессоры с такими повреждениями обычно назывались «ко́лотыми»). В ряде случаев процессор, получивший существенные повреждения кристалла (сколы до 2-3 мм с угла), продолжал работать без сбоев или с редкими сбоями, в то же время, процессор с незначительными сколами мог полностью выйти из строя. Простейший способ проверки процессора на наличие сколов кристалла заключался в проведении по граням кристалла ногтем. В случае наличия сколов палец явно ощущал шероховатость. При наличии лупы или микроскопа сколы определялись визуально. Однако соблюдение мер предосторожности при сборке или установка опытным сборщиком, вместо самостоятельной установки, исключали механические повреждения процессоров с открытым ядром, таких, как процессоры семейства AMD K7 или Intel Pentium III и Celeron с ядром Coppermine.

Модели

На выставке Comdex Fall, проходившей осенью 1997 года в Лас-Вегасе (США), компанией AMD было объявлено о разработке принципиально нового процессора под кодовым названием K7, который должен прийти на смену процессорам серии . В октябре 1998 года были выпущены первые инженерные образцы нового процессора.

Первые процессоры Athlon (ядро Argon) предназначались для настольных компьютеров и производились по 250-нм КМОП -технологии. На смену ядру Argon пришло 180-нм ядро Pluto. Модель, работавшая на частоте 1 ГГц , получила наименование Orion.

Следующим ядром, использованным в процессорах семейства Athlon, стало 180-нм ядро Thunderbird, получившее интегрированный кеш второго уровня . Дальнейшим развитием семейства десктопных процессоров Athlon стали процессоры Athlon XP , вышедшие в октябре 2001 года .

Процессоры Athlon на ядре Argon
Тактовая частота , МГц 500 550 600 650 700
Частота FSB, МГц 200
Анонсирован 23 июня 9 августа 1999 4 октября 1999
Цена, долл. 324 479 699 849 849
Процессоры Athlon на ядрах Pluto и Orion
Тактовая частота, МГц 550 600 650 700 750 800 850 900 950 1000
Частота FSB, МГц 200
Анонсирован 29 ноября 6 января 11 февраля 2000 6 марта 2000
Цена, долл. - - - - 799 - 849 899 999 1299
Процессоры Athlon на ядре Thunderbird
Тактовая частота, МГц 700 750 800 850 900 950 1000 1100 1200 1000 1133 1200 1333 1300 1400 1400
Частота FSB, МГц 200 266 200 266
Анонсирован 5 июня 28 августа 2000 17 октября 2000 30 октября 2000 22 марта 6 июня 2001
Цена, долл. - - - - - - 853 612 - - - 350 318 253

Argon (Model 1)

Первое ядро, использованное в процессорах Athlon, имеет принципиально новую архитектуру по сравнению с предыдущими процессорами компании AMD.

Ключевыми особенностями процессоров архитектуры К7 являются:

  • Новый блок целочисленных вычислений (ALU), содержащий три конвейера глубиной 10 стадий. Это позволяет процессору выполнять до трёх инструкций за такт.
  • Новый блок вещественночисленных вычислений (FPU), содержащий три конвейера глубиной 15 стадий. В предыдущих процессорах компании AMD блок FPU не был конвейерным и не мог начать выполнять новую команду, пока не закончится выполнение предыдущей, что приводило к сильному падению производительности.
  • Системная шина EV6 , лицензированная у компании DEC , обеспечивающая передачу данных по обоим фронтам тактового сигнала. Это позволило при физической частоте 100 МГц получить эффективную частоту 200 МГц, что соответствует пропускной способности 1,6 Гб/с. Кроме того, шина EV6 использует протокол точка-точка, что позволяет организовать более эффективную многопроцессорную систему.
  • Кеш-память первого уровня объёмом 128 Кбайт (64 Кбайт кеш инструкций и 64 Кбайт кеш данных).
  • Расширенный набор инструкций Extended 3DNow! .

Положение на рынке и сравнение с конкурентами

Athlon являлся флагманским процессором компании AMD для настольных компьютеров с момента выхода в июне 1999 года и до появления на рынке процессора Athlon XP в октябре 2001 года . Параллельно с Athlon существовали следующие x86 -процессоры:

  • Intel Pentium III (Katmai). Конкурировал с процессорами Athlon на ядрах Argon, Pluto и Orion. Во многих задачах уступал процессору Athlon, в некоторых - опережал за счёт наличия поддержки расширений SSE .
  • Intel Pentium III (Coppermine). Конкурировал с процессорами Athlon на ядрах Pluto, Orion и Thunderbird. В некоторых задачах уступал процессорам Athlon за счёт архитектурных преимуществ процессоров семейства К7, в некоторых - опережал их за счёт наличия поддержки расширений SSE и за счёт быстрой 256-битной шины кэш-памяти (против 64-битной у Athlon)
  • Intel Pentium 4 . Серьёзно уступал всем конкурентам на равных частотах, однако за счёт архитектуры NetBurst имел значительно более высокий частотный потенциал, что позволяло их опережать в оптимизированных под эту архитектуру приложениях. При некотором преимуществе в тактовой частоте процессоры Pentium 4, выпущенные одновременно с процессорами Athlon, на большинстве приложений уступали конкуренту, но в некоторых задачах были быстрее за счёт поддержки расширений SSE и SSE2 .
  • Intel Celeron (Coppermine-128). Предназначался для рынка недорогих настольных компьютеров. Уступал как процессорам Athlon, так и конкуренту - AMD Duron - в основном за счёт использования медленной системной шины (66 / 100 МГц против 200 / 266 МГц у AMD Athlon и Duron). Уменьшенный до 128 Кбайт кэш второго уровня также не позволял процессорам Celeron приблизиться к конкурентам.
  • AMD Duron . Предназначался для рынка недорогих настольных компьютеров. Уступал процессорам Athlon за счёт меньшего объёма кэша второго уровня, а впоследствии и за счёт менее быстрой системной шины, чем у процессоров Athlon.
  • VIA C3 . Предназначался для компьютеров с низким энергопотреблением, имел крайне низкую производительность и уступал всем конкурирующим процессорам.
  • Transmeta Crusoe . Предназначался для использования в портативных компьютерах. Имел очень низкое энергопотребление, по производительности отставал от равночастотного Athlon.

«Битва за гигагерц»

Технические характеристики

Argon Pluto Orion Thunderbird
Десктопный
Тактовая частота
Частота ядра, МГц 500-700 550-950 1000 650-1000 650-1400
Частота FSB , МГц 200 200-266
Характеристики ядра
Набор инструкций IA-32 , MMX , 3DNow! , Extended 3DNow!
Разрядность регистров 32 бит (целочисленные),
80 бит (вещественночисленные),
64 бит (MMX)
Глубина конвейера Целочисленный: 10 стадий, вещественночисленный: 15 стадий
Разрядность ША 43 бит [ ]
Разрядность ШД 64 бит + 8 бит ECC
Количество транзисторов , млн 22 37
Кеш
Кэш данных 64 Кбайт, 2-канальный наборно-ассоциативный, длина строки - 64 байта, двухпортовый
Кэш инструкций 64 Кбайт, 2-канальный наборно-ассоциативный, длина строки - 64 байта
Кеш
Объём, Кбайт 512 256
Частота 1/2 частоты ядра (модели до 700 МГц)
1/2,5 частоты ядра (модели 750-850 МГц)
1/3 частоты ядра (модели от 900 МГц)
частота ядра
Разрядность BSB 64 бит + 8 бит ECC
Организация Объединённый, наборно-ассоциативный; длина строки - 64 байта Объединённый, наборно-ассоциативный, эксклюзивный; длина строки - 64 байта
Ассоциативность 2-канальный 16-канальный
Интерфейс
Разъём Slot A Socket A
Корпус SECC керамический FCPGA , OPGA
Шина EV6 (DDR)
Технологические, электрические и тепловые характеристики
Технология производства 250 нм КМОП 180 нм КМОП (шестислойный, алюминиевые соединения) КМОП (шестислойный, алюминиевые или медные соединения )
Площадь кристалла, мм² 184 102 120
Напряжение ядра, В 1,6 1,6-1,8 1,8 1,7-1,75
Напряжение кэша L2, В 2,5-3,3 напряжение ядра
Напряжение цепей I/O , В 1,6
Максимальное тепловыделение, Вт 50 62 65 54 72

Наименование моделей

Маркировка процессоров Athlon состоит из трёх строк. Первая строка является наименованием модели, вторая содержит информацию о ревизии ядра процессора и дате его выпуска, третья - информацию о партии процессоров.

Ниже представлена расшифровка строки наименования модели процессоров Athlon с различными ядрами.

Argon (AMD-K7xxx MTR51B):

  • AMD-K7 - процессор AMD K7.
  • xxx - тактовая частота , МГц .
  • M - тип корпуса (картридж).
  • T - напряжение питания (1,6 ).
  • 5 - объём кэш-памяти второго уровня (512 Кбайт).
  • 1 - частота кэш-памяти второго уровня (1/2 частоты ядра).

Pluto, Orion (AMD-K7xxx My R5z B):

  • AMD-K7 - процессор AMD K7.
  • xxx - тактовая частота, МГц.
  • M - тип корпуса (картридж).
  • y - напряжение питания (T: 1,6 В; P: 1,7 В; N: 1,8 В).
  • R - максимальная температура корпуса (70 °C).
  • 5 - объём кэш-памяти второго уровня (512 Кбайт).
  • z - частота кэш-памяти второго уровня (1: 1/2 частоты ядра; 2: 1/2,5 частоты ядра; 3: 1/3 частоты ядра;).
  • B - частота системной шины (200 МГц).

Thunderbird для Slot A (AMD-Axxxx My R24B):

  • AMD-A - процессор AMD Athlon.
  • xxxx - тактовая частота, МГц.
  • M - тип корпуса (картридж).
  • y - напряжение питания (M: 1,75 В; N: 1,8 В; P: 1,7 В; T: 1,6 В).
  • R - максимальная температура корпуса (70 °C).
  • 2 - объём кэш-памяти второго уровня (256 Кбайт).
  • 4 - частота кэш-памяти второго уровня (равна частоте ядра).
  • B - частота системной шины (200 МГц).

Thunderbird для Socket A (Axxxxgyz 3v ):

  • A - процессор AMD Athlon.
  • xxxx - тактовая частота, МГц.
  • g - тип корпуса (A: керамический PGA, D: органический PGA).
  • y - напряжение питания (H: 1,55 В; U: 1,6 В; K: 1,65 В; P: 1,70 В; M: 1,75 В).
  • z - максимальная температура корпуса (T: 90 °C; S: 90 °C).
  • 3 - объём кэш-памяти второго уровня (256 Кбайт).
  • v - частота системной шины (B: 200 МГц; C: 266 МГц).

Ревизии ядер процессоров

Argon Pluto, Orion Thunderbird

Ревизия CPU Id Примечание
A4 0x642h модели AMD-A1000MMR24B A, AMD-A0950MMR24B A, AMD-A0900MMR24B A, AMD-A0850MPR24B A, AMD-A0800MPR24B A, AMD-A0750MPR24B A, AMD-A0700MPR24B A, AMD-A0650MPR24B A (

Процессор Athlon II X2 250 на момент своего выхода в 2009 году принадлежал к сегменту устройств среднего класса. Это лишний раз подтверждается характеристиками данного полупроводникового решения. С тех пор прошло довольно много времени. Теперь этот чип скорее относится к продуктам начального уровня. В данном обзоре будут рассмотрены возможности, спецификации и актуальность данного процессорного решения.

AMD Athlon II X2 250: сегмент процессорного рынка

AMD Athlon II X2 250 на момент начала продаж относился к процессорным решениям среднего класса. Характеристики центральных процессорных устройств в 2009 году следующим образом распределялись по классам:

— решения для офисных компьютеров: включали только один вычислительный модуль, обладали кэш-памятью второго уровня минимального объема и наиболее низкими тактовыми частотами;

— Системные блоки среднего уровня: в обязательном порядке оснащались двухъядерными центральными процессорными устройствами, которые обладали более высокими тактовыми частотами. В данном случае структура кэш-памяти не претерпевала существенных изменений и осталась двухуровневой. Размер кэша в данном уровне был увеличен. В результате в этом случае получился более высокий уровень быстродействия. Однако и стоили такие вычислительные системы намного больше. Именно по этой причине герой данного обзора относился к этому сегменту компьютерного рынка.

— Процессоры для наиболее производительных компьютеров были укомплектованы четырьмя вычислительными модулями. Некоторые из них обладали трехуровневым кэшем. Тактовая частота была существенно снижена, однако указанные ранее особенности обеспечивали максимально возможный уровень производительности.

Данное распределение на сегодняшний день радикально поменялось. Персональные компьютеры начального уровня теперь комплектуются чипами с двумя вычислительными блоками. Одноядерные центральные процессорные устройства ушли со сцены. Поэтому по состоянию на сегодняшний день процессор AMD Athlon II X2 250 перешел в сегмент устройств начального уровня. Персональные компьютеры среднего класса должны быть основаны на центральных процессорах с четырьмя вычислительными кластерами. Устройства премиального сегмента должны быть основаны на ЦПУ с 8 вычислительными кластерами.

AMD Athlon II X2 250: комплектация

Как и большинство процессорных устройств, существующих на сегодняшний день, чип AMD Athlon II X2 250 поставлялся в двух вариантах: TRAY иBOX. TRAY представлял собой упрощенный вариант. В такой комплект поставки помимо самого ЦПУ входило также руководство по настройке и монтажу, наклейка с логотипом модели процессора и гарантийный талон. Такой вариант комплектации прежде всего предназначался для крупных компаний, специализирующихся на сборке системных блоков ПК. Они, как правило, оптом покупали специализированные системы охлаждения центральных процессорных устройств, что в конечном итоге давало возможность повысить надежность данных ЭВМ. Второй вариант комплектации поставлялся в коробе черного-зеленого цвета. Он был дополнен термопастой и штатной системой охлаждения.

AMD Athlon II X2 250: процессорный разъем

Изначально процессор AMD Athlon II X2 250 был ориентирован на установку в сокет AM3. Число контактов в процессорном разъеме составляло 951 со стороны системной платы и 938 со стороны контактной площадки ЦПУ. Основное отличие данного разъема от предшественников в лице АМ2 и АМ2+ заключалось в том, что в этом случае в качестве оперативной памяти можно было использовать только планки типа DDR3. Более ранние вычислительные платформы AMD поддерживали работу только со стандартом оперативной памяти DDR2. Благодаря гибридному контроллеру оперативной памяти данного устройства, процессор AMD Athlon II X2 250 мог без проблем работать как с первым, так и со вторым типом памяти. По этой причине данный чип можно было установить не только в материнские платы АМ3, но и в платы AM3+ иAM2+. В случае использования системной платы на основе AM2+ необходимо было обновить BIOS и получить за счет этого поддержку новых моделей ЦПУ.

AMD Athlon II X2 250: технология производства кристалла

Кремниевый кристалл AMD Athlon II X2 250 изготавливался по наиболее свежему и передовому на тот момент времени технологическому процессу. Его характеристики указывали на то, что он соответствует нормам технологического процесса в 45 нм. На фоне сегодняшних 14 нм это, конечно, выглядит не слишком впечатляюще. Однако на тот момент ничего лучше не было.Напыление p-nпереходов осуществлялось по технологии SOI. По такой же методике изготавливались и предыдущие поколения полупроводниковых чипов этого производителя. В результате не возникало существенных проблем с точки зрения надежности. Процессор данной модели получил в этом плане все самое лучшее, что было наработано на тот момент. В данном случае площадь кремниевого кристалла была равна всего 117.5 мм 2 .

AMD Athlon II X2 250:система кэш-памяти и ее особенности

Как ранее уже отмечалось, все центральные процессорные устройства среднего уровня в 2009 году обязательно комплектовались двухуровневым кэшем. AMD Athlon II X2 250 в этом плане не стал исключением. Технические характеристики чипа указывают на то, что на первом уровне в общей сложности находилось 256 Кб. Они в свою очередь были поделены на две равные части по 128 Кб. Эти части были привязаны к определенному процессорному ядру и взаимодействовать могли только с ним. Каждая из частей по 128 Кб в свою очередь также была поделена на две части. Половина из них использовалась для хранения информации, а вторая половина – для инструкций программного кода. Аналогичным образом была организована и кэш-память на втором уровне. Общий объем кэша второго уровня составлял 2 Мб. То есть каждое ядро процессора на втором уровне могло для своих нужд использовать 1 Мб. В данном случае не было предусмотрено дальнейшего разделения на хранение инструкций и данных.

AMD Athlon II X2 250: оперативная память, особенности

Как ранее уже было отмечено, процессор AMD Athlon II X2 250 использовал унифицированный контроллер оперативной памяти. Процессор мог успешно функционировать с модулями оперативной памяти DDR2 и DDR3. Согласно официальным спецификациям устройства, для AMD Athlon II X2 250 максимальное значение частоты оперативной памяти составляло 1066 МГц. Процессор этой модели может работать с менее скоростными модулями. Частота оперативной памяти будет снижаться автоматически и уровень производительности вычислительной системы будет ниже. Можно также установить и более скоростные планки памяти. Частота их функционирования будет ограничена значением 1066 МГц.

AMD Athlon II X2 250: тепловой пакет

Даже на фоне нынешних процессоров тепловые характеристики AMD Athlon II X2 250 выглядят очень неплохо. В этом плане устройство имело следующие характеристики: тепловой пакет – 65 Вт, максимально допустимая температура 74 °С. Такого приемлемого значения теплового пакета удалось достигнуть благодаря существенной переработке архитектуры проводникового кристалла данного центрального процессорного устройства и за счет передового по тем временам технологического процесса. Последний фактор также существенно уменьшил диапазон рабочих температур, который находился в пределах 35-57 °С.При выполнении наиболее сложного программного кода даже в случае разгона чипа максимальное значение температуры не превышало 65 градусов. Такие значения вполне справедливы для системы, в которой для охлаждения процессора использовался кулер, идущий в комплекте. Если же заменить кулер на улучшенную систему активного теплоотвода стороннего производства, то ранее указанные значения будут уменьшены на 5-10 градусов.

AMD Athlon II X2 250: тактовая частота

Для процессора AMD Athlon II X2 250 штатное значение тактовой частоты составляет 3.00 ГГц. Данное значение можно получить из спецификации процессорного решения. Множитель процессора фиксирован и равен 15. Значение частоты системной шины в штатном режиме составляет 200 МГц. Если умножить на 15 получим 3000 МГц. В этом случае не используется технология динамического регулирования частоты процессора в зависимости от степени его нагрева, сложности программного кода и оптимизации программного обеспечения под одно или двух-поточное исполнение. По этой причине центральный процессор работает только на одном значении частоты, которое составляет 3 ГГц.

AMD Athlon II X2 250: архитектурные особенности кристалла

Если говорить на языке компьютерных технологий, то данный чип называется DUALCORE. Как несложно догадаться по названию, процессор AMD Athlon II X2 250 включает только два ядра для выполнения вычислений.В процессорах от компании AMD по сей день нет технологии типа HT от компании Intel, которая дает возможность на уровне программного обеспечения получить двойное количество логических потоков обработки кода. По этой причине операционная система в данном случае будет распознавать только то, что имеется на физическом уровне. Такие ядра имеют кодовое название REGOR. Данный чип может функционировать в режиме 32-битных и 64-битных вычислений.

AMD Athlon II X2 250: разгон

Как уже говорилось ранее, процессор AMD Athlon II X2 250 имеет фиксированный множитель тактовой частоты. Его разгон возможен только путем увеличения значения частоты шины системной платы. Этот параметр в штатном режиме равен 200 МГц. Это значение можно повысить до 235-237 МГц в сочетании со штатной системой охлаждения. В итоге можно получить частоты функционирования ЦПУ в диапазоне от 3525 до 3555 МГц. В процентном соотношении получается прирост 17.5-18.5%. Если учитывать, что это процессорное решение среднего класса, которое не рассчитано на разгон, такие показатели можно назвать отличными. Но полученные значения можно улучшить. Для этого необходимо приобрести вместо штатного кулера систему охлаждения от стороннего производителя. В таком случае можно будет повысить частоту системной шины до 247-250 МГц, а сам чип будет работать на частотах 3705-3750 МГц. В процентном соотношении прирост может достигать 25%. Разгон в данном случае осуществляется по следующей методике:

— системный блок компьютера должен быть укомплектован особым образом. Речь идет и об улучшенной модификации системной платы, и о максимально скоростной оперативной памяти, и о качественном корпусе с продуманной циркуляцией воздуха, и о мощном блоке питания.

— перед разгоном все программное обеспечение должно быть обновлено. Это необходимо для стабильной работы процессора AMD Athlon II X2 250. В первую очередь речь идет о драйверах и прикладных программах, осуществляющих мониторинг состояния компьютерной системы.

— в BIOS необходимо опустить частоты всех компонентов ПК за исключением системной шины. Это значение постепенно начинаем увеличивать. После выполнения каждой такой операции необходимо проводить стресс-тест компьютера на предмет стабильности работы при помощи специальных программ.

— как только максимально возможное значение частоты будет достигнуто, увеличиваем напряжение на процессоре.

— снова приращиваем частоту. Для этого процессора максимально допустимое значение напряжения составляет 1,425 В. Около этого значения стоит прекратить увеличение частоты. Это и будет максимально возможное значение этого параметра.

AMD Athlon II X2 250: стоимость

Изначально производитель оценил чип AMD Athlon II X2 250 в 90 долларов. На тот момент времени такая стоимость полностью соответствовала всем возможностям устройства. Но сегодня в 2016 году такой процессор все еще можно купить из складских запасов по более скромной стоимости – всего 25 долларов. Можно также приобрести чип уже бывший в употреблении. Его стоимость будет составлять примерно 800-900 рублей. Если этот процессор рассматривать в качестве основного компонента недорого системного блока для офиса, то это может быть вполне достойный выбор, в котором сочетается демократическая стоимость и приемлемая производительность.

AMD Athlon II X2 250: отзывы владельцев, особенности эксплуатации

Компании AMD после выхода семейства чипов Athlon в 2009 году по-настоящему удалось удивить своих конкурентов. В данном модельном ряду наиболее производительным решением стал процессор AMD Athlon II X2 250. На тот момент характеристики данного процессорного решения действительно впечатляли. Одно то, что этот центральный процессор продается достаточно успешно уже более 5 лет, является явным подтверждением тому. За этот временной интервал данный чип переместился из сегмента решений среднего класса к сегменту начального уровня. К основным преимуществам данного процессора от компании AMD, можно отнести следующие:

— Высокий уровень производительности;

— Отличную организацию кэш-памяти, обеспечивающую высокое быстродействие по сравнению с решениями конкурентов;

— Довольно высокий разгонный потенциал для центрального процессорного устройства с разблокированный множителем;

— Доступная стоимость;

— Отличная степень энергоэффективности.

Единственным недостатком данного процессора является неудачное время выпуска. Данный процессор появился в продаже перед началом продаж новой вычислительной платформы от компании Intel – LGA1156. На фоне данной платформы AMD Athlon II X2 250 выглядел уже не так уверенно.

Заключение

AMD Athlon II X2 250 стал безусловно успешным продуктов в линейке процессоров AM3. Его характеристики на момент выхода позволяли без особых проблем справиться с любыми конкурирующими устройствами на основе сокета LGA 775. В данном случае речь идет как о производительности, так и об энергоэффективности. Дополнительный фактор, который также подтверждает успешность данного процессора,это высокая популярность по сей день. Теперь он перешел из ниши процессоров среднего класса в нишу продуктов начального уровня. Если вы все процессоры AMD были бы настолько успешными, как AMD Athlon II X2 250, то возможно сегодня на рынке микропроцессорных устройств сегодня сложилась бы совершенно иная ситуация. Так что успех данного процессора, это скорее случайность, а не закономерность. Хотелось бы, чтобы в рамках новой платформы AM4 компания AMD учла успех этого процессора.