Новое поколение микроархитектуры Intel® Core™ 45 нм

Во второй половине 2007 года корпорация Intel начнет производство нового поколения семейства процессоров Intel® Core™2 с кодовым названием «Penryn».

Инновации и усовершенствования обеспечивают повышение производительности и сокращение энергопотребления.

Новые процессоры построены на базе ведущей в отрасли 45-нанометровой производственной технологии с использованием металлических затворов Hi-k и новейших улучшений микроархитектуры. Эта дальнейшая ступень развития микроархитектуры Intel® Core™ стала возможной благодаря огромному успеху нашей революционной микроархитектуры, которая в настоящее время используется в процессорах семейства Intel® Xeon® и Intel® Core™2. Она отмечает новую веху непрерывного прогресса корпорации Intel. Каждый год компания внедряет новые производственные технологии с улучшенной архитектурой или совершенно новой архитектурой.

В двухъядерных процессорах семейства Penryn на базе 45-нанометровой производственной технологии используется более 400 миллионов транзисторов, а в четырехъядерных – более 800 миллионов транзисторов. При этом процессоры на базе новой микроархитектуры обеспечивают значительное повышение производительности при такой же тактовой частоте, увеличение объема кэш-памяти второго уровня до 50%, а также расширенные функции управления питанием, благодаря которым достигается новый уровень энергосбережения. В процессорах семейства Penryn также используется около 50 новых наборов команд Intel® Streaming SIMD Extension 4 (Intel® SSE4), что обеспечивает повышение производительности мультимедийных приложений и приложений для высокопроизводительных вычислений.

Семейство процессоров Penryn включает новые двухъядерные процессоры для настольных ПК, четырехъядерные процессоры для настольных ПК, четырехъядерные серверные процессоры и двухъядерные процессоры для мобильных ПК.

Микроархитектура Intel Core

Корпорация Intel впервые представила микроархитектуру Intel Core в 2006 году, реализовав ее в процессорах Intel® Core™2 Duo на базе 65-нанометровой производственной технологии. Первое поколение этой микроархитектуры, оптимизированной для многоядерных процессоров, позволило более полно реализовать философию энергосбережения, которая была выбрана для микроархитектуры процессоров Intel® Pentium® M для мобильных ПК. Кроме того, в этой микроархитектуре были использованы различные современные инновации, обеспечивающие рекордное повышение производительности, улучшение энергосбережения и повышение быстродействия при работе в многозадачной среде.

Микроархитектура Intel Core включает следующие инновации:
Технология Intel® Wide Dynamic Execution
Технология Intel® Intelligent Power Capability
Технология Intel® Advanced Smart Cache
Технология Intel® Smart Memory Access
Технология Intel® Advanced Digital Media Boost

Процессоры на базе микроархитектуры Intel Core продемонстрировали рекордную производительность в отраслевых тестах для платформ для настольных ПК, мобильных ПК и серверов массово категории (информация о результатах тестов приведена на сайте www.intel.com/performance ). Например, четырехъядерные процессоры Intel® Xeon® на базе 65 -нанометровой производственной технологии демонстрируют повышение производительности в 2,5 раза по сравнению с серверными решениями предыдущего поколения.¹ Настольные ПК на базе процессора Intel Core 2 Duo обеспечивают повышение производительности до 40 % при сокращении энергопотребления.² Мобильные ПК на базе процессора Intel Core 2 Duo обеспечивают повышение производительности при работе в многозадачной среде до двух раз и более высокую энергоэкономичность, позволяющую увеличить время автономной работы.³

Новое поколение процессорных технологий Intel® на базе 45-нанометровой производственной технологии с использованием металлических затворов Hi-K

В январе 2007 г. корпорация Intel объявила об одном из важнейших прорывов в фундаментальных принципах проектирования транзисторов за последние 40 лет, использовав совершенно новые материалы транзисторов (новое сочетание проводников и диэлектриков затворов Hi-k) для создания нового поколения процессоров Intel Core 2, содержащего сотни миллионов микроскопических 45-нанометровых транзисторов. Этот прорыв в области создания транзисторов позволит корпорации Intel и дальше обеспечивать рекордную производительность процессоров для настольных ПК, ноутбуков и серверов и сокращать утечку тока из транзисторов, оптимизируя тем самым конструкцию и размеры процессоров и компьютеров, энергопотребление и затраты. Увеличивая скорость переключения транзисторов, этот прорыв обеспечивает возможность повышения тактовой частоты ядер и системной шины, а соответственно и производительности, без увеличения энергопотребления и тепловыделения. Это поможет обеспечить дальнейшее выполнение закона Мура (аксиома индустрии высоких технологий, согласно которой число транзисторов в микросхемах удваивается каждые два года, что обеспечивает расширение функциональности при экспоненциальном уменьшении стоимости) в ближайшее десятилетие.

По сравнению с 65-нанометровой производственной технологией, 45-нанометровая производственная технология Intel с использованием диэлектриков Hi-k обеспечит следующие преимущества для продукции:
Увеличение плотности размещения транзисторов почти в два раза выше (что позволяет уменьшить размер микросхем или увеличить количество транзисторов)
Уменьшение мощности переключения транзисторов примерно на 30%
Увеличение скорости переключения транзисторов более чем на 20% или сокращение утечки мощности более чем в пять раз
Уменьшение утечки мощности из оксида затворов транзисторов более чем в 10 раз, благодаря чему уменьшаются требования к энергопотреблению и увеличивается время автономной работы

В январе 2007 года корпорация Intel продемонстрировала первый в мире процессор на базе 45 -нанометровой производственной технологии с диэлектриками Hi-k. Этим она еще раз подчеркнула свое ведущее положение по сравнению с другими предприятиями отрасли, которые она опережает в своих разработках более чем на год. Гордон Мур (Gordon Moore), один из основателей корпорации Intel, сказал: "Использование диэлектриков Hi-k и новых металлических материалов знаменует собой крупнейшее изменение в транзисторных технологиях с момента появления МОП-транзисторов с полукристаллическими кремниевыми затворами в конце 1960-х годов".

Penryn, новое поколение процессоров Intel Core 2

В процессорах Penryn, первом семействе процессоров, построенных на базе новой 45 -нанометровой производственной технологии Intel с диэлектриками Hi-k, используются все преимущества дополнительных транзисторов, которые эта технология позволяет поместить в процессор. В процессорах Intel Core 2 и Intel Xeon на базе этой новой производственной технологии будут использоваться новые архитектурные инновации и

усовершенствования, которые ускорят работу программного обеспечения и помогут сократить энергопотребление.

Ускорение работы программного обеспечения В семейство Penryn входит ряд улучшений микроархитектуры, повышающих производительность разнообразных приложений.

Новые команды Intel SSE4

В процессорах семейства Penryn будет поддерживаться набор команд Intel Streaming SIMD Extensions 4 (SSE4). Набор команд Intel SSE4 представляет собой самое значительное усовершенствование архитектуры команд для мультимедийных приложений с 2001 года. Он расширяет архитектуру набора команд Intel® 64, позволяя более эффективно использовать преимущества новой 45 -нанометровой производственной технологии, повышая производительность и расширяя возможности архитектуры Intel®. Набор команд Intel SSE4 повысит производительность приложений, использующих один поток команд и несколько потоков данных (SIMD), и позволит микропроцессорам Penryn обеспечить высочайшую производительность и энергоэкономичность разнообразных 32- и 64- разрядных приложений. Увеличение производительности будут реализовано в приложениях для работы с графикой, системах кодирования и обработки видео, приложениях для работы с трехмерными изображениями и компьютерных играх. Также новый набор команд сможет эффективно использоваться в таких ресурсоемких приложениях как алгоритмы сжатия звука, изображений и данных, и для многих других приложений.

Набор команд Intel SSE4, реализованный в процессорах семейства Penryn, обеспечит повышение производительности благодаря следующим преимуществам:
Добавление поддержки двух различных векторных операций умножения с 32- разрядными целыми числами
Добавление 8- разрядных неподписанных операций с минимумом и максимумом, а также 16- разрядных и 32- разрядных подписанных и неподписанных версий
Добавление функций, повышающих эффективность компиляторов при векторизации целочисленного кода и кода с одинарной точностью
Смешение, тестирование и округление, а также расширения знаков/нулей, непосредственно заменяют существующие долгосрочные операции
Вставки и извлечения – компоненты для сбора (просмотра), рассеяния, пошаговые нагрузки и хранилища шагов

Добавление специальных операций, обеспечивающих значительные преимущества на прикладном уровне в следующих областях:
Функции ускорения кодирования видео
Операции умножения с плавающей запятой (важны для игр и создания трехмерной графики)
Команда потоковой загрузки (важна для обработки видео и изображений, а также для приложений, распределяющих данные между графическим процессором и центральным процессором)

При этом достигается значительное увеличение производительности. Например, команда потоковой загрузки набора команд Intel SSE4 увеличивает пропускную способность для считывания данных из буфера графических кадров. Доставка полных строк кэша (64 байта за раз по сравнению с 8 байтами за раз) и их сохранение во временном буфере позволяет с помощью этой команды повысить теоретическую пропускную способность чтения до 8 раз.

Увеличенная и более функциональная кэш-память с технологией Intel® Advanced Smart Cache В процессорах Penryn объем кэш-памяти 2 уровня увеличен на 50%. Кроме того, в кэш-память добавлены возможности 24 -стороннего ассоциирования, позволяющие увеличить процент подстановок и максимально повысить эффективность использования ресурсов. В двухъядерных процессорах Penryn будет использоваться до 6 МБ кэш-памяти 2 уровня, а в четырехъядерных процессорах – до 12 МБ кэш-памяти 2 уровня. Большая кэш-память повышает производительность и эффективность приложений, увеличивая вероятность доступа к данным в высокопроизводительной и эффективной подсистеме кэш-памяти для каждого ядра процессора.

Кэш-память процессоров семейства Penryn также имеет расширенные возможности частичной загрузки строк из кэш-памяти. Частичная загрузка производится, когда при считывании данных часть данных находится в одной строке кэш-памяти, а другая часть данных – в другой строке. Данные из двух строк кэш-памяти считываются в несколько раз медленнее, чем из одной строки, даже если данные надлежащим образом сопоставлены. Расширенные возможности частичной загрузки строк, реализованные в процессорах Penryn, значительно повышают производительность за счет спекулятивной обработки обоих частей до загрузки других данных. Благодаря этому повышается производительность некоторых приложений, выполняющих сканирование данных, например, оценку движения на видео.

Высокоскоростные ядра и системная шина

Процессоры семейства Penryn будут работать с более высокой тактовой частотой (более 3 ГГц в некоторых версиях), чем процессоры предыдущего поколения Intel Core 2. Кроме того, они будут поддерживать частоту системной шины до 1, 600 ГГц в дополнение к поддерживаемым сегодня частотам системной шины 1,066 ГГц и 1,333 ГГц. Это также обеспечит повышение общей производительности системы.

Расширенная технология Intel® Virtualization

В процессорах Penryn скорость перехода (вход / выход) виртуальных машин увеличивается на 25 - 75 %. Это достигается за счет усовершенствования микроархитектуры и не требует изменения программного обеспечения виртуальных машин. (Виртуализация разбивает компьютер на несколько разделов, на каждом из которых может работать отдельная ОС с набором приложений. Это позволяет лучше использовать возможности многоядерных процессоров, повышает эффективность работы и позволяет сократить расходы, используя один компьютер как несколько виртуальных компьютеров.)

Уникальный механизм перетасовки

Блок перетасовки шириной 128 бит в процессорах Penryn сможет выполнять операции перетасовки полной ширины за один тактовый цикл. Это позволяет удвоить скорость большинства операций перетасовки данных на уровне байт, слов или двойных слов для команд SSE и значительно снизить задержку и повысить пропускную способность для команд SSE2, SSE3 и SSE4, где используются такие сходные с перетасовкой операции как упаковка, распаковка и перемещение с широкой упаковкой. Эта функция обеспечивает общее повышение производительности разнообразных алгоритмов SSE.

Высокопроизводительный делитель Radix 16

Процессоры Penryn обеспечивают высокую производительность операций деления благодаря почти двукратному увеличению скорости делителя по сравнению с процессорами предыдущих поколений. Это обеспечивает повышение производительности научных вычислений, преобразований трехмерной графики и других функций с высокой математической нагрузкой. Использование новой высокопроизводительной методики деления Radix 16 ускоряет операции деления целых чисел и чисел с плавающих запятой. (Алгоритм radix 4 вычисляет 2 бита частного за каждый шаг. Переход на алгоритм radix 16 позволяет вычислять 4 бита за каждый шаг, что уменьшает время задержки в 2 раза).

Пересылка результата

Чтобы ускорить считывание результатов из неправильно организованного хранилища, пересекающего границу в 8 байт и находящегося в магистрали, в процессорах Penryn имеется возможность пересылки результата из хранилища непосредственно в загрузку, вместо ожидания завершения операции и записи в память.

Повышенная производительность примитивов при синхронизации ОС

Некоторые ОС временно блокируют или маскируют прерывания при запуске важных элементов кода и необходимости эксклюзивного доступа к ресурсу, например, к устройству ввода/вывода. Используя быстрые прерывания очистки и установки (CLI/STI), процессоры Penryn могут быстрее входить в этот режим и выходить из него, что обеспечивает значительное увеличение производительности. Кроме того, они могут быстрее выполнять заблокированные команды (например, XCHG, ADD/XADD/NEG/BTS/AND и CMPXCHG). В процессорах Penryn также ускорен доступ к счетчику временных меток (счетчик считывания временной метки или RDTSC). Эта функция может часто использоваться в базах данных или при обработке транзакций на сервере.

Уменьшение энергопотребления

В дополнение к преимуществам 45-нанометровой производственной технологии Intel с использованием диэлектриков Hi-k, в процессорах семейства Penryn сохраняются преимущества энергоэкономичности микроархитектуры Intel Core с двумя важными дополнениями: технологией Deep Power Down и технологией Intel® Dynamic Acceleration.

Технология Deep Power Down

Это абсолютно новое состояние управления питанием (C-state) значительно снижает энергопотребление процессора в периоды простоя, в связи с чем внутренняя утечка мощности в транзисторах перестает иметь значение. Это новейшее состояние "сна" процессора – состояние с самым низким уровнем энергопотребления. В этом состоянии значительно увеличивается время автономной работы ноутбука. Благодаря этой технологии процессоры Penryn имеют значительно более низкие показатели энергопотребления по сравнению с энергоэффективными процессорами Merom, относящимися к предыдущему поколению архитектуры Intel Core.

В состоянии Deep Power Down, процессор очищает кэш-память, сохраняет состояние микроархитектуры процессора и отключает питание ядер и кэш-памяти 2 уровня. В состоянии Deep Power Down набор микросхем продолжает обслуживать трафик памяти для операций ввода/вывода, но не переводит при этом процессор в активное состояние. Когда требуется использовать ресурсы ядра, повышается напряжение, включаются тактовые циклы, перезагружается процессор, восстанавливается состояние микроархитектуры и возобновляется выполнение команд.

Чем глубже состояние сна, тем больше тратится энергии на переход в это состояние и выход из него. Слишком частый переход в состояния глубокого сна может привести к потере энергии. Для предотвращения этого в процессорах Penryn имеется функция автоматического снижения уровня, использующая эвристические механизмы для определения того, оправдывает ли экономия энергии затраты энергии на выключение процессора и его перезапуск. Если это не так, запрос на переход в состояние Deep Power Down понижается до уровня C4, т.е. менее глубокого сна. В результате достигается экономия энергии, соответствующая вероятному периоду простоя.

Расширенная технология Intel® Dynamic Acceleration

Для дополнительного увеличения производительности однопоточных приложений, корпорация Intel расширила возможности технологии Intel Dynamic Acceleration Technology, доступной в существующих процессорах Intel Core 2 Duo. Эта функция использует энергетический потенциал, освобождающийся в момент, когда одно ядро становится неактивным, для повышения производительности другого ядра, продолжающего работать. (Представьте себе душ с двумя мощными головками. Когда одна головка отключается, давление воды во второй увеличивается). Если одно ядро находится в состоянии C3 или более глубокого сна, часть энергии, обычно используемая этим ядром, может подаваться на активное ядро без превышения при этом температурных спецификаций процессора. Это повышает скорость выполнения однопоточных приложений, увеличивая производительность.

Выпуск нового поколения микроархитектуры Intel ожидается в 2008 году

Достижения корпорации Intel в области архитектуры и полупроводниковых технологий основаны на быстрых темпах внедрения инноваций, позволяющих обеспечить прирост производительности процессоров и сокращение их энергопотребления в следующем десятилетии и более отдаленном будущем. В корпорации Intel такую форму развития называют моделью "тик-так". Каждый "тик" отражает новый этап развития полупроводниковой производственной технологии и усовершенствования в области микроархитектуры. Каждый "так" соответствует созданию совершенно новой микроархитектуры. Цикл повторяется приблизительно каждые два года.

Семейство процессоров Penryn на базе 45 -нанометровой производственной технологии Intel с использованием металлических затворов Hi-k представляет собой последний "тик" и включает многочисленные инновации микоархитектуры Intel Core. В 2008 году корпорация Intel собирается представить совершенно новую микроархитектуру под кодовым названием "Nehalem", которая станет новым этапом "так".

Микроархитектура Nehalem является действительно динамической и масштабируемой микроархитектурой. В этой микроархитектуре для каждой платформы будет обеспечена требуемая производительность и реализовано оптимальное соотношение "цена/производительность/энергоэкономичность".

Микроархитектура Nehalem сможет обеспечивать производительность по требованию, используя для этого следующие возможности:
Динамическое управление ядрами процессора, вычислительными потоками, кэш-памятью, интерфейсами и питанием
Возможность обработки 4 команд за один тактовый цикл в микроархитектуре Intel Core (способность микроархитектуры Intel Core регулярно обрабатывать до 4 команд за один тактовый цикл, по сравнению со способностью других процессоров обрабатывать 3 команды за тактовый цикл или менее)
Параллельная обработка потоков (технология Intel® Hyper-Threading), обеспечивающая повышение производительности и сокращение энергопотребления
Расширение архитектуры с инновационными наборами команд Intel® SSE4 и ATA
Высокопроизводительная многоуровневая общая кэш-память
Высокая пропускная способность памяти и системная производительность
Динамическое управление питанием с повышением производительности

Масштабируемость микроархитектуры Nehalem обеспечивает оптимальное соотношение "цена/производительность/энергоэкономичность" для каждого сегмента рынка за счет следующих решений:
Новая системная архитектура для процессоров и платформ Intel нового поколения
Масштабируемость производительности, от 1 до 16 (и более) потоков и от 1 до 8 (и более) ядер процессоров
Масштабируемые настраиваемые внутрисистемные соединения и интегрированные контроллеры памяти
Высокопроизводительный интегрированный графический процессор для клиентских платформ

Процесс разработки новых процессоров продолжается с 32-нанометровой производственной технологией

После выпуска микроархитектуры Nehalem появятся процессоры на базе будущей 32-нанометровой производственной технологии Intel. Этот следующий «тик» в развитии полупроводниковых технологий и микроархитектур сохранит за корпорацией Intel ведущие позиции на IT-рынке и в будущем. Для наших клиентов это будет означать постоянное увеличение производительности и эффективности, а также постоянное внедрение новых функций и возможностей.

¹ Сравнение проводилось на основании результатов теста SPECint*_rate_base2000. Для сравнения использовалась платформа на базе четырехъядерного процессора Intel® Xeon® E5355 и платформа на базе двухъядерного процессора AMD Opteron* 2220SE.

² Для измерения производительности использовалось сравнение результатов тестов SPECint_base2000 и SPECint_rate_base2000(2 копии) для процессоров Intel® Core™2 Duo для настольных ПК и процессоров Intel® Pentium® D 805. Реальные значения производительности могут отличаться. Дополнительная информация приведена на сайте www.intel.com/performance .

³ Данные о производительности приведены в сравнении с предыдущим поколением процессоров Intel® Pentium® M. Реальные значения производительности могут отличаться. Более подробную информацию и результаты тестов можно найти по адресу www.intel.com/performance .

Все указанные даты, цифры и сведения о продукции и платформах являются предварительными, основаны на текущих оценках и могут быть изменены без уведомления.

Все данные основаны на сравнении инженерных спецификаций или измерений, проведенных на реальном аппаратном обеспечении или на симуляторах.

Для работы технологии Intel® Virtualization необходима вычислительная система с процессором, набором микросхем, BIOS, монитором виртуальных машин (VMM), а для некоторых моделей использования определенного ПО для платформы, доступного для нее. Функциональные возможности, производительность и другие преимущества могут зависеть от конфигурации аппаратного и программного обеспечения и могут потребовать обновления BIOS. Некоторые приложения могут быть несовместимыми с определенными операционными системами. Дополнительную информацию можно получить у разработчика приложения.


Источник: Intel.com

Добавить комментарий




:smile1: :smile2: :smile3: :smile4: :smile5: :smile6: :smile7: :smile8: :smile9: :smile10: :smile11: :smile12: :smile13: :smile14: :smile15: :smile16: :smile17: :smile18:


Яндекс цитирования Rambler's Top100 Рейтинг@Mail.ru
Реклама: