Difference between revisions 21373257 and 24128980 on ukwiki{{Infobox Computer Hardware Cpu | name = Pentium 4 | image = Pentium 4-2,4GHz.JPG | caption = Intel Pentium 4 | produced-start = 2000 | produced-end = 2008 | slowest = 1300 | slow-unit = MHz | fastest = 3800 | fast-unit = GHz | fsb-slowest = 400| fsb-slow-unit = MHz | fsb-fastest = 1066 | fsb-fast-unit = MT/s | manuf1 = Intel | size-from = 0.180 | size-to = 0.065 | arch = [[IA-32]], [[MMX]], [[SSE]], [[SSE2]], [[SSE3]], [[EM64T]] | microarch = [[x86]], [[x86-64]] | sock1 = [[Socket 423]] | sock2 = [[Socket 478]] | sock3 = [[Socket 775]] | core1 = Willamette | core2 = Northwood | core3 = Gallatin | core4 = Prescott | core5 = Cedar Mill | predecessor = [[Pentium III]] | successor = [[Pentium M]] }} '''[[Intel]] [[Pentium]] 4''' — одноядерний мікропроцесор компанії [[Intel]], що був представлений 20 листопада [[2000]] року. Він став першим мікропроцесором, в основі якого була принципово нова архітектура сьомого покоління (за класифікацією [[Intel]]) — [[Intel NetBurst (microarchitecture)|NetBurst]]. Крім різних варіантів Pentium 4 до процесорів архітектури NetBurst відносяться двоядерні процесори [[Pentium D]], а також деякі процесори [[Xeon]], які призначені для серверів. Більш того, частина процесорів [[Celeron]], призначених для систем нижнього цінового рівня, являють собою Pentium 4 з частково відключеним кешем другого рівня. Виробництво процесорів Pentium 4 було почате в 2000 році. З середини 2005 року почався їх поступовий перехід до нижньої цінової категорії. Їх місце зайняли двоядерні процесори [[Pentium D]]. 27 липня 2006 року з'явились перші процесори [[Intel Core 2|Core 2 Duo]], що замінили процесори архітектури NetBurst, а вже 8 серпня 2007 року компанія [[Intel]] повідомила про початок дії програми стосовно зняття з виробництва всіх процесорів архітектури [[NetBurst]]. == Нововведення == ===Hyper Pipelined Technology=== Назвою Hyper Pipelined Technology конвеєр Pentium 4 зобов'язаний своїй довжині – 20 стадій. Для порівняння – довжина конвеєра Pentium III становить 10 стадій. Завдяки декомпозиції виконання кожної команди на більш дрібні етапи, кожен з цих етапів може виконуватися швидше, що дозволяє безперешкодно збільшувати частоту процесора. Так, якщо при використовуваному сьогодні технологічному процесі 0.,18 мкм гранична частота для Pentium III складає 1 ГГц (ну або, за більш оптимістичними оцінками, 1.13 ГГц), Pentium 4 зможе досягти частоти 2 ГГц. Однак, у надмірно довгого конвеєра є і свої недоліки. Перший недолік очевидний – кожна команда тепер, проходячи більше число стадій, виконується довше. Тому, щоб молодші моделі Pentium 4 перевершували по продуктивності старші моделі Pentium III, частоти Pentium 4 починаються з 1.4 ГГц. Якби Intel випустив би Pentium 4 1 ГГц, то цей процесор безсумнівно би програв у продуктивності гігагерцовому [[Pentium III]]. Другий недолік довгого конвеєра розкривається при помилках в пророкуванні переходів. Як і будь-який сучасний процесор Pentium 4 може виконувати інструкції не тільки послідовно, але й паралельно, відповідно не завжди в тому порядку, як вони йдуть у програмі і не завжди достеменно знаючи напрямки умовних переходів. Для того, щоб вибирати в таких випадках гілки програми для подальшого виконання, процесор прогнозує результати виконання умовних переходів на основі накопиченої статистики. Однак, іноді блок пророкування переходів все ж помиляється, і в цьому випадку доводиться повністю очищати конвеєр, зводячи нанівець усю попередньо проведену процесором роботу по виконанню не тієї гілки в програмі. Природно, при більш довгому конвеєрі, його очищення обходиться дорожче в тому сенсі, що на нове заповнення конвеєра йде більше процесорних тактів, а отже і часу. ⏎ ⏎ ===Advanced Dynamic Execution=== Advanced Dynamic Execution, якраз і є мінімізація простою процесора при неправильному прогнозі переходів і збільшення імовірності правильних передбачень. Для цього Intel поліпшив блок вибірки інструкцій для позачергового виконання і підвищив правильність передбачення переходів. Правда, для цього алгоритми передбачення переходів були доопрацьовані мінімально, основним же засобом для досягнення мети було обрано збільшення розмірів буферів, з якими працюють відповідні блоки процесора. Так, для вибірки наступної інструкції для виконання використовується тепер вікно завбільшки в 126 команд проти 42 команд процесора Pentium III. Буфер ж, у якому зберігаються адреси виконаних переходів і на підставі якого процесор пророкує майбутні переходь, тепер збільшено до 4 Кбайт, у тієї годину як у Pentium III його розмір становив всього 512 байт. Результатом цього, а також завдяки невеликій доопрацювання алгоритмом, ймовірність правильного передбачення переходів була поліпшена в порівнянні з Pentium III на 33%. Це дуже хороший показник, оскільки тепер Pentium 4 пророкує переходи правильно в 90-95% випадків. ⏎ ⏎ ===Trace Cache=== Замість звичайного L1 [[Кеш|кешу]], який Pentium III був розділений на область інструкцій і область даних у Pentium 4 застосований новий підхід. Інструкції кеші L1 не зберігаються, він призначений тільки для даних. Для кешу інструкцій тепер використовується Trace Cache, однак у порівнянні зі звичайним L1-кешем він має багато переваг, спрямованих знову ж на мінімізацію простоїв процесора при виконанні неправильних прогнозів переходів. Перше і основне – у Trace Cache зберігаються вже декодовані інструкції. Це означає, що в ньому зберігаються не класичні x86 інструкції, а так звані миікрокомандыи, більш прості операції якими безпосередньо оперує процесорне ядро. Збереження в Trace Cache мікрооперацій дозволяє уникнути повторного декодування інструкцій x86 при повторному виконанні того ж ділянки програми або при неправильному прогнозі переходів. Друга перевага Trace Cache полягає в тому, що мікрооперації в ньому зберігаються саме в тому порядку, в якому вони виконуються. Правда, правильний порядок визначається знову ж таки на підставі передбачення переходів, однак імовірність того, що переходи передсказывбачаються неправильно, досить мала для того, щоб відмовитися від очевидного виграшу, одержуваного шляхом відмови від повторних декодироуванийь і передбачень переходів. Intel не розкриває розмірів свого Trace Cache в кілобайтах, однак, відомо, що в ньому може бути збережено до 12000 мікрооперацій. ⏎ ⏎ ===Rapid Execute Engine=== Найбільш проста частина сучасного процесора – це [[ALU]] (арифметико-логічний пристрій). Завдяки цьому факту, [[Intel]] визнав можливим збільшити його тактову частоту всередині Pentium 4 вдвічі по відношенню до самого процесора. Таким чином, наприклад, в 1.4 ГГц Pentium 4 ALU працює на частоті 2.,8 ГГц. У ALU виконуються прості цілочисельні інструкції, тому, продуктивність нового процесора при операціях з цілими числами повинна бути дуже високою. Однак, на продуктивності Pentium 4 при операціях з речовими числами, MMX або SSE дворазове прискорення ALU ніяк не позначається. Таким чином, латентність ALU істотно знижується. Зокрема, на виконання однієї інструкції типу add Pentium 4 1.4 ГГц витрачає всього 0.35 нс, в той час як виконання цієї команди у Pentium III 1 ГГц займає 1 нс. ⏎ ⏎ ===SSE2=== Реалізувавши у своєму процесорі Athlon новий конвеєрний FPUматематичний співпроцесор, [[Advanced Micro Devices|AMD]] дуже{{джерело}} сильно обігнала інтеловський Pentium III в продуктивності при операціях з речовими числаминад числами з рухомою комою. Однак, Intel у своєму Pentium 4 не став зосереджуватися на вдосконаленняі свого FPU, а просто збільшив можливості блоку SSE. В результаті, в Pentium 4 має місце розширений набір команд SSE2, в якому до наявного набору з 70 інструкцій було додано ще 144. Таке рішення – результат NetBurst ідеології NetBurst, основною метою якої є збільшення швидкості роботи з потоками даних. Інструкції SSE дозволяли оперувати з вісьмома 128-бітними регістрами XMM0..XMM7, в яких зберігалися за чотири дійсних числа одинарної точності. При цьому всі SSE операції проводилися одночасно над четвірками чисел, в результаті чого спеціально оптимізовані програми, в яких проводилося велику кількість однотипних обчислень (а до них, крім обробки потоків даних в якійсь мірі відносяться і 3D-ігри), отримували істотний приріст в продуктивності. SSE2 ж оперує з тими ж самими регістрами і назад сумісний з SSE процесора Pentium III. А настільки вражаюче розширення набору команд викликано тим, що тепер операції з 128-бітними регістрами можуть виконуватися не тільки як з четвірками дійсних чисел подвійної точності, але і як з парами дійсних чисел подвійної точності, з шістнадцятьма однобайтовыними цілими, з вісьмома короткими двобайтовими цілими, з чотирма четырехотирибайтовыими цілими, з двома восьмибайтовыими цілими або з 16 байтовими цілими. Тобто, тепер SSE2 представляючи собою симбіоз MMX і SSE і дозволяє працювати з будь-якими типами даних, влезающимщо можна вмістити в 128-бітові регістри. == Використання кешу == ===L1 кеш=== Що стосується кеша першого рівня в Pentium 4, оскільки тепер команди зберігаються в Trace Cache, він призначений тільки для зберігання даних. Однак, його розмір в Pentium 4, заснованому на ядрі Willamette складає всього 8 Кбайт. Це виглядає досить невеликий цифрою навіть на тлі 16-килобайтной області даних в кеші L1 Pentium III. Однак, Intel був змушений скоротити обсяг кеша першого рівня в Pentium 4, так як ядро цього процесора і без того виходило занадто великим. Тим не менш, архітектура цього процесора може підтримувати L1-кеш і більшого розміру, тому, швидше за все, при переході на технологічний процес 0.13 мкм і нове ядро Northwood, цей кеш буде збільшено. Однак, для збільшення продуктивності, Intel застосував для доступу до L1-кешу новий алгоритм, чим зменшив в Pentium 4 латентність цього кеша до двох процесорних тактів замість трьох тактів в Pentium III. Таким чином, враховуючи більшу тактову частоту Pentium 4, час реакції його L1 кешу складає всього 1.4 нс для 1.4 ГГц моделі проти 3нс у L1 кешу Pentium III 1 ГГц. Також як і у [[Pentium III]], L1 кеш Pentium 4 є write through і асоціативним з 4 областями асоціативності. При цьому довжина одного рядка кеша L1 дорівнює 64 байтам. ⏎ ⏎ ===L2 Advanced Transfer Cache=== [[Процесор]] Pentium 4 має Advanced Transfer Cache другого рівня об'ємом 256 Кбайт. Також, як і у Pentium III, L2-кеш має широку 256-бітну шину, завдяки якій процесори від Intel мають більш високу пропускну здатність кеша, ніж їх конкуренти від AMD, використовують 64-бітну шину кеша. Однак, на відміну від Athlon, в Pentium 4 (втім, також як і у Pentium III) L2 кеш не є ексклюзивним, тобто він дублює дані, що знаходяться в кеші L1. Так як Pentium 4 розрахований на обробк(contracted; show full) були анонсовані процесори Pentium 4 на новому ядрі Northwood на основі ядра Willamette із збільшеним до ½ Мбайт об'ємом кеш-пам'яті другого рівня. Процесори на ядрі Northwood містили 55 млн транзисторів і вироблялися за новою 130 нм КМОН-технологією з мідними з'єднаннями. За рахунок використання нової технології виробництва вдалося значно скоротити площу кристала: кристал процесорів на ядрі Northwood ревізії B0 мав площу 146 мм ², а в наступних ревізіях площа кристала зменшилася до 131 мм ². Тактова частота процесорів Pentium 4 на ядрі Northwood становила 1,6-3,4 ГГц, частота системної шини - 400, 533 або 800 МГц в залежності від моделі. Всі процесори на ядрі Northwood випускалися в корпусі типу FC-mPGA2 і призначалися для установки в системні плати з роз'ємом Socket 478, напруга ядра цих процесорів становило 1,475-1,55 В залежно від моделі, а максимальне тепловиділення - 134 Вт на частоті 3,4 ГГц. (contracted; show full) Існувало чотири моделі процесорів Pentium 4 на ядрі Cedar Mill: 631 (3 ГГц), 641 (3,2 ГГц), 651 (3,4 ГГц), 661 (3,6 ГГц). Всі вони працювали з частотою системної шини 800 МГц, призначалися для установки в системні плати з роз'ємом [[LGA775]], підтримували технологію Hyper-Threading, EM64T, XD-bit, а в останніх ревізіях C1/D0 обзавез'явилися ще й енергозберігаючимиі EIST, С1Е і технологієюя захисту від перегріву ТМ2. Напруга живлення цих процесорів була в межах 1,2-1,3375 В, параметр TDP становив 86 Вт для процесорів степпінгів B1 і C1, в ревізії D0 цей показник вдалося зменшити до 65 Вт. Ядро Cedar Mill також лежало в основі двоядерних процесорів Pentium D на ядрі Presler, які мали не один монолітний кристал, а два кристала аналогічних тим, які використовувалися в процесорах Pentium 4, розташованих на підкладці і закритих теплорозподільною кришкою. Процесори Pentium 4 на ядрі Cedar Mill випускалися до 8 серпня 2007 року, коли компанія Intel оголосила про зняття з виробництва всіх процесорів архітектури NetBurst. == Посилання == '''Офиційна інформація''' * {{Cite web | url=http://www.intel.com/design/Pentium4/documentation.htm |title=Документація по процесорам Intel Pentium 4}}{{ref-en}} '''Опис архітектури та історія процесорів''' * {{Cite web|url=http://www.fcenter.ru/online.shtml?articles/hardware/processors/11103|title=Pentium 4: от Willamette до Prescott|archiveurl=http://www.webcitation.org/61BZPlSXH|archivedate=2011-08-25}}{{ref-en}} * {{Cite web|url=http://www.hardwaresecrets.com/article/235|title=Inside P4 Architecture|archiveurl=http://www.webcitation.org/61BZRGf1l|archivedate=2011-08-25}}{{ref-en}} == Джерела == * [http://www.radioland.net.ua/contentid-214.html Нововведення] * [http://www.radioland.net.ua/contentid-214.html Використання кеша] * [http://www.cpu-world.com/Cores/Cedar%20Mill.html Cedar Mill] == Див. також == * [[Pentium]] * [[Intel]] {{Intel CPU}} All content in the above text box is licensed under the Creative Commons Attribution-ShareAlike license Version 4 and was originally sourced from https://uk.wikipedia.org/w/index.php?diff=prev&oldid=24128980.
![]() ![]() This site is not affiliated with or endorsed in any way by the Wikimedia Foundation or any of its affiliates. In fact, we fucking despise them.
|