Что ограничивает скорость процессора?

Недавно я поговорил с другом о компиляции LaTeX. LaTeX может использовать только одно ядро ​​для компиляции. Поэтому для скорости компиляции LaTeX наиболее важна тактовая частота процессора (см. Советы по выбору оборудования для лучшей компиляции LaTeX )

Из любопытства я искал процессоры с наивысшими тактовыми частотами. Я думаю, что это был Intel Xeon X5698 с частотой 4,4 ГГц ( источник ), который имел самую высокую тактовую частоту.

Но этот вопрос не касается продаваемых ЦП. Я хотел бы знать, как быстро это можно получить, если вы не заботитесь о цене.

Итак, один вопрос: Есть ли физический предел скорости процессора? Насколько высока эта проблема?

И еще один вопрос: Какова максимальная скорость процессора, достигнутая до сих пор?

Я всегда думал, что скорость процессора ограничена, потому что охлаждение (так тепло ) становится настолько сложным. Но мой друг сомневается, что это причина (когда вам не нужно использовать традиционные /дешевые системы охлаждения, например, в научном эксперименте).

В [2] я читал, что задержки передачи вызывают еще одно ограничение скорости процессора. Тем не менее, они не упоминают, как быстро это может быть достигнуто.

Что я нашел

Обо мне

Я студент-информатик. Я кое-что знаю о процессоре, но не слишком. И даже меньше о физике, которая может быть важна для этого вопроса. Поэтому, пожалуйста, помните об этом, если это возможно.

93 голоса | спросил Martin Thoma 20 J000000Sunday14 2014, 19:37:15

7 ответов


71

Практически, что ограничивает скорость ЦП как тепла, так и задержки ворот, но, как правило, тепло становится намного более серьезным вопросом, прежде чем последний начнет удары.

Последние процессоры производятся с использованием технологии CMOS. Каждый раз, когда есть тактовый цикл, мощность рассеивается. Следовательно, более высокие скорости процессора означают большее рассеивание тепла.

http://en.wikipedia.org/wiki/CMOS

Вот несколько цифр:

Core i7-860 (45 нм) 2,8 ГГц 95 Вт
Core i7-965 (45 нм) 3,2 ГГц 130 Вт
Core i7-3970X (32 нм) 3,5 ГГц 150 Вт

введите описание изображения здесь>> </p>

<p> Вы можете увидеть, как увеличивается мощность перехода процессора (экспоненциально!). </p>

<p> Кроме того, существуют некоторые квантовые эффекты, которые накачиваются, когда размер транзисторов уменьшается. На нанометровом уровне транзисторные ворота фактически становятся «протекающими». </p>

<p> <a href= http://computer.howstuffworks.com/small-cpu2.htm

Я не буду понимать, как эта технология работает здесь, но я уверен, что вы можете использовать Google для поиска этих тем.

Хорошо, теперь, для задержек передачи.

Каждый «провод» внутри ЦП действует как небольшой конденсатор. Кроме того, база транзистора или затвора МОП-транзистора действуют как небольшие конденсаторы. Чтобы изменить напряжение на соединении, вы должны либо зарядить провод, либо снять заряд. Когда транзисторы сжимаются, это становится все труднее. Вот почему SRAM нуждается в усилении транзисторов, потому что фактически массивные транзисторы памяти настолько малы и слабы.

  

В типичных конструкциях ИС, где плотность очень важна, битовые ячейки имеют очень маленькие транзисторы. Кроме того, они обычно встроены в большие массивы, которые имеют очень большие емкости бит-линии. Это приводит к очень медленному (относительно) разряду бит-линии по бит-ячейке.

От: Как реализовать усилитель чувствительности SRAM?

В основном, дело в том, что для небольших транзисторов сложнее подключать межсоединения.

Кроме того, есть задержки затвора. Современные процессоры имеют более десяти этапов конвейера, возможно, до двадцати.

Проблемы производительности при конвейерной обработке

Существуют также индуктивные эффекты. На микроволновых частотах они становятся весьма значительными. Вы можете искать перекрестные помехи и такие вещи.

Теперь, даже если вам удастся получить процессор 3265810 THz, еще одним практическим ограничением является то, как быстро остальная часть системы может его поддерживать. Вы либо должны иметь RAM, хранилище, логику клеев и другие межсоединения, которые работают так же быстро, или вам нужен огромный кеш.

Надеюсь, что это поможет.

ответил fuzzyhair2 20 J000000Sunday14 2014, 21:48:00
29

Тепловая проблема хорошо покрыта fuzzyhair. Чтобы суммировать задержки передачи, рассмотрите следующее: время, необходимое для электрического сигнала, пересекающего материнскую плату, теперь более одного такта современного процессора. Таким образом, создание более быстрых процессоров не принесет больших результатов.

Супер-быстрый процессор действительно полезен только для массовых процессов хрустания, и только тогда, когда ваш код тщательно оптимизирован для работы на чипе. Если ему часто приходится куда-то искать данные, вся эта дополнительная скорость будет потрачена впустую. В современных системах большинство задач можно запускать параллельно, а большие задачи разбиваются на несколько ядер.

Похоже, ваш процесс компоновки латекса будет улучшен с помощью:

  • быстрее IO. Попробуйте RAMdisk.
  • запуск различных документов на разных ядрах
  • не ожидает, что 200-страничное интенсивное изображение будет выполнено через 2 секунды.
ответил paul 21 J000000Monday14 2014, 06:27:11
15

Существуют три физических предела: тепло, задержка затвора и скорость электрической передачи.

Мировой рекорд с наивысшей тактовой частотой (согласно этой ссылке) 8722.78 МГц

Скорость электропередачи (примерно такая же, как скорость света) является абсолютным физическим пределом, поскольку данные не могут передаваться быстрее, чем среда. В то же время этот предел очень высок, поэтому он обычно не является ограничивающим фактором.

Процессоры состоят из огромного количества вентилей, из которых немало подключено последовательно (один за другим). Переключение с высокого состояния (например, 1) на низкое состояние (например, 0) или наоборот занимает некоторое время. Это задержка затвора. Поэтому, если у вас есть 100 вентилей, подключенных последовательно, и один занимает 1 нс для переключения, вам придется подождать не менее 100 нс для всего, чтобы дать вам действительный результат.

Эти коммутаторы - это то, что потребляет наибольшее количество энергии на процессоре. Это означает, что если вы увеличиваете тактовую частоту, вы получаете больше переключателей, поэтому используйте больше мощности, чтобы увеличить выходную мощность.

Overvolting (=> обеспечение большей мощности) немного уменьшает задержку затвора, но снова увеличивает выходную мощность.

Где-то около 3 ГГц потребление энергии на тактовую частоту увеличивается чрезвычайно. Вот почему процессоры с тактовой частотой 1,5 ГГц могут работать на смартфоне, в то время как большинство процессоров с тактовой частотой 3-4 ГГц нельзя даже запускать на ноутбуке.

Но скорость часов - это не единственное, что может ускорить работу процессора, а оптимизация на конвейере или архитектура микрокода может привести к значительному ускорению. Вот почему 3 ГГц Intel i5 (Dualcore) работает в несколько раз быстрее, чем 3 ГГц Intel Pentium D (Dualcore).

ответил Dakkaron 21 J000000Monday14 2014, 17:24:34
3
  

Итак, один вопрос: есть ли физический предел скорости процессора?

Это сильно зависит от самого ЦП. Производственные допуски приводят к тому, что физический предел немного отличается для каждого чипа даже с той же пластины.

  

задержки передачи вызывают еще одно ограничение скорости ЦП. Тем не менее, они не упоминают, как быстро это может быть достигнуто.

Это потому, что delay <или длина пути скорости является выбором для создателя чипа. В двух словах, насколько работает логика за один такт . Более сложная логика приводит к более медленным максимальным тактам, но также использует меньшую мощность.

Вот почему вы хотите использовать контрольный показатель для сравнения процессоров. Число работ за цикл значительно отличается, поэтому сравнение сырой МГц может дать вам неправильную идею.

ответил Turbo J 20 J000000Sunday14 2014, 21:33:07
3

Ответы на ваши вопросы: Да , существует ограничение на физическое для скорости процессора. Самый высокий теоретический предел будет определяться тем, насколько быстро «переключатель» может переключать состояния. Если мы используем электрон в качестве основы для переключателя, мы используем радиус Бора $$ r = 5.291 \ times 10 ^ {- 11} $$ и максимально возможную скорость $$ c = 3 \ times 10 ^ 8, $$ для вычисления частоты $$ F = \ frac {1} {t} = \ frac {c} {2} \ pi r = 9.03 \ times 10 ^ {17} \ text {Hz} $$ При текущем , фактический предел составляет около $$ 8 \ times 10 ^ 9 \ text {Hz} $$

ответил Guill 1 PM000000120000003231 2014, 12:59:32
2

Фактически, определенная тепловая мощность приблизительно пропорциональна квадрату напряжения: http : //en.wikipedia.org/wiki/Thermal_design_power#Overview Каждый материал имеет свою удельную теплоемкость, что ограничивает эффективность охлаждения.
Не рассматривая технические проблемы при задержке охлаждения и передачи, вы обнаружите, что скорость света ограничивает расстояние, на которое сигнал может перемещаться внутри нашего процессора в секунду. Следовательно, процессор должен получить samller, чем быстрее он работает. Наконец, он работает за определенную частоту, CPU может стать прозрачным для электронных волновых функций (электронов, моделируемых как волновые функции, следуя уравнению Шредингера). В 2007 году некоторые физики вычислили фундаментальный предел для рабочих скоростей: http: //journals.aps .org /ПРЛ /аннотация /10,1103 /PhysRevLett.99.110502

ответил Lars Hadidi 21 J000000Monday14 2014, 11:36:04
0

Как и во всех других ответах, есть еще несколько соображений, которые могут не влиять непосредственно на скорость ЦП, но сделать что-то вокруг этого процессора довольно сложно;

Короче говоря, выше DC, радиочастота становится проблемой. Чем быстрее вы идете, тем более склонны все действовать как гигантское радио. Это означает, что следы печатных плат страдают от перекрестных помех, эффектов их собственной емкости /индуктивности с соседними дорожками /землей, шумом и т. Д. И т. Д. И т. Д.

Чем быстрее вы идете, тем хуже все это получается - ножки компонентов могут ввести неприемлемую индуктивность, например.

Если вы посмотрите на рекомендации по выкладке «основных» печатных плат такого уровня малины Pi с некоторой ОЗУ DDR, все следы для шины данных и т. д. должны быть одинаковой длины, иметь правильное завершение и т. д. и это работает значительно ниже 1 ГГц.

ответил John U 1 PM00000010000002431 2014, 13:10:24

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132