Процессор в памяти: различия между версиями

→‎Вычисляющая память (Соmputational RAM): +ref http://old.computerra.ru/offline/1998/243/989/|title=Доводы в пользу IRAM уточнение
м (c латинская)
(→‎Вычисляющая память (Соmputational RAM): +ref http://old.computerra.ru/offline/1998/243/989/|title=Доводы в пользу IRAM уточнение)
В некоторых [[Чрезвычайная параллельность|чрезвычайно параллельных]] (embarrassingly parallel) вычислительных задачах уже архитектура фон Неймана ставит ограничения в виде узкого места между CPU и DRAM ([[Узкое место архитектуры фон Неймана]]). Некоторые исследователи считают, что для той же суммарной стоимости, машина, построенная в вычислительной оперативной памяти будет работать на порядок быстрее, чем в традиционных ЭВМ общего назначения на эти видах задач.
 
На 2011 год, процессы изготовления чипов, "DRAM процесс" (нескольконемного слоев; регулярные топологические структуры; оптимизирован для высокой электрической емкости) и "CPU процесс" (многиемного слоислоев; процесс оптимизирован для высокой частоты; относительно дорогой на квадратный миллиметр) отличаются достаточно сильно, так, что есть три подхода к изготовлению Вычисляющего ОЗУ:
 
* начать с процессора - оптимизация процесса и устройство, которое использует множество встроенных SRAM, добавить дополнительный шаг процесса (что делает его еще дороже в пересчете на квадратный миллиметр), чтобы разрешить замену встроенной SRAM на встроенную (embedded) DRAM (eDRAM), давая ~3-кратную экономию площади в районах SRAM (и, следовательно, снижение себестоимости на чипе).
* начать с системы с отдельным чипом CPU и DRAM чипом(-ами), добавить небольшое количество "сопроцессорной" вычислительных функций к DRAM, работая в рамках DRAM процесса и добавляя только в небольших количествах области в DRAM, чтобы делать вещи, которые в противном случае были бы замедлились в узкое горлышко между CPU и DRAM: обнуление выделенных областей памяти, копирование больших блоков данных из одного места в другое, поиск где есть (если есть) заданный байт в некотором блоке данных, и т.д. В результате система - без изменений CPU чипа, и со "смарт-DRAM-чипом(ами)" - по крайней мере, так же быстра, как и в исходной системе, и, возможно, немного ниже по стоимости. Стоимость небольшого размера дополнительной области, как ожидается, будет более чем возвращена во счет экономии дорогих (т.к. долгих) проверок памяти, так как на смарт-DRAM сейчас достаточно вычислительной мощности - для пластин кремния ("вафель") полных DRAM-ами для выполнения большинства проверок на памяти внутренне и параллельно, а не традиционным подходом полных проверок одного DRAM чипа за раз с использованием дорогого внешнего автоматического тестирующего оборудования.
 
* начать с DRAM-оптимизированного процесса, настроить процесс так, чтобы сделать его немного более похожим на "CPU процесс", и построить (с относительно низкой частотой, но низким энергопотреблением и очень высокой пропускной способностью) процессор общего назначения в пределах этого процесса. [[:en:Berkeley IRAM project|Проект Беркли IRAM (англ.)]]<ref>{{cite news|url= http://old.computerra.ru/offline/1998/243/989/|title=Доводы в пользу IRAM|date=20 апреля 1998 года|publisher= "Компьютерра" №15|accessdate=2014-08-27}}</ref>, TOMI Technology.
 
==См. также==