Вычисления с памятью: различия между версиями

[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
правки
Нет описания правки
Строка 3:
Вычисления с памятью обычно используют чтобы обеспечить преимущества, получаемые от аппаратной реконфигурируемости. Реконфигурируемые системы являются гибкой аппаратной платформой для быстрого прототипирования, что позволяет сократить цикл разработки и уменьшить время выхода на рынок новых устройств. [[ПЛИС]] является популярной платформой для реализации цифровых схем прежде всего на основе пространственной модели. С самого начала использования [[ПЛИС]] в 1985 их базовая структура состоит из двухмерного массива конфигурационных логических блоков (Configurable Logic Blocks) объединенных пространственной коммутационной средой в виде программируемой матрицы интерконнекта.<!--<ref name="Ref 1"> K.Compton and S. Hauck, «Computing: A Survey of systems and software», ACM Surveys, Vol. 34, No. 2, June, 2002.</ref>--> Производительность и энергопотребление [[ПЛИС]] существенно зависит от архитектуры коммутационной среды, принципов распространения и синхронизации сигналов<!--<ref name="Ref 2"> S.M. Trimberger, «Field Programmable Gate Array Technology», Norwell, MA: Kluwer, 1994.</ref><ref name="Ref 3"> A. Rahman, S. Das, A.P. Chandrakasan, R. Reif, «Wiring Requirement and Three-Dimensional Integration Technology for Field Programmable Gate Arrays», IEEE Trans. on Very Large Scale Integration Systems, Vol. 11, No. 1, February, 2003.</ref>-->. Уменьшение влияния ограничений коммутационной среды достигается за счет расположения таблиц соответствия (LUT) в непосредственной близости друг от друга, называемых вместе кластерами, связи между кластерами также локализуются. Ввиду преимуществ кластерной архитектуры основные производители [[ПЛИС]] используют ее в своих коммерческих продуктах<ref name="Ref 4">[http://www.xilinx.com Xilinx Corporation]</ref><ref name="Ref 5">[http://www.altera.com Altera Corporation]</ref>. Для реализации больших таблиц соответствия также могут быть использованы блоки внутренней памяти<ref name="Ref 6">J. Cong and S. Xu, «Technology Mapping for FPGAs with Embedded Memory Blocks», Symposium on Field Programmable Gate Array, 1998.</ref>. Подобная гетерогенность элементов памяти улучшает заполняемость и быстродействие компонентов схем за счет минимизации и локализации связей.
 
Реконфигурируемые платформы на базе вычислений с памятью с итерационной (процедурной) моделью вычислений (или же комбинацией пространственной и итерационной модели) исследуются <ref name="Ref 7">S. Paul and S. Bhunia, «Reconfigurable Computing Using Content Addressable Memory for Improved Performance and Resource Usage», Design Automation Conference, 2008.</ref> в контексте повышения производительности и энергоэффективности относительно традиционных [[ПЛИС]] ориентированных в большей степени на пространственную модель (большое количество LUT с несколькими входами и одним выходом). Такие платформы известны как вычислители на памяти (ВнП) (Memory Based Computing (MBC)), в которых используются уплотненные двумерные массивы памяти для хранения в них таблиц соответствия (LUT). Такие каркасные конструкции полагаются на разбиение сложных функций (f) на более простые функции, которые хранятся в LUT с многими входами и выходами. Вычисление сложных функции происходит за несколько итераций вычисления простых функций. При создании ВнП могут быть эффективно использованы такие свойства устройств памяти <ref name="Ref 8">S. Paul, S. Chatterjee, S. Mukhopadhyay and S. Bhunia, «Nanoscale Reconfigurable Computing Using Non-Volatile 2-D STTRAM Array», International Conference on Nanotechnology, 2009.</ref> как высокая ёмкость, низкое энергопотребление, высокая производительность наноразмерной памяти. В ВнП базовый вычислительный блок представляет собой двумерный массив памяти в котором храняться таблицы соответствий (LUT), плюс необходимая логика управления для итерационного вычисления сложных функций. Такие вычислительные блоки объединяются пространственной коммутационной системой на основе эффективных решений отработанных в традиционных [[ПЛИС]], причем за счет того, что данные локализованы и итерационно вычисляются требования к коммутационной системе существенно снижаются. Массив памяти в каждом вычислительном элементе может быть реализован на основе [[ContentКонтентно-addressableадресуемая memoryпамять|контентно-адресуемой памяти]] (CAM), что снижает объем требуемой памяти для некоторых приложений.
 
Если сравнивать MBC c FPGA то это родственные технологии, разница в том, что в MBC используется упрощенная коммутационная среда и реализация более сложного итерационного механизма поддержки вычислений на LUT с многими входами/выходами. Преимуществом MBC является простота элементной базы, основанной на устройствах памяти различного вида.