В данной статье речь пойдет о числах в формате с плавающей точкой и в частности о реализации специализированного формата FP23 на программируемых логических интегральных схемах (ПЛИС). В рамках конкретного проекта у меня родилась мысль реализовать оптимальный для определенных нужд формат данных с плавающей точкой. В итоге эта мысль переросла в реальный проект, который впоследствии нашел применение в некоторых интересных задачах цифровой обработки сигналов. В статье рассмотрены основные сложности при реализации формата данных floating point на ПЛИС Xilinx, рассмотрены базовые математические операции в формате FP23. Также в конце статьи вы можете найти исходный код проекта, которой можно свободно использовать в своих задачах или на его основе реализовать похожие форматы данных.
Формат данных
Числа с плавающей точкой активно используются в современных сигнальных процессорах, видеокартах и даже в ПЛИС. В соответствии со стандартом IEEE 754, они представляются в виде совокупности экспоненты (показателя степени), мантиссы и знака. Числа в стандарте IEEE 754 имеют 32 бита (float). Для однозначности записи числа во float записываются в нормальной форме или приводятся к нормализованному виду после математических операций и преобразований над числами. Диапазон возможных значений зависит от количества бит мантиссы и экспоненты. Для float характерна фиксированная относительная точность и переменная абсолютная точность. Основные преимущества и недостатки чисел в формате float:
- + Обеспечивается очень широкий диапазон возможных значений;
- + Достигается высокая точность вычислений;
- – Округление очень больших чисел до возможных из сетки значений;
- – Потеря точности при суммировании чисел, отличных друг от друга во много раз;
- – Сложность реализации и применения на ПЛИС.
Для современных микросхем ПЛИС реализация чисел в формате с плавающей точкой не составляет большого труда. Для ведущих производителей – Xilinx и Altera существуют готовые SOFT IP-ядра, реализующие float по стандарту. Для Altera в последних семействах представлены HARD IP-ядра, реализующие формат IEEE 754 на DSP-блоках.
Цифровая часть
Основная элементная база для выполнения математических операций и задач цифровой обработки сигналов – передовые семейства ПЛИС. Работа проводится на ПЛИС фирмы Xilinx, которые содержат блоки векторов конфигурируемых ячеек. В первую очередь это универсальные блоки цифровой обработки и математики – DSP48E1 (для ПЛИС серии Virtex-6 и 7 семейства) и DSP48E2 (для ПЛИС семейства UltraScale). Эти блоки позволяют выполнять функции сложения и вычитания чисел, сдвига и переноса, быстродействующего умножения, перемножения с накоплением (MACC), поиска контрольной суммы и т.д. На ячейках DSP48 в современных ПЛИС выполняется множество задач – разработка СIC и FIR фильтров, скоростное вычисление FFT/IFFT, реализация цифровых синтезаторов частоты (DDS и CORDIC), создание различных форматов представления данных и набора операций для них.
Вторым базовым компонентом ПЛИС является блочная память. Для ПЛИС Xilinx это ячейки RAMB36E1 (или RAMB18E1). Это элементы двухпортовой памяти, реализованные внутри кристаллов в виде столбцов идентичных блоков. Количество столбцов встроенной памяти зависит от объема кристалла. Максимальный объем блока памяти составляет 36Кбит, при этом он может быть сконфигурирован как два независимых блока по 18Кбит каждый. Память может быть использована с шириной данных от 1 до 72 разрядов. При отсутствии свободных ресурсов блочной памяти ПЛИС, можно задействовать распределенную память в специальных ячейках SLICEM. Для ПЛИС Ultrascale объем такой памяти до 512х1, с возможностью реконфигурации глубины и разрядности шины.
Постановка задачи
С учетом перечисленных особенностей для реализации аналоговой и цифровой части, задача формируется следующим образом. Пусть разрядность данных, поступающих в кристалл ПЛИС с микросхем АЦП равна 16 бит. В качестве ПЛИС выбрана самая маленькая микросхема Kintex-7. Задача состоит в переводе 16-разрядного знакового целого числа FIX16 в специализированный формат с плавающей точкой FP23 и обратно, обеспечивая при этом максимальную скорость обработки внутри ПЛИС при минимальных затратах ресурсов кристалла. Кроме того, необходимо обозначить и реализовать набор базовых математических операций – сложение, вычитание и умножение.
Реализация формата FP
FP23 – это особый формат представления чисел с плавающей точкой. В отличие от стандарта IEEE 754, длина слова в формате FP23 не 32 бита, а всего 23 бита. Следующая формула в упрощенном виде отражает представление числа «A» в формате FP:
Мантисса (mantissa) в формате FP23 – это 17-битное положительное число. Она всегда отображается в нормализованном виде в результате всех преобразований, т.е. самый старший бит мантиссы всегда равен «1». Для экономии ресурсов кристалла и упрощения записи 17-й бит мантиссы никогда не отображается в упакованном результирующем 23-битном слове (см. рисунок). Поэтому при вычислении математических операций и переводе из одного формата в другой необходимо помнить, что мантисса нормализована, и к 16-разрядному ненулевому числу необходимо прибавить значение 216. Экспонента или показатель (exponent) в формате FP23 – это 6-битное положительное число, определяющее, на сколько умножается мантисса. Под знак (sign) выделен оставшийся один бит, причем нулевое значение бита соответствует положительным числам, а единичное значение определяет отрицательные числа. Таким образом, число A в формате FP23 описывается тремя битовыми полями: «экспонентой» (EXP(A)), «знаком»(SIGN(A)) и «мантиссой» (MAN(A)).
В таблице 1 приведены разрядность данных, диапазон возможных значений мантиссы и экспоненты и т.д.
Итак, первый этап при разработке формата данных с плавающей точкой на ПЛИС состоит в переводе знакового целого числа фиксированной разрядности в формат с плавающей точкой FP23, обеспечивая при этом максимальную скорость обработки внутри ПЛИС. Второй этап заключается в обратном преобразовании чисел из формата FP23 в формат с фиксированной точкой с возможностью масштабирования выходных данных под определенный коэффициент деления. И, наконец, на третьем этапе для полноценного использования всей мощи формата FP23 необходимо реализовать математические операции – сложение, вычитание и умножение.
Перед описанием модулей FP23 предстоит ответить на закономерный вопрос: «Почему разрядность данных в формате именно 23 бита?» Ответ складывается из нескольких составляющих. Во-первых, один бит используется для знака и 15 оставшихся битов для целой части, поэтому мантисса и знак занимают как минимум 16 битов. Для экспоненты с учетом смещения в формуле необходимо минимум 5 битов. Чем больше битов отводится под экспоненту, тем больше результат (расширяется диапазон возможных значений). Пусть экспонента имеет 6 разрядов, а мантисса представлена как 16-разрядное число, на знак отводится 1 разряд. Тогда для представления чисел в формате FP23 используется именно 23 бита. Если использовать скрытый бит мантиссы, который равен 1 при ненулевых значениях и равен 0 при нулевых значениях двоичного числа, то разрядность равна 24.
Кроме того, значение «23» выбрано не случайно, т.к. в дальнейшем для хранения вектора комплексных значений потребуется память ПЛИС. Пара значений без отображения скрытого бита имеет суммарную разрядность равную 46, со скрытым битом – 48, что по ширине данных укладывается ровно в три блока памяти RAMB18E1. Также для пары значений можно использовать дополнительные функции блока DSP48E1 ¬– быстрое сравнение двух чисел, проверка на четность и быстрое суммирование в режиме SIMD.
Преобразование FIX16-to-FP23
Для преобразования данных из целочисленного знакового типа FIX16 в формат FP23 необходимо использовать логику кристалла ПЛИС и встроенные перемножители DSP48E1. На рисунке зображена структурная схема преобразования данных в формат FP23.
Максимальная разрядность множителей блоков DSP48E1 – 25 и 18 соответственно, где старший бит¬ – знаковый. Для перемножения чисел без учета знака в модуле DSP48E1 эффективная разрядность входных данных понижается на 1 бит. Блочную память RAMB18E1 преобразователь не использует.
Соответственно, чтобы найти знак числа, необходимо взять старший (знаковый) бит входных данных. Алгоритм поиска мантиссы MAN(A) на базе примитивов ПЛИС следующий:
- взять модуль входного числа (операция «исключающее ИЛИ»),
- произвести поиск старшего значащего бита (MSB SEEKER),
- по старшему значащему биту сформировать величину сдвига мантиссы,
- перемножить модуль числа и значение сдвига, получив нормализованную мантиссу (FRAC SHIFTER).
Для поиска экспоненты EXP(A) необходимо:
- взять модуль входного числа (операция «исключающее ИЛИ»),
- произвести поиск старшего значащего бита (MSB SEEKER),
- вычесть из числа «32» инвертированный индекс значащего бита,
- прибавить 1 к полученному результату с учетом логики поиска ненулевого входного значения (LUT ZERO FORMER).
Поскольку мантисса получается путем умножения модуля действительного числа на некоторую «маску», от которой зависит сдвиг входного числа без знака, то для ее поиска необходим блок DSP48E1. Процедура поиска и формирования мантиссы происходит в узле FRAC SHIFTER и отражена на рисунке.
Как видно, мантисса формируется в два этапа. На первой стадии с помощью логических ресурсов LUT из входного числа создается множитель 216-MSB. На второй стадии входные данные умножаются на величину сдвига в узле DSP48E1. На выходе умножителя образуется нормализованная мантисса. Согласно описанию, для умножения чисел без знака максимальная разрядность одного из множителей блока DSP48E1 равна 17, следовательно, мантисса и формируемый сдвиг не могут иметь большую разрядность. Это ограничение еще раз обуславливает тот факт, что мантисса чисел в формате FP23 имеет разрядность 17. Старший бит мантиссы для ненулевых чисел равен 1, зарезервирован и применяется в операции поиска результирующей мантиссы, но не отображается в выходном представлении числа для нормализованного вида. Этот бит можно вывести и использовать в общем представлении слова, тогда разрядность выходного слова равна 24 битам.
Для уменьшения объема занимаемых ресурсов кристалла, блок DSP48E1 можно исключить. Тогда узел поиска мантиссы преобразуется в быстрый сдвиговый регистр (Barrel shifter). Для некоторых кристаллов ПЛИС количество DSP48E1 невелико, и лишние траты ресурсов критичны, поэтому при использовании блоков FP23 есть возможность выбрать тот или иной вариант. Кроме того, для варианта с использованием быстрого сдвига суммарная задержка на полное выполнение операции преобразования уменьшается на один такт.
Узлы суммирования для поиска экспоненты сделаны в виде полных двоичных сумматоров, для реализации которых применяются логические компоненты MUXCY, XORCY и CARRY CHAIN, входящие в базовые ячейки SLICEL и SLICEM. Подробное описание можно найти в любой литературе, посвященной программируемой логике.
DIN — входные данные, 16 бит. DOUT — число в формате FP23, разбитое на три поля: {EXP, SIGN, MANT}.
Преобразование FP23-to-FIX16
Преобразование данных из формата FP23 в FIX16 производится в четыре этапа.
Алгоритм поиска двоичного знакового числа A состоит из нескольких последовательных действий:
- из экспоненты EXP(A) вычесть значение SCALE (масштабирование выходных данных),
- сформировать сдвиговую маску 2(EXP(A)-SCALE),
- к мантиссе прибавить скрытый бит IMPL(A) и умножить результат на величину сдвига,
- учесть знак числа SIGN(A) путём взятия операции «исключающее ИЛИ».
Как и для узла прямого преобразования в формат FP23, в этой схеме для экономии ресурсов ПЛИС блок DSP48E1 можно заменить быстрым сдвиговым регистром, выполненным на ячейках SLICEM.
Умножение
Умножение чисел в формате FP23 – одна из самых простых и логичных операций. Аппаратно алгоритм умножения реализован следующим образом (см. рис).
- умножение мантисс в узле DSP48E1,
- нормализация мантиссы (взятие в качестве мантиссы разрядов [32…17] или [31…16], в зависимости от значения старшего значащего бита),
- сложение экспонент,
- вычитание из суммы экспонент числа 16,
- если 33-й бит произведения мантисс равен «0», то из экспоненты результата вычитается еще 1,
- определение знака произведения с помощью операции «исключающее ИЛИ».
В схеме не отражена логика умножения на нулевое число, но алгоритмически она сводится к тому, что если экспонента любого входного числа равна нулю, то результат на выходе также равен нулю. На ПЛИС поиск нуля организован с помощью логических функций AND и OR на базовых блоках LUT.
Число 16 вычитается из суммы экспонент для учета скрытых битов в мантиссах входных чисел, которые дают прибавку к экспонентам. Сумматоры и вычитатели в узле умножения чисел в плавающей точке также реализованы по схеме двоичного полного сумматора.
Сложение и вычитание
Сложение и вычитание чисел в формате FP23 – самая затратная по ресурсам операция (см. рис). Сложение чисел в формате FP23 состоит из следующих фундаментальных стадий:
- приведение операндов к одной экспоненте (выравнивание),
- сложение мантисс,
- нормализация результата (подбор такой экспоненты, чтобы 16 бит мантиссы был равен «1»).
Аппаратно алгоритм сложения реализован следующим образом:
- операнды «A» и «B» сравниваются по модулю, если |А|<|B|, числа меняются местами,
- вычисляется разность экспонент операндов, а результат определяет, на сколько разрядов нужно сдвинуть мантиссу числа «B» вправо, чтобы привести числа к одной экспоненте,
- по разности экспонент формируется число, на которое умножается мантисса числа «В»,
- результат умножения складывается с мантиссой числа «A»,
- в полученном числе определяется номер старшего значащего бита MSB, формируется число ,
- нормализация мантиссы путем умножения суммы мантисс на число ,
- экспонента числа EXP© = EXP(A) – MSB + 1.
Вычитание реализовано аналогично сложению. Отличие только в том, что у вычитаемого операнда инвертируется знак SIGN(B). Блоки DSP48E1 также можно заменить на быстрый сдвиговый регистр.
Ресурсы
Результаты синтеза и задержка распространения на выполнение операции для каждого узла сведены в таблицу 2. Из таблицы видно, что самой простой и быстрой операцией является умножение двух чисел в формате FP23.
Объем занимаемых ресурсов после синтеза для всех узлов приведен в общем лог-файле. Пример результатов синтеза для умножителя fp23:
Top Level Output File Name : fp23_mult_m1.ngc
Primitive and Black Box Usage:
------------------------------
# BELS : 106
# GND : 15
# INV : 1
# LUT2 : 25
# LUT3 : 16
# LUT4 : 6
# LUT6 : 14
# MUXCY : 14
# VCC : 1
# XORCY : 14
# FlipFlops/Latches : 75
# Shift Registers : 8
# SRLC16E : 8
# DSPs : 1
# DSP48E1 : 1
Исходный код
Все узлы формата FP23 написаны на языке VHDL. Для удобства и проверки на С++ написана небольшая программа, которая содержит функции реализуемых операций в плавающей точке на ПЛИС. С её помощью можно проводить отладку и реализацию других форматов с плавающей точкой с другими размерностями экспоненты и мантиссы.
Для удобства чтения данных на VHDL создан тип, определяющий число в формате с плавающей точкой. Все компоненты и типы FP23 собраны в файле fp_m1_pkg.vhd
type fp23_data is record
exp : std_logic_vector(5 downto 0);
sig : std_logic;
man : std_logic_vector(15 downto 0);
end record;
Исходный код RTL-описаний, программа тестирования и результаты синтеза можно найти по ссылке на github.
Тестовый пример
Для тестирования всех разработанных узлов я придумал небольшую схему. Это комплексный умножитель, на входе и выходе которого данные представлены в целочисленной форме, а промежуточные результаты в плавающей точке. То есть входые данные преобразуются в формат FP23. В этом формате реализуется комплексное умножение, а результат переводится назад из FP23 в фиксированную точку. Структурная схема в RTL-Viewer выглядит следующим образом:
В PlanAhead размещение комплексного умножителя представлено на следующем рисунке. ПЛИС Kintex-7, XC7K70TFBG484-1C.
Видно, что в результате полной трассировки проекта достигается частота обработки порядка ~300МГц. На практике эта цифра на ~30% выше.
В FPGA Editor блок обычного умножителя в формате FP23 выглядит вот так:
Заключение
В результате работы разработан специализированный формат данных для плавающей точки FP23 на ПЛИС. Он отличается от традиционного формата IEEE 754 и заточен под обработку на ПЛИС на максимальных скоростях. В отличие от стандартных решений от Xilinx и Altera, узлы в формате FP23 занимают значительно меньше ресурсов кристалла. Операции сложения и умножения в FP23 нашли применение для реализации КИХ-фильтров и узла БПФ/ОБПФ на ПЛИС.
При желании вы можете создать собственный формат данных "FP_X" для конкретных задач с произвольной разрядностью мантиссы и экспоненты. При этом необходимо учитывать особенности и структуру конкретных ПЛИС.
Мои статьи по схожей тематике:
Литература
Спасибо за внимание! Продолжение следует...
Комментарии (10)
nckma
15.03.2016 10:51А подскажите… может я упустил при чтении… Ваша реализация поддерживает Subnormal numbers? Или Вам не требуется точность при очень малых значениях?
capitanov
15.03.2016 11:32+1Субнормальные числа не используются, т.к. в процессе выполнения любых операций на выходе результат приводится к нормализованному виду, т.е старший бит мантиссы, который я называю "скрытым" равен 1 для ненулевого числа. Например, число "0х1" в формате fp23 запишется как {0x10, 0, 0x0000}, где битовые поля — {exp, sign, mant}. Причем, числа с меньшей экспонентой успешно поддерживаются.
Пример: число 0.5, представленное как {0xF, 0, 0x0000} правильно обработается, и все математические операции с таким числом дадут корректный результат. Проверить можно просто по следующей формуле: 2(EXP-32)*(2^16+MAN).
Также следует учитывать, что на входе преобразователя FIX2FLOAT данные строго целочисленные, но путём совсем небольшого шаманства в VHDL-коде можно фиксированную точку сместить в любое место. В реальном проекте числа меньше 0х1 в формате FP23 я использовал для хранения поворачивающих коэффициентов при реализации БПФ.
Khort
Абсолютно во всех IP ядрах используется IEEE 754 (16/32/64/128 бит). Вы выиграли в скорости, уменьшив диапазон чисел, браво!
Так может, стоило бы сразу взять IEEE754 16 бит (половинная точность)? Получится и еще быстрее, чем Ваши 23 бита, и все в рамках стандарта.
Если честно, в инженерных вопросах я всегда против изобретения велосипеда. Есть стандарт, и ему надо следовать.
capitanov
Во-первых, быстрее не получится. При таких затратах ресурсов скорость для fp16 и "велосипеда" практически одинакова. Но точность fp16 гораздо хуже. Также, например, при реализации БПФ на 64К-128К точек, в связи с интегральной природой алгоритма БПФ, у fp16 наступит переполнение. Итог — неверный результат на выходе.
Во-вторых, в идеале нужно смотреть на реальные проекты с забитой ПЛИС на 70-80%, тогда есть смысл сравнить в боевом режиме. Я делал "велосипед #2" — формат fp18 и сравнивал с fp23. Поверьте — разницы по скорости практически нет, а по достижимой точности — солидно. По ресурсам отличие на 15%. Но даже fp18 пригодился в свое время на Virtex-4 для реализации схемы все того же БПФ.
В-третьих, "велосипеды" конкретно на FPGA успешно справляются в прикладных задачах, где не требуется универсальности. Зачастую разработчикам приходится заниматься изобретением велосипедов, поскольку действительно крутые IP-ядра бесплатно вам никто не отдаст. Я знаю реальные примеры, когда так называемый "велосипед" намного круче стандартный протоколов.
Дабы не быть голословным, приведу пример. Открытое ядро PROTEQ моего коллеги. Обеспечивает высокую скорость передачи данных по MGT линиям с требуемой надежностью. Занимает мало ресурсов ПЛИС и самое главное — быстро восстанавливается после возникновения ошибки. Протокол Aurora курит в сторонке, а PROTEQ в различных его вариациях успешно внедряется во многих наших разработках на ПЛИС.
Khort
Ну что я могу сказать. Если это "внутренняя" жизнь Вашего IP, то Вы в праве делать что угодно. Если точно значете что разядность входных данных низкая (с АЦП, к примеру), снижение точности вполне оправдано. Да и то, насколько оправдано? Перемножение двух 12'h чисел (типовая точность АЦП) дает уже 24'h. в IEEE 754 — 32 это даже округлять не придется. А у Вас — придется, т.е. теряется точность.
Но если же этот формат будет передаваться в систему (SoC), программисты Вам точно спасибо не скажут. Потому что им придется самим следить за попаданием в диапазон чисел, ибо не стандарт.
По поводу PROTEQ — посмотрел ссылку. Автор тоже знатный велосипедист: на мой взгляд, куда лучше было бы повторить PHY от PCI-E gen1, т.к. схема пайпа шикарно описана у интела. Но для внутренних дел сгодится и это, тем более что корка открытая — единственный ее плюс. Imho
capitanov
На практике в таких вещах получается, что шумы квантования в любом случае меньше, чем даёт шум АЦП. То есть цифровой частью ну никак не улучшить аналоговую, если динамический диапазон маленький. Пролезающие в полосу шумы точно также усиливаются, как и полезный сигнал. В наших задачах точности формата FP23 было "за глаза".
К реализации специфического формата плавающей точки я, кстати, пришел не сразу. В первую очередь, мне не понравились монстрообразные IP-ядра от Xilinx, которые жрали очень много места, а на выполнение операций затрачивалось много тактов. Затем после оценки типовых задач по ЦОС стало ясно, что нет смысла копировать стандарт IEEE 754 в полной мере. Причина кроется в избыточности. Например, реализация сумматора «по стандарту» не обеспечит высоких скоростей без использования DSP48-узлов, которых в ПЛИС постоянно не хватает. Кастомный FP23 сумматор не требует DSP48-узла. Умножитель по стандарту требует 3 DSP48 блока, кастомный – всего один. Можно прикинуть, во сколько вырастет «бабочка» для проекта БПФ. А если учесть, что для реализации БПФ бабочек нужно log2(NFFT), то разница по ресурсам колоссальна. Сюда можно добавить RAMB память для хранения поворачивающих коэффициентов и линий задержки. FP32 и FP23 отличаются в 1.5 раза.
PHY PCI-e не формирует пакеты данных. Он не обеспечивает надежную передачу с исправлением ошибок. До кучи у него значительно ниже скорость передачи, чем у PROTEQ. Закономерный вопрос: почему Xilinx в свое время сделали Aurora, а не пользовались стандартными решениями? Это тоже велосипед со своими фичами и особенностями. В защиту PROTEQ приведу ещё один аргумент. Он позволяет передавать данные как по оптике, так и по печатной плате от ПЛИС к ПЛИС. Ограничений нет никаких. Посмотрите публикацию о PROTEQ моего коллеги по этому вопросу. В ней приведено реальное сравнение с Aurora / PCIe.
Вы можете и дальше утверждать, что велосипеды — зло, и нужно оставаться в рамках стандартов. Но лично моя практика и опыт моих товарищей-разработчиков говорит об обратном.
Khort
Действительно, для оптики PCI-E не годится (слабые возможности clock recovery), но зато есть индустриальный PHY Serial RapidIO, поддерживающий даже Hot Swap. Служебные пакеты формировать — это вообще не аргумент. Если они нужны, есть куча стандартов (тот же PCI-E или SRIO), где все уже давно придумано — берите, да пользуйтесь, благо документации — море
Касательно аргумента об использовании DSP блоков. Удалось задействовать 1 DSP вместо трех? Замечательно! А если мигрировать проект на альтеру, или актель? Получается, Ваше решение не универсально, а привязано к конкретной ПЛИС. А значит, оно требует отдельного пунктика в ТЗ: использовать только 7й кинтекс :-) Но, не хочу умалять Ваших достижений — если потеря точности, и привязка к ПЛИС Вас устраивают, то результат действительно впечатляющий.
По поводу велосипеда. Ваша практика опирается на опыт проектов, где ПЛИС — конечный продукт. Как только ПЛИС станет позиционироваться как прототип ASIC (рано или поздно все коммерчески успешные проекты переводят в кремний), вот тут то все PROTEC и прочие велосипеды, торчащие наружу, пойдут лесом.
Поэтому повторюсь: пока велосипед является внутренней жизнью Вашего IP, нет проблем. Проблемы возникнут, если велосипед будет торчать наружу из Вашего IP.
Если и это для Вас не аргумент, задумайтесь — а зачем вообще придумывают стандарты??
capitanov
По поводу PHY Serial RapidIO — интересное решение. Мы его тоже делали и даже используем для связи нескольких FPGA и DSP через RIO SWITCH. Но для SRIO намного сложнее реализация и ресурсов жрет, к сожалению, тоже много.
Полноценный PCIE для Xilinx требует HARD блока и предварительной инициализации. В ПЛИС количество таких HARD-блоков ограничено и как правило задействовано для связи FPGA с компьютером.
Да, мое решение применительно только к Xilinx, начиная с Virtex-4 и выше, хотя переделать под Altera несложно. Базовые ячейки у всех почти одинаковы. И IP-core от Xilinx тоже применимы только к Xilinx. :)
Мы пока не встречались с такими проблемами, где наш велосипед не справляется. Повторюсь, PROTEQ успешно используется практически в каждом нашем проекте и решает определенный класс задач, который в своё время не смогла обеспечить Aurora. И да, мы используем стандартные решения. В своих проектах мы применяем полностью стандартизированные решения (PCIe, DDR, SRIO, и т.д.), несмотря на то, что для каждого из этих решений у нас есть свой велосипед. Где-то подойдет велосипед, где-то стандарт. Все зависит от задачи.
nerudo
Понятно, что собственный велосипед люб и мил сердцу любого нормального инженера ;-)
Проблемы начинаются, когда внезапно оказывается, что решение нужно постоянно поддерживать, адаптировать под новые платформы и т.д. В итоге конечная стоимость собственного решения окажется выше покупного. С нашими нищенскими зарплатами инженеров (и оплатой за IP в валюте) до этого, конечно, не всегда добираешься, а вот в нормальной ситуации — легко...
leshabirukov
Можно положить те же 6 битов на экспоненту и переполнения не будет. Если относительная погрешность данных с АЦП больше 0.1% мантиссы в 10 битов должно хватить.