Библиотека выполнена как эмулятор процессора с набором регистров и флагов, устанавливаемых по результатам проведенных операций. Набор целочисленных функций содержит арифметические, логические операции, а также операции сдвига. Для вещественных и комплексных чисел реализованы основные тригонометрические функции.
Разрядность ограничена 65536 бит для арифметических операций и 16384 бит для тригонометрии. Ограничения обусловлены порядком рядов аппроксимации.
Форматы данных
Библиотека поддерживает целые, вещественные и комплексные типы. Переменные хранятся в массивах байтов.
Целые числа
В заголовочном файле libmpu.h определены константы, которые представляют количество байтов для хранения целых переменных:
#define NB_I8 1
#define NB_I16 2
#define NB_I32 4
#define NB_I64 8
#define NB_I128 16
#define NB_I256 32
#define NB_I512 64
#define NB_I1024 128
#define NB_I2048 256
#define NB_I4096 512
#define NB_I8192 1024
#define NB_I16384 2048
#define NB_I32768 4096
#define NB_I65536 8192
#define NB_I_MAX 8192
Данные константы можно использовать в качестве значения аргумента nb для операций с целыми числами.
В системах с big-endian порядком байтов старший байт числа хранится по наименьшему адресу памяти, а младший байт – по наибольшему. В системе с little-endian порядком байтов, напротив, младший байт хранится по наименьшему адресу.
На следующей схеме представлено размещение целого числа в зависимости от архитектуры машины:
if( MPU_BYTE_ORDER_BIG_ENDIAN == 0 )
{
[NB-1], . . . , [0];
+--------------------------- . . . ---------------------------+
| high low |
+--------------------------- . . . ---------------------------+
^Sign bit
size: NB.
}
if( MPU_BYTE_ORDER_BIG_ENDIAN == 1 )
{
[0], . . . , [NB-1];
+--------------------------- . . . ---------------------------+
| high low |
+--------------------------- . . . ---------------------------+
^Sign bit
size: NB.
}
Здесь, символ NB – обозначает количество байтов числа.
Для представления целых переменных пользователь может самостоятельно создавать массивы байтов любым из перечисленных ниже способов:
__mpu_byte_t a[NB_I65536];
mpu_int a[NB_I65536];
mpu_int *a = (mpu_int *)malloc( NB_I65536 * sizeof(__mpu_byte_t) );
а также использовать, предопределенные в libmpu.h типы данных, которые прямо говорят о размерности:
mpu_int4096_t a;
Целые числа могут рассматриваться как знаковые (signed), так и беззнаковые (unsigned). Знаковые переменные для удобства операций с ними представляются в дополнительном коде. Ниже приведена таблица некоторых значений 8-разрядной переменной в дополнительном коде.
+---------------+------------------+
| Десятичное | Двоичное |
| представление | представление |
+---------------+------------------+
| 127 | 0111 1111 |
| 3 | 0000 0011 |
| 2 | 0000 0010 |
| 1 | 0000 0001 |
| 0 | 0000 0000 |
| -1 | 1111 1111 |
| -2 | 1111 1110 |
| -3 | 1111 1101 |
| -127 | 1000 0001 |
| -128 | 1000 0000 |
+---------------+------------------+
Вещественные числа
Вещественные переменные, также как и целые, хранятся в виде массивов байтов. В заголовочном файле libmpu.h определены константы, которые представляют количество байтов для хранения вещественных переменных:
#define NB_R32 4
#define NB_R64 8
#define NB_R128 16
#define NB_R256 32
#define NB_R512 64
#define NB_R1024 128
#define NB_R2048 256
#define NB_R4096 512
#define NB_R8192 1024
#define NB_R16384 2048
#define NB_R32768 4096
#define NB_R65536 8192
#define NB_R_MAX 8192
Данные константы можно использовать в качестве значения аргумента nb для операций с вещественными числами.
Вещественные числа имеют в своем составе два поля: смещенной экспоненты и мантиссы. Бит целой единицы неявный. Знак расположен в старшем бите числа.
На следующей схеме представлено размещение вещественного числа в зависимости от архитектуры машины:
if( MPU_BYTE_ORDER_BIG_ENDIAN == 0 )
{
[NB-1], . . . , [nS] | [nS-1], . . . , [0];
+------ . . . -------+--------------- . . . ------------------+
| Sign + Exponent | Significand |
+------ . . . -------+--------------- . . . ------------------+
^Sign bit ^(1. - implicit)
size: nE nS.
}
if( MPU_BYTE_ORDER_BIG_ENDIAN == 1 )
{
[0], . . . , [nE-1] │ [nE], . . . , [NB-1];
+------ . . . -------+--------------- . . . ------------------+
| Sign + Exponent | Significand |
+------ . . . -------+--------------- . . . ------------------+
^Sign bit ^(1. - implicit)
size: nE nS.
}
Здесь, символы nE и nS – обозначают количество байтов экспоненты и количество байтов мантиссы, соответственно.
Количество бит выделяемое для представления знака, экспоненты и мантиссы распределено следующим образом:
+-----------------------+-------------------+-------------+
| Общее количество бит | (Sign + Exponent) | Significand |
+-----------------------+-------------------+-------------+
| 32 | 1 + 8 + | 23 |
| 64 | 1 + 11 + | 52 |
| 128 | 1 + 31 + | 96 |
| 256 | 1 + 31 + | 224 |
| 512 | 1 + 63 + | 448 |
| 1024 | 1 + 63 + | 960 |
| 2048 | 1 + 127 + | 1920 |
| 4096 | 1 + 127 + | 3968 |
| 8192 | 1 + 255 + | 7936 |
| 16384 | 1 + 255 + | 16128 |
| 32768 | 1 + 511 + | 32256 |
| 65536 | 1 + 511 + | 65024 |
+-----------------------+-------------------+-------------+
Форматы 32- и 64-битных чисел полностью совпадают с IEEE (Institute of Electrical and Electronics Engineers) форматом.
Для удобства декларирования переменных вещественного типа в заголовочном файле libmpu.h определены соответствующие типы данных, применение которых может выглядеть, например, следующим образом:
mpu_real16384_t a, b;
Бесконечности, неопределенность, не числа, максимальные и минимальные величины
Для расширения вычислительных возможностей в формате чисел с плавающей точкой наряду с обычными вещественными числами предусмотрено несколько специальных значений. Они имеют определенный смысл и дают важную информацию об алгоритмах и операциях, в которых появляются эти значения. К специальным значениям относятся вещественные числа с нарушением нормализации, неопределенность, нули, бесконечности и не числа, представленные в следующей таблице.
+------+-------------------+-------------------+------------------+
| Sign | Exponent | Significand | comments |
+------+-------------------+-------------------+------------------+
| S | 1111 . . . 1111 | 0000 . . . 0000 | +/- inf |
| S | 0000 . . . 0000 | 0000 . . . 0000 | +/- 0 |
| 1 | 1111 . . . 1111 | 1000 . . . 0000 | - ind |
| S | 1111 . . . 1111 | 0000 . . . 0001 | +/- NaN (min) |
| S | 1111 . . . 1111 | 1111 . . . 1111 | +/- NaN (max) |
+------+-------------------+-------------------+------------------+
Здесь:
+/- inf – +/- бесконечность;
+/- 0 – +/- знаковый нуль;
- ind – неопределенность;
+/- NaN (min) – +/- минимальное не число;
+/- NaN (max) – +/- максимальное не число.
Числа с нарушением нормализации:
+------+-------------------+-------------------+------------------+
| Sign | Exponent | Significand | comments |
+------+-------------------+-------------------+------------------+
| S | 0000 . . . 0000 | 0000 . . . 0001 | +/- min |
| S | 0000 . . . 0000 | 1111 . . . 1111 | +/- max |
+------+-------------------+-------------------+------------------+
Кодировка максимального и минимального вещественных чисел:
+------+-------------------+-------------------+------------------+
| Sign | Exponent | Significand | comments |
+------+-------------------+-------------------+------------------+
| S | 0000 . . . 0001 | 0000 . . . 0000 | +/- MIN |
| S | 1111 . . . 1110 | 1111 . . . 1111 | +/- MAX |
+------+-------------------+-------------------+------------------+
Комплексные числа
Комплексные числа хранятся в памяти машины как структура, состоящая из двух вещественных чисел.
Константы, определяющие размер комплексных чисел в байтах, заданы так, что они представляют половину размера комплексного числа:
#define NB_C32 4
#define NB_C64 8
#define NB_C128 16
#define NB_C256 32
#define NB_C512 64
#define NB_C1024 128
#define NB_C2048 256
#define NB_C4096 512
#define NB_C8192 1024
#define NB_C16384 2048
#define NB_C32768 4096
#define NB_C65536 8192
#define NB_C_MAX 8192
Здесь важно отметить, что функции, работающие с комплексными переменными в качестве параметра, определяющего размер операндов принимают именно эти величины. Например для работы с переменной типа mpu_complex256_t, на вход функций надо подавать nb = 32 == NB_C256, в то время, как sizeof(mpu_complex256_t) == 64 == NB_C256 * 2.
Представление комплексных чисел в памяти показано на следующей схеме:
if( MPU_BYTE_ORDER_BIG_ENDIAN == 0 )
{
[NB*2-1], . . . , [NB] │ [NB-1], . . . , [0];
+------------ . . . -----------+------------ . . . -----------+
| Real part | Imaginary |
+------------ . . . -----------+------------ . . . -----------+
size: NB_Real == NB_CXXX NB_Imag == NB_CXXX.
}
if( MPU_BYTE_ORDER_BIG_ENDIAN == 1 )
{
[0], . . . , [NB-1] │ [NB], . . . , [NB*2-1];
+------------ . . . -----------+------------ . . . -----------+
| Real part | Imaginary |
+------------ . . . -----------+------------ . . . -----------+
size: NB_Real == NB_CXXX NB_Imag == NB_CXXX.
}
Форматы вещественной и мнимой частей комплексных переменных совпадают с форматами вещественных чисел.
Флаги
Большинство операций с целыми и вещественными числами выставляют флаги. Флаги операций размещены в целой 32-битной переменной. Младшие 8 битов [7 ... 0] отданы под флаги целочисленных операций. Биты с 8-го по 15-й занимают флаги, выставляемые операциями с вещественными числами.
15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
. . . -+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+
| INX | IND | PLS | TLS | UDF | OVF | SNG | DOM | V | R | Z | P | S | O | C | A |
. . . -+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+
Флаги целочисленных операций:
A - Auxiliary Carry Flag (carry from lowest 4-bit word)
C - Carry Flag
O - Overflow Flag
S - Sign Flag
P - Parity Flag (of lowest significant byte)
Z - Zero Flag
R - major || remainder
V - Invalid operation
NOTE: Флаги A и P выставляются только операциями над 8-разрядными и 16-разрядными переменными.
Флаги операций с вещественными переменными:
DOM - Domain Flag
SNG - Singularity Flag
OVF - Overflow Flag
UDF - Underflow Flag
TLS - TLOSS Flag
PLS - PLOSS Flag
IND - ind-produsing operation Flag
INX - Inexact Flag
В заголовочном файле libmpu.h определены функции работы с флагами, такие как очистка флагов, сброс, выставление флагов, а также проверки флагов операций.
Исключения и коды ошибок
Помимо выставления флагов операциями с целыми и вещественными числами, библиотека libmpu поддерживает стандартную переменную errno и, ктоме того, собственные переменные __mpu_integer_error_no, __mpu_real_error_no, __mpu_complex_error_no, __mpu_math_error_no.
Коды ошибок определены в заголовочном файле libmpu.h.
Библиотека libmpu поддерживает обработку ошибок посредством функции __mpu_math_error(), которая может быть переопределена пользователем на этапе компоновки объектного кода так, как это возможно при переопределении функции matherr() во время компоновки программ со стандартной библиотекой языка C (например, GNU Libc).
Кроме того, пользователь может переопределить функцию __mpu_warning(), которая выводит дополнительную информацию об ошибках.
Как и в случае функции matherr() стандартной библиотеки языка C, параметром функций __mpu_math_error(), __mpu_warning() является указатель на структуру __exception:
struct __exception
{
int who; /* _COMPLEX_, _REAL_, _INTEGER_, _MATH_ */
int type;
__mpu_char8_t *name;
__mpu_char8_t *msg;
int msg_type; /* >= 1 - error, 0 - warning */
int nb_a1; /* number of bytes in arg_1 */
int nb_a2; /* number of bytes in arg_2 */
int nb_rv; /* number of bytes in return_value */
unsigned char *arg_1;
unsigned char *arg_2;
unsigned char *return_value;
};
в которой определены: источник ошибки, тип ошибки, имя функции выполнение которой привело к ошибке, а также указатели на аргументы функции и полученное возвращаемое значение.
С помощью функции __mpu_utf8mpu_error() можно получить указатель на строковую константу, содержащую текстовое описание ошибки, соответствующее коду ошибки (см. переменные __mpu_integer_error_no, __mpu_real_error_no, __mpu_complex_error_no, __mpu_math_error_no).
Для простых вычислений, как правило, не приходится переопределять функции matherr(), __mpu_math_error() и __mpu_warning(), однако мы сохранили такую возможность как одну из стандартных возможностей, предоставляемых библиотекой языка C.
Исходный код
Исходный код можно найти в репозитории libmpu.git, где в файле README.md приведен простой пример вычиcлений.
Выпуски исходного кода, не требующие выполнения ./bootstrap, можно найти в каталоге releases на FTP-сервере.
Кроме того, существует зеркало основного репозитория libmpu.git на ресурсе GitFlic.ru. Здесь пользователи библиотеки смогут создавать pull-request-ы на изменения.
Сборка
Сборка и инсталляция библиотеки на системе GNU/Linux достаточно проста, поскольку исходный код оформлен с помощью утилит Autoconf, Automake:
wget https://ftp.radix-linux.su/libmpu/releases/libmpu-1.0.14.tar.xz
mkdir build
cd build
../libmpu-1.0.14/configure \
--prefix=/usr \
--libdir=/usr/lib64 \
--enable-static=no
make
make install
Дополнительно можно задать ограничения разрядности с помощью управлений: --with-real-io-limit и --with-real-math-f-limit. Подробную информацию о управлениях процессом конфигурирования можно получить с помощью команды:
../libmpu-1.0.14/configure --help
Пример использования
Рассмотрим сборку простой программы на примере вычисления арктангенса отношения с точностью 16384 бит.
Составим простой Make-файл:
CC = gcc
CFLAGS = `mpu-config cflags`
LDFLAGS = `mpu-config --ldflags`
LIBS = `mpu-config --libs` -lpthread
SOURCES = main.c
OBJECTS = main.o
all: main
.SUFFIXES:
.SUFFIXES: .o .c
%.o : %.c
$(CC) $(CFLAGS) -c -o $@ $<
main: $(OBJECTS)
$(CC) $(LDFLAGS) -o main $(OBJECTS) $(LIBS)
clean:
rm -f main *.o
и создадим программу на языке С в файле main.c:
#include <libmpu.h>
#include <stdio.h>
int main( void )
{
int rc = 0;
__mpu_init();
__mpu_extra_warnings = 1;
{
mpu_real16384_t r, d;
int nb = NB_R16384;
__mpu_char8_t s[6000]; /* size can be obtained by _real_max_string( NB_R16384 ) function */
ascii_to_real( r, "1.0", nb ); /* evaluate the R variable */
ascii_to_real( d, "1.0", nb ); /* evaluate the D variable */
r_atan2( r, r, d, nb ); /* arc tangent function of R / D and place result to the R variable */
real_to_ascii( s, r, _real_mant_digs(nb), 'E', 0, 0, nb ); /* convert R value to ASCII string S */
printf( "s = %s\n\nrc = %d;\n", s, rc );
}
__mpu_free_context();
return( rc );
}
Выполнив сборку и запустив нашу программу main:
make
./main
мы получим следующий вывод на терминал:
s = 7.853981633974483096156608458198757210492923498437764552437361480769541015715522496570087063355292669955370216283205766617734611523876455579313398520321202793625710256754846302763899111557372387325954911072027439164833615321189120584466957913178004772864121417308650871526135816620533484018150622853184311467516515788970437203802302407073135229288410919731475900028326326372051166303460367379853779023582643175914398979882730465293454831529482762796370186155949906873918379714381812228069845457529872824584183406101641607715053487365988061842976755449652359256926348042940732941880961687046169173512830001420317863158902069464428356894474022934092946803671102253062383575366373963427626980699223147308855049890280322554902160086045399534074436928274901296768028374999995932445124877649329332040240796487561148638367270756606305770633361712588154827970427525007844596882216468833020953551542944172868258995633726071888671827898907159705884468984379894454644451330428067016532504819691527989773041050497345238143002663714658197164840383454569920575754880088254632422489434056498534728124304438208697828788937143106135376739877073832792154319639722687745954386593662348298137651002319254177847524622060032145904008909269150261775454857388990497366919593623620638449436817117760118836615520116710647673728233284192572472880261880405142415060145095375483778133456075088969100618741183159785498181510674806991955886954090023354304103049811465787575715457436389266874596263736471467317489227318026993773257388302913362468006889900591201663747799704586994383915924518566356319656379546043936682227444431984500204117650040363122980433043036930875353604933921370403402893381380333689354623671096308309768485358336369406042156297458923713905248048055460681375635642219179476236504133667012471568081979465214460959569919941703635252384709465902376700160562813012793482462240210321221567364010604913212555526652965766860696555097987362617809284467402390910929793218669411643934906034727164581614989533476195068975248664410197378173670995881489274564556551306223519316798695671206503692477256600340986093638262670508740631129373499128578574522976648127343054241153789274645968526494714899432438747325404384821170345671709672356935389979639813114884898577624931311702114968184111739621634591840556565247811520128109710976128110341374406951994289228589994250324040223604237171389621015883555180564571221620396140071265042106848630668669197238130346306374886666819559966141490290887215576443641245088984086420435810281287690173698627741490235063072199277232864172842168071872351400253758271544821702302186902294562346472524287274189963153413874454732824462054207497371806647012143910035676193887830949103628809365585911357146111988164669552627853386839348807783567915255339923840578607381212342967775364413508975699836009355018276446347655495968619521196224208303614284671879858766075546132977621202513426536701687298195477994849880153549158571886101609362809295480449995977539798904536687856728099372352267966235579903919863020237866375563079009704825355234405344639891597344467707597674480193366805456406499153753553757670096119336373006513536664813003743607126831296665005331085220476776215829336624128634764490671402513770266646992495408936840960131428647757242660350277428015701097599398789192894251050844674840018076396907940898554682812867801332320479565465314668303947996037122072911176523938176739305229391779180727745422728820043376678187145805717958802338491431280270894787842470522861052516877583667775785316777842477164629099578754925412877921292859414404587889127212274974649955968363820829088769119796339733065463724080332332724642660511688147677288703541374648654092950677454985774811222393928207226480808315243249280211083933163723455977983149365916826459010357034707580095622593974631093604257283191404523443361007676867302800478255082595049405275275112323303790210611214909417459738071711957808881645532862394214315608360473259921606560852693306744507018297288602752611705813179050263163068027915099166393273136777639463440866705163277474131729655141192328142646589155046395251823401649691215294776133372125865284144216883123604170099066449469296390211382413531663521326535861079646692437864153517001750594694147836004281873676051405576347486403285177817501019636833174847703636661614701993177066707658582146964245763089522332664393516988642909438135505287389403953500625315571485325541178877448148077476991368440313794141878393794574166136947936252824903722576159986783240526835109379739339903647254847428277947607445714118758007996728785071770214976200273530368053294869119431556035637136350830392963265355720343962607658304379574496655592930397901929173136871847466637373625286635157108415984475099423164180365963266840241428022951909581791604068722200196731400725571180260079302965205104750105741542799094480334393778739875391512407965736816368410631E-1
rc = 0;
Все операции, предусмотренные библиотекой LibMPU, можно увидеть с заголовочном файле libmpu.h. Здесь мы рассмотрим лишь некоторые из них.
Сложение и вычитание
Библиотекой предусмотрены четыре операции сложения и вычитания целых чисел. Две из них, iadd(), isub(), не используют флаг переноса (C). В то время как две другие, iadc(), isbb(), позволяют учитывать флаг переноса (C), выставленный предыдущей операцией.
iadd()
#include <libmpu.h>
void iadd( mpu_int *c, mpu_int *a, mpu_int *b, int nb );
Функция iadd() выполняет операцию сложения целых чисел, расположенных по адресам a и b, c размещением результата по адресу c. Операнды могут быть числами со знаком или без него. Содержимое памяти по адресам a, b не изменяется, предыдущее содержимое памяти по адресу c теряется. Параметр nb определяет размер операндов (в байтах), расположенных по адресам c, a, b.
Функция воздействует на флаги A, C, O, P, S, Z и V.
Флаги А и P выставляются только в том случае, когда размер операндов a, b равен одному или двум байтам (nb == 1 || nb == 2).
Пример
#include <libmpu.h>
#include <stdio.h>
int main( void )
{
int rc = 0;
__mpu_init();
__mpu_extra_warnings = 1;
{
mpu_int128_t c, a, b;
int nb = NB_I128;
__mpu_char8_t s[256];
iatoi( a, "237", nb ); /* evaluate the A variable */
iatoi( b, "37", nb ); /* evaluate the B variable */
iadd( c, a, b, nb );
iitoa( s, c, RADIX_DEC, LOWERCASE, nb ); /* convert C value to ASCII string S */
printf( "c = %s;\n", s ); /* c = 274; */
}
__mpu_free_context();
return( rc );
}
isub()
#include <libmpu.h>
void isub( mpu_int *c, mpu_int *a, mpu_int *b, int nb );
Функция isub() выполняет операцию вычитания целых чисел, расположенных по адресам a и b, c размещением результата по адресу c. Операнды могут быть числами со знаком или без него. Содержимое памяти по адресам a, b не изменяется, предыдущее содержимое памяти по адресу c теряется. Параметр nb определяет размер операндов (в байтах), расположенных по адресам c, a, b.
Функция воздействует на флаги A, C, O, P, S, Z и V.
Флаги А и P выставляются только в том случае, когда размер операндов a, b равен одному или двум байтам (nb == 1 || nb == 2).
Пример
#include <libmpu.h>
#include <stdio.h>
int main( void )
{
int rc = 0;
__mpu_init();
__mpu_extra_warnings = 1;
{
mpu_int128_t c, a, b;
int nb = NB_I128;
__mpu_char8_t s[256];
iatoi( a, "237", nb ); /* evaluate the A variable */
iatoi( b, "37", nb ); /* evaluate the B variable */
isub( c, a, b, nb );
iitoa( s, c, RADIX_DEC, LOWERCASE, nb ); /* convert C value to ASCII string S */
printf( "c = %s;\n", s ); /* c = 200; */
}
__mpu_free_context();
return( rc );
}
iadc()
#include <libmpu.h>
void iadс( mpu_int *c, mpu_int *a, mpu_int *b, int nb );
Функция iadc() выполняет операцию сложения целых чисел, расположенных по адресам a и b, к полученной сумме добавляет значение флага переноса (C) и размещает результат по адресу c. Операнды могут быть числами со знаком или без него. Содержимое памяти по адресам a, b не изменяется, предыдущее содержимое памяти по адресу c теряется. Параметр nb определяет размер операндов (в байтах), расположенных по адресам c, a, b. Поскольку функция iadc() использует флаг переноса (C), то она может применяться для сложения чисел, длина которых превышает максимально допустимые размеры целых чисел.
Функция воздействует на флаги A, C, O, P, S, Z и V.
Флаги А и P выставляются только в том случае, когда размер операндов a, b равен одному или двум байтам (nb == 1 || nb == 2).
Пример
#include <libmpu.h>
#include <stdio.h>
int main( void )
{
int rc = 0;
__mpu_init();
__mpu_extra_warnings = 1;
{
mpu_int128_t c, a, b;
int nb = NB_I128;
__mpu_char8_t s[256];
iatoi( a, "237", nb ); /* evaluate the A variable */
iatoi( b, "37", nb ); /* evaluate the B variable */
__mpu_stc(); /* Set Carry Flag */
iadc( c, a, b, nb );
iitoa( s, c, RADIX_DEC, LOWERCASE, nb ); /* convert C value to ASCII string S */
printf( "c = %s;\n", s ); /* c = 275; */
}
__mpu_free_context();
return( rc );
}
isbb()
#include <libmpu.h>
void isbb( mpu_int *c, mpu_int *a, mpu_int *b, int nb );
Функция isbb() выполняет операцию вычитания целых чисел, расположенных по адресам a и b, из полученной разности вычитает значение флага переноса (C) и размещает результат по адресу c. Операнды могут быть числами со знаком или без него. Содержимое памяти по адресам a, b не изменяется, предыдущее содержимое памяти по адресу c теряется. Параметр nb определяет размер операндов (в байтах), расположенных по адресам c, a, b. Поскольку функция isbb() использует флаг переноса (C), то она может применяться для вычитания чисел, длина которых превышает максимально допустимые размеры целых чисел.
Функция воздействует на флаги A, C, O, P, S, Z и V.
Флаги А и P выставляются только в том случае, когда размер операндов a, b равен одному или двум байтам (nb == 1 || nb == 2).
Пример
#include <libmpu.h>
#include <stdio.h>
int main( void )
{
int rc = 0;
__mpu_init();
__mpu_extra_warnings = 1;
{
mpu_int128_t c, a, b;
int nb = NB_I128;
__mpu_char8_t s[256];
iatoi( a, "237", nb ); /* evaluate the A variable */
iatoi( b, "37", nb ); /* evaluate the B variable */
__mpu_stc(); /* Set Carry Flag */
isbb( c, a, b, nb );
iitoa( s, c, RADIX_DEC, LOWERCASE, nb ); /* convert C value to ASCII string S */
printf( "c = %s;\n", s ); /* c = 199; */
}
__mpu_free_context();
return( rc );
}
Сдвиги
#include <libmpu.h>
void ishl( mpu_int *c, mpu_int *a, int nb );
void ishr( mpu_int *c, mpu_int *a, int nb );
void isal( mpu_int *c, mpu_int *a, int nb );
void isar( mpu_int *c, mpu_int *a, int nb );
Для операций сдвигов на один бит входным операндом служит переменная размером nb байт, находящаяся по адресу a. Результат помещается в переменную того же размера, расположенную по адресу c. Пространства, занимаемые входной и выходной переменной в памяти могут пересекаться, как частично, так и полностью, что не влияет на правильность получаемого результата. Содержимое переменной, расположенной по адресу a останется неизменным после выполнения операции, если занимаемое ею пространство не пересекается с пространством, занимаемым переменной c.
При выполнениии операций сдвига, флаг переноса (C) всегда содержит значение последнего выдвинутого бита. Существуют следующие виды операций сдвига:
SHL – логический беззнаковый сдвиг влево на один бит.
SHR – логический беззнаковый сдвиг вправо на один бит.
SAL – арифметический сдвиг влево на один бит.
SAR – арифметический сдвиг вправо на один бит.
Следующие таблицы иллюстрируют выполнение операций ishl(), ishr().
+----------------+---+-------------------+------------+
| SHL(<<): | C | значение операнда | заполнение |
+----------------+---+-------------------+------------+
| до операции | | 10110111 | 0 |
+----------------+---+-------------------+------------+
| после операции | 1 | 01101110 | |
+----------------+---+-------------------+------------+
+----------------+------------+-------------------+---+
| SHR(>>): | заполнение | значение операнда | C |
+----------------+------------+-------------------+---+
| до операции | 0 | 10110111 | |
+----------------+------------+-------------------+---+
| после операции | | 01011011 | 1 |
+----------------+------------+-------------------+---+
Из таблиц видно, что при любом логическом сдвиге на освободившееся место всегда задвигается 0. Флаг переполнения (O) выставляется, если в результате операции операнд изменил знак.
Операция арифметического сдвига влево isal() действует аналогично операции ishl() (также на пустое место справа задвигается 0). Операция арифметического сдвига вправо действует иначе: в освобождающуюся позицию слева копируется знаковый бит исходного операнда. Действие операций isal() и isar() показано с помощью следующих таблиц.
+----------------+---+-------------------+------------+
| SAL(<<): | C | значение операнда | заполнение |
+----------------+---+-------------------+------------+
| до операции | | 10110111 | 0 |
+----------------+---+-------------------+------------+
| после операции | 1 | 01101110 | |
+----------------+---+-------------------+------------+
+----------------+------------+-------------------+---+
| SAR(>>): | заполнение | значение операнда | C |
+----------------+------------+-------------------+---+
| до операции | sign(1) | 10110111 | |
+----------------+------------+-------------------+---+
| после операции | | 11011011 | 1 |
+----------------+------------+-------------------+---+
Флаг переполнения при выполнении операции isal() выставляется таким же образом, как и при операции ishl(). При выполнении операции isar(), операнд не может изменить свой знак. Многократный сдвиг isar() может, в конце концов, привести к потере значения, и положительное число задвинется в 0, а отрицательное в -1. По этому флаг переполнения (O) для операции isar() сбрасывается в 0.
При выполнении операций isal(), isar(), ishl(), ishr(), так же выставляются флаги четности (P), знака (S) и нуля (Z). Флаг переноса из младшей тетрады (A) не определяется и просто сбрасывается в 0.
Сдвиг влево можно применять для удваивания чисел, а сдвиг вправо – для деления на 2. Эти операции выполняются значительно быстрее, чем операции умножения и деления. Деление пополам нечетных чисел (например, 5 или 7) образует меньшие значения (2 или 3 соответственно) и устанавливает флаг переноса (C) в 1. При этом C фактически содержит остаток от деления. Такое использование операций сдвига требует контроля за флагом переполнения (O). Для простоты, рассмотрим контроль флагов на 4-битных знаковых переменных:
Примеры с 4-битными операндами:
Умножение на 2:
SAL(0111) = 7; результат = 1110 = -2, ошибка, должно быть 14, CF = 0, OF = 1
Деление на 2:
SHR(1000) = -8; результат = 0100 = 4, ошибка, должно быть -4, CF = 0, OF = 1
Деление на 2:
SAR(1000) = -8; результат = 1100 = -4, абсолютно точно, CF = 0, OF = 0
Деление на 2:
SAR(0111) = 7; результат = 0011 = 3, остаток 1 (см. флаг C), абсолютно точно, CF = 1, OF = 0
Пример программы
#include <libmpu.h>
#include <stdio.h>
int main( void )
{
int rc = 0;
__mpu_init();
__mpu_extra_warnings = 1;
{
mpu_int8_t c, a;
int nb = NB_I8;
__mpu_char8_t sc[32], sa[32];
iatoi( a, "0b10110111", nb ); /* evaluate the A variable */
ishl( c, a, nb );
iitoa( sa, a, RADIX_BIN, LOWERCASE, nb ); /* convert A value to ASCII string SA */
iitoa( sc, c, RADIX_BIN, LOWERCASE, nb ); /* convert C value to ASCII string SC */
printf( "a = %s;\n", sa ); /* c = 0b10110111; */
printf( "c = %s;\n", sc ); /* c = 0b01101110; */
printf( "carry = %d;\n", __mpu_gtc() ); /* Carry Flag */
printf( "overflow = %d;\n", __mpu_gto() ); /* Overflow Flag */
}
__mpu_free_context();
return( rc );
}
Циклические сдвиги
#include <libmpu.h>
void irol( mpu_int *c, mpu_int *a, int nb );
void iror( mpu_int *c, mpu_int *a, int nb );
void ircl( mpu_int *c, mpu_int *a, int nb );
void ircr( mpu_int *c, mpu_int *a, int nb );
Для операций циклического сдвига на один бит входным операндом служит переменная размером nb байт, находящаяся по адресу a. Результат помещается в переменную того же размера, расположенную по адресу c. Пространства, занимаемые входной и выходной переменной в памяти могут пересекаться, как частично, так и полностью, что не влияет на правильность получаемого результата. Содержимое переменной, расположенной по адресу a останется неизменным после выполнения операции, если занимаемое ею пространство не пересекается с пространством, занимаемым переменной c.
При выполнениии операций циклического сдвига, флаг переноса (C) всегда содержит значение последнего выдвинутого бита. Существуют следующие виды операций циклического сдвига:
ROL – циклический сдвиг влево на один бит.
ROR – циклический сдвиг вправо на один бит.
RCL – циклический сдвиг влево на один бит с участием флага переноса.
RCR – циклический сдвиг вправо на один бит с участием флага переноса.
Следующие таблицы иллюстрируют выполнение операций irol(), iror().
+----------------+---+-------------------+------------+
| ROL(<<): | C | значение операнда | заполнение |
+----------------+---+-------------------+------------+
| до операции | | 10110111 | sign(1) |
+----------------+---+-------------------+------------+
| после операции | 1 | 01101111 | |
+----------------+---+-------------------+------------+
+----------------+------------+-------------------+---+
| ROR(>>): | заполнение | значение операнда | C |
+----------------+------------+-------------------+---+
| до операции | low bit(1) | 10110111 | |
+----------------+------------+-------------------+---+
| после операции | | 11011011 | 1 |
+----------------+------------+-------------------+---+
Операции irol() и iror() (аналогично с командами сдвига isal(), isar(), ishl(), ishr()) действуют на флаг переполнения (O) контролируя изменение знака операнда. Так же выставляются флаги четности (P), знака (S) и нуля (Z). Флаг переноса из младшей тетрады (A) не определяется и просто сбрасывается в 0.
В операциях ircl() и ircr() в сдвиге участвует флаг переноса (C). Выдвигаемый из операнда бит заносится во флаг переноса (C) после того, как предыдущее значение C поступит в освободившуюся позицию.
+----------------+---+-------------------+------------+
| RCL(<<): | C | значение операнда | заполнение |
+----------------+---+-------------------+------------+
| до операции | 0 | 10110111 | C(0) |
+----------------+---+-------------------+------------+
| после операции | 1 | 01101110 | |
+----------------+---+-------------------+------------+
+----------------+------------+-------------------+---+
| RCR(>>): | заполнение | значение операнда │ C │
+----------------+------------+-------------------+---+
| до операции | C(0) | 10110111 | 0 |
+----------------+------------+-------------------+---+
| после операции | | 01011011 | 1 |
+----------------+------------+-------------------+---+
Операции ircl(), ircr() воздействуют на флаги переноса (C) и переполнения (O) аналогично всем предыдущим операциям. Флаг переноса из младшей тетрады (A) не определяется и просто сбрасывается в 0.
Выставление флагов четности (P) и нуля (Z) операциями ircl(), ircr() несколько отличается от предыдущих типов операций. Это относится и к флагу знака (S). Так как операции ircl(), ircr() могут использоваться для сдвигов нескольких слов совместно с другими командами сдвига и, как правило, завершают такие составные операции, хотелось бы, после их завершения, иметь состояние флагов P и Z соответствующим не только последнему сдвигаемому слову, а целиком всей сдвигаемой комбинации слов.
Для этого операция ircr() выставляет свои флаги (P, S), а операция ircl() не определяет свои флаги (P, S) и не изменяет их предыдущих значений. Флаг нуля (Z) обеими операциями (ircl(), ircr()) выставляется по Логическому И (AND) с предыдущим значением флага Z, то есть:
+----------------+----------------+----------------+
| | Значение Z, | |
| Предыдущее | полученное | Результирующее |
| значение Z | в результате | значение Z |
| | операции | |
+----------------+----------------+----------------+
| 1 | 0 | 0 |
+----------------+----------------+----------------+
| 1 | 1 | 1 |
+----------------+----------------+----------------+
| 0 | 0 | 0 |
+----------------+----------------+----------------+
| 0 | 1 | 0 |
+----------------+----------------+----------------+
Таким образом, если все слова, участвующие в комбинации сдвигов, дали нулевой результат, то и флаг Z останется в значении ИСТИНА, иначе, если хотя-бы одно слово дало ненулевой результат, флаг Z останется в состоянии ЛОЖЬ.
Примеры операций:
Сдвиг пары слов вправо:
isar(11111101), ircr(10011010); после isar() результат = 11111110, C=1, O=0, P=1, Z=0; после ircr() результат = 11001101, C=0, O=0, P=0, Z=0. Общий результат: 1111111011001101. Состояние флагов после операции ircr() гарантированно принадлежит ко всей комбинации двух слов (размером по 8 бит каждое).
Сдвиг пары слов влево:
ircl(00111000), isal(10111111); после isal() результат = 01111110, C=1, O=1, P=1, Z=0; после ircl() результат = 01110001, C=0, O=0, P=1, Z=0. Общий результат: 0111000101111110. Состояние флагов после операции isal() гарантированно принадлежит ко всей комбинации двух слов (размером по 8 бит каждое). Заметим, что флаг P выставлен операцией isal() и не изменялся операцией ircl(), флаг Z получен по AND между Z от isal() и Z от ircl().
Пример программы
#include <libmpu.h>
#include <stdio.h>
int main( void )
{
int rc = 0;
__mpu_init();
__mpu_extra_warnings = 1;
{
mpu_int8_t c, d, a, b;
mpu_int16_t z;
mpu_int *pz = NULL;
__mpu_char8_t s[32];
pz = (mpu_int *)&z;
#if ( MPU_BYTE_ORDER_BIG_ENDIAN == 1 )
++pz;
#endif
iatoi( b, "0b10111111", NB_I8 ); /* low part */
iatoi( a, "0b00111000", NB_I8 ); /* high part */
__mpu_clc(); /* clear Carry Flag */
isal( d, b, NB_I8 );
ircl( c, a, NB_I8 );
icpy( pz, d, NB_I8, NB_I8 ); /* low part of Z */
#if ( MPU_BYTE_ORDER_BIG_ENDIAN == 1 )
--pz;
#else
++pz;
#endif
icpy( pz, c, NB_I8, NB_I8 ); /* high part of Z */
iitoa( s, z, RADIX_BIN, UPPERCASE, NB_I16 ); /* convert Z value to ASCII string S */
printf( "z = %s;\n", s ); /* z = 0B0111000101111110; */
printf( "carry = %d;\n", __mpu_gtc() ); /* Carry Flag */
printf( "overflow = %d;\n", __mpu_gto() ); /* Overflow Flag */
}
__mpu_free_context();
return( rc );
}
Мы рассмотрели операции сдвига на один бит. Однако в библиотеке LibMPU предусмотрены также сдвиги на N-бит.
Библиотека LibMPU насчитывает большое количество операций с целыми, вещественными и комплексными переменными. Если пользователю помимо man(7) страниц будет необходима дополнительная информация о работе функций библиотеки, он всегда может обратиться к исходному коду и заголовочному файлу libmpu.h.
Контакты:
Telegram: @rxlinux
E‑mail: Contact Us
Комментарии (9)
dyadyaSerezha
05.01.2025 15:10Писал классический линуксоид/опенсорсник. Нет главного - первого абзаца с кратким описанием - что, где, зачем, почему. Что - своя либа или это обзор какой-то известной? Где - для каких платформ/OS предназначена, сравнения производительности и/или точности? Зачем - что не так с другими либами, что решили сделать свою? Почему - почему не улучшили существующие опенсорсные либы, а сделали свою?
Вместо этого идет сразу "вот тут играть тут не играть, а тут рыбу заворачивали". (с)
rcl Автор
05.01.2025 15:10Библиотека создавалась давно как часть большого продукта. Сейчас решил выделить в отдельное средство и написал обзор.
Исходники сами говорят за себя.
Если окажется кому-то полезной, будет продолжение.
Gordon01
05.01.2025 15:10Писал классический линуксоид/опенсорсник
Плюсую. Дополню:
Ужасное апи с функциями, начинающимися на __, какими-то глобальными переменными прочими антипаттернами из 80х
Нечем собирать, автор предлагает использовать доисторический мейк в 2025. Лол. Хотя бы cmake из нулевых или манифест для базеля из десятых было бы норм.
Обработка и сброс ошибок тоже через глобалки
wataru
Умножение длинных чисел поддерживается? А деление? Или только умножение/деление на степени двойки? Это же самое интересное!
Сравнивали вашу библиотеку с GMP?
Что у нее с производительностью?
rcl Автор
Поддерживается деление, умножение. Для вещественных чисел есть вся необходимая тригонометрия.
С gmp не сравнивал. Задачи у нас разные. На сколько я знаю, gmp не предназначена для вычисления тригонометрических функций.
Здесь можно посмотреть: https://cgit.radix-linux.su/libs/libmpu.git/trunk/include/libmpu.h.in/
wataru
Кажется, нашел. Умножение реализовано через битовый сдвиг, за O(n^2). Никакого FFT или Карацубы, я правильно понимаю?
Ну нет, задачи то одинаковые - вычисления с произвольной точностью. Основные операции есть везде, а какой набор не тривиальных функций релизовывать - это вкусовщина. Если кому тригонометрия нужна, то можно ее руками через ряд тейлора посчитать. У вас в библиотеке нет, например, чего-то вроде mul_2exp, как отдельной функции. Но да, libgmp делает упор на целых числах. Всякую тригонометрию можно сравнивать с libmpfr.
rcl Автор
Алгоритм Карацубы не применяется. Если нужны подробности реализации умножения и деления целых чисел, то посмотрите на статические функции iEMUSHORTm(), iSINGLE_EMUSHORTm(), iSINGLE_EMUSHORTd() в файле https://cgit.radix-linux.su/libs/libmpu.git/trunk/mpu/mpu-integer.c/ .