Fast convolution overlap save

Auf dem Texas Instruments floating point DSP Jacinto (C66x und C674x) wurde eine schnelle Faltung durch overlapp save implementiert. Im Bild 3 sind die Ausführungszeiten für verschiedene Impulsantworten dargestellt.

FastConvolutionFFT_L256, 2ChFFT_L8192, 2ChFFT_L16384, 2Ch
148memcpy41178212
148memcpy41178212
1825FFT96516192772
540ExtractSpectraC1641232796
540ExtractSpectraC1641232796
282ComplexMult821816410
282ComplexMult821816410
531Add2ndSpecHalfC1640332787
531Add2ndSpecHalfC1640332787
789MergeSpectra2459749173
1749IFFT90395180507
7365301808602862
FFT cyc/sample28,769531336,841796936,7957764
Bild 3: Ausführungszeiten[cycles] der schnellen Faltung Jacinto