git.gag.com Git - fw/stlink/blob - exampleF4/CMSIS/Documentation/DSP_Lib/html/arm__cfft__radix4__q15_8c_source.html

   1 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
   2 <html xmlns="http://www.w3.org/1999/xhtml">
   3 <head>
   4 <meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
   5 <title>CMSIS DSP Software Library: arm_cfft_radix4_q15.c Source File</title>
   6 <link href="tabs.css" rel="stylesheet" type="text/css"/>
   7 <link href="search/search.css" rel="stylesheet" type="text/css"/>
   8 <script type="text/javaScript" src="search/search.js"></script>
   9 <link href="doxygen.css" rel="stylesheet" type="text/css"/>
  10 </head>
  11 <body onload='searchBox.OnSelectItem(0);'>
  12 <!-- Generated by Doxygen 1.7.2 -->
  13 <script type="text/javascript"><!--
  14 var searchBox = new SearchBox("searchBox", "search",false,'Search');
  15 --></script>
  16 <div class="navigation" id="top">
  17   <div class="tabs">
  18     <ul class="tablist">
  19       <li><a href="index.html"><span>Main&#160;Page</span></a></li>
  20       <li><a href="modules.html"><span>Modules</span></a></li>
  21       <li><a href="annotated.html"><span>Data&#160;Structures</span></a></li>
  22       <li class="current"><a href="files.html"><span>Files</span></a></li>
  23       <li><a href="examples.html"><span>Examples</span></a></li>
  24       <li id="searchli">
  25         <div id="MSearchBox" class="MSearchBoxInactive">
  26         <span class="left">
  27           <img id="MSearchSelect" src="search/mag_sel.png"
  28                onmouseover="return searchBox.OnSearchSelectShow()"
  29                onmouseout="return searchBox.OnSearchSelectHide()"
  30                alt=""/>
  31           <input type="text" id="MSearchField" value="Search" accesskey="S"
  32                onfocus="searchBox.OnSearchFieldFocus(true)"
  33                onblur="searchBox.OnSearchFieldFocus(false)"
  34                onkeyup="searchBox.OnSearchFieldChange(event)"/>
  35           </span><span class="right">
  36             <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
  37           </span>
  38         </div>
  39       </li>
  40     </ul>
  41   </div>
  42   <div class="tabs2">
  43     <ul class="tablist">
  44       <li><a href="files.html"><span>File&#160;List</span></a></li>
  45       <li><a href="globals.html"><span>Globals</span></a></li>
  46     </ul>
  47   </div>
  48 <div class="header">
  49   <div class="headertitle">
  50 <h1>arm_cfft_radix4_q15.c</h1>  </div>
  51 </div>
  52 <div class="contents">
  53 <a href="arm__cfft__radix4__q15_8c.html">Go to the documentation of this file.</a><div class="fragment"><pre class="fragment"><a name="l00001"></a>00001 <span class="comment">/* ----------------------------------------------------------------------   </span>
  54 <a name="l00002"></a>00002 <span class="comment">* Copyright (C) 2010 ARM Limited. All rights reserved.   </span>
  55 <a name="l00003"></a>00003 <span class="comment">*   </span>
  56 <a name="l00004"></a>00004 <span class="comment">* $Date:        15. July 2011  </span>
  57 <a name="l00005"></a>00005 <span class="comment">* $Revision:    V1.0.10  </span>
  58 <a name="l00006"></a>00006 <span class="comment">*   </span>
  59 <a name="l00007"></a>00007 <span class="comment">* Project:      CMSIS DSP Library   </span>
  60 <a name="l00008"></a>00008 <span class="comment">* Title:        arm_cfft_radix4_q15.c   </span>
  61 <a name="l00009"></a>00009 <span class="comment">*   </span>
  62 <a name="l00010"></a>00010 <span class="comment">* Description:  This file has function definition of Radix-4 FFT &amp; IFFT function and   </span>
  63 <a name="l00011"></a>00011 <span class="comment">*               In-place bit reversal using bit reversal table   </span>
  64 <a name="l00012"></a>00012 <span class="comment">*   </span>
  65 <a name="l00013"></a>00013 <span class="comment">* Target Processor: Cortex-M4/Cortex-M3/Cortex-M0</span>
  66 <a name="l00014"></a>00014 <span class="comment">*  </span>
  67 <a name="l00015"></a>00015 <span class="comment">* Version 1.0.10 2011/7/15 </span>
  68 <a name="l00016"></a>00016 <span class="comment">*    Big Endian support added and Merged M0 and M3/M4 Source code.  </span>
  69 <a name="l00017"></a>00017 <span class="comment">*   </span>
  70 <a name="l00018"></a>00018 <span class="comment">* Version 1.0.3 2010/11/29  </span>
  71 <a name="l00019"></a>00019 <span class="comment">*    Re-organized the CMSIS folders and updated documentation.   </span>
  72 <a name="l00020"></a>00020 <span class="comment">*    </span>
  73 <a name="l00021"></a>00021 <span class="comment">* Version 1.0.2 2010/11/11   </span>
  74 <a name="l00022"></a>00022 <span class="comment">*    Documentation updated.    </span>
  75 <a name="l00023"></a>00023 <span class="comment">*   </span>
  76 <a name="l00024"></a>00024 <span class="comment">* Version 1.0.1 2010/10/05    </span>
  77 <a name="l00025"></a>00025 <span class="comment">*    Production release and review comments incorporated.   </span>
  78 <a name="l00026"></a>00026 <span class="comment">*   </span>
  79 <a name="l00027"></a>00027 <span class="comment">* Version 1.0.0 2010/09/20    </span>
  80 <a name="l00028"></a>00028 <span class="comment">*    Production release and review comments incorporated.   </span>
  81 <a name="l00029"></a>00029 <span class="comment">*   </span>
  82 <a name="l00030"></a>00030 <span class="comment">* Version 0.0.5  2010/04/26    </span>
  83 <a name="l00031"></a>00031 <span class="comment">*    incorporated review comments and updated with latest CMSIS layer   </span>
  84 <a name="l00032"></a>00032 <span class="comment">*   </span>
  85 <a name="l00033"></a>00033 <span class="comment">* Version 0.0.3  2010/03/10    </span>
  86 <a name="l00034"></a>00034 <span class="comment">*    Initial version   </span>
  87 <a name="l00035"></a>00035 <span class="comment">* -------------------------------------------------------------------- */</span>
  88 <a name="l00036"></a>00036
  89 <a name="l00037"></a>00037 <span class="preprocessor">#include &quot;<a class="code" href="arm__math_8h.html">arm_math.h</a>&quot;</span>
  90 <a name="l00038"></a>00038
  91 <a name="l00066"></a><a class="code" href="group___c_f_f_t___c_i_f_f_t.html#ga8d66cdac41b8bf6cefdb895456eee84a">00066</a> <span class="keywordtype">void</span> <a class="code" href="group___c_f_f_t___c_i_f_f_t.html#ga8d66cdac41b8bf6cefdb895456eee84a" title="Processing function for the Q15 CFFT/CIFFT.">arm_cfft_radix4_q15</a>(
  92 <a name="l00067"></a>00067   <span class="keyword">const</span> <a class="code" href="structarm__cfft__radix4__instance__q15.html" title="Instance structure for the Q15 CFFT/CIFFT function.">arm_cfft_radix4_instance_q15</a> * S,
  93 <a name="l00068"></a>00068   <a class="code" href="arm__math_8h.html#ab5a8fb21a5b3b983d5f54f31614052ea" title="16-bit fractional data type in 1.15 format.">q15_t</a> * pSrc)
  94 <a name="l00069"></a>00069 {
  95 <a name="l00070"></a>00070   <span class="keywordflow">if</span>(S-&gt;<a class="code" href="structarm__cfft__radix4__instance__q15.html#a2ecff6ea735cb4d22e922d0fd5736655">ifftFlag</a> == 1u)
  96 <a name="l00071"></a>00071   {
  97 <a name="l00072"></a>00072     <span class="comment">/*  Complex IFFT radix-4  */</span>
  98 <a name="l00073"></a>00073     <a class="code" href="arm__cfft__radix4__q15_8c.html#aad04e8439d17dab5617bf1be268bb391" title="Core function for the Q15 CIFFT butterfly process.">arm_radix4_butterfly_inverse_q15</a>(pSrc, S-&gt;<a class="code" href="structarm__cfft__radix4__instance__q15.html#a5fc543e7d84ca8cb7cf6648970f21ca6">fftLen</a>, S-&gt;<a class="code" href="structarm__cfft__radix4__instance__q15.html#a29dd693537e45421a36891f8439e1fba">pTwiddle</a>,
  99 <a name="l00074"></a>00074                                      S-&gt;<a class="code" href="structarm__cfft__radix4__instance__q15.html#af32fdc78bcc27ca385f9b76a0a1f71c3">twidCoefModifier</a>);
 100 <a name="l00075"></a>00075   }
 101 <a name="l00076"></a>00076   <span class="keywordflow">else</span>
 102 <a name="l00077"></a>00077   {
 103 <a name="l00078"></a>00078     <span class="comment">/*  Complex FFT radix-4  */</span>
 104 <a name="l00079"></a>00079     <a class="code" href="arm__cfft__radix4__q15_8c.html#a2d01d2045f280c32036da97d33c52440" title="Core function for the Q15 CFFT butterfly process.">arm_radix4_butterfly_q15</a>(pSrc, S-&gt;<a class="code" href="structarm__cfft__radix4__instance__q15.html#a5fc543e7d84ca8cb7cf6648970f21ca6">fftLen</a>, S-&gt;<a class="code" href="structarm__cfft__radix4__instance__q15.html#a29dd693537e45421a36891f8439e1fba">pTwiddle</a>,
 105 <a name="l00080"></a>00080                              S-&gt;<a class="code" href="structarm__cfft__radix4__instance__q15.html#af32fdc78bcc27ca385f9b76a0a1f71c3">twidCoefModifier</a>);
 106 <a name="l00081"></a>00081   }
 107 <a name="l00082"></a>00082
 108 <a name="l00083"></a>00083   <span class="keywordflow">if</span>(S-&gt;<a class="code" href="structarm__cfft__radix4__instance__q15.html#a101e3f7b0bd6b5b14cd5214f23df4133">bitReverseFlag</a> == 1u)
 109 <a name="l00084"></a>00084   {
 110 <a name="l00085"></a>00085     <span class="comment">/*  Bit Reversal */</span>
 111 <a name="l00086"></a>00086     <a class="code" href="arm__cfft__radix4__q15_8c.html#a12a07b49948c354172ae07358309a4a5" title="In-place bit reversal function.">arm_bitreversal_q15</a>(pSrc, S-&gt;<a class="code" href="structarm__cfft__radix4__instance__q15.html#a5fc543e7d84ca8cb7cf6648970f21ca6">fftLen</a>, S-&gt;<a class="code" href="structarm__cfft__radix4__instance__q15.html#a6b010e5f02d1130c621e3d2e26b95df1">bitRevFactor</a>, S-&gt;<a class="code" href="structarm__cfft__radix4__instance__q15.html#a4acf704ae0cf30b53bf0fbfae8e34a59">pBitRevTable</a>);
 112 <a name="l00087"></a>00087   }
 113 <a name="l00088"></a>00088
 114 <a name="l00089"></a>00089 }
 115 <a name="l00090"></a>00090
 116 <a name="l00095"></a>00095 <span class="comment">/*   </span>
 117 <a name="l00096"></a>00096 <span class="comment">* Radix-4 FFT algorithm used is :   </span>
 118 <a name="l00097"></a>00097 <span class="comment">*   </span>
 119 <a name="l00098"></a>00098 <span class="comment">* Input real and imaginary data:   </span>
 120 <a name="l00099"></a>00099 <span class="comment">* x(n) = xa + j * ya   </span>
 121 <a name="l00100"></a>00100 <span class="comment">* x(n+N/4 ) = xb + j * yb   </span>
 122 <a name="l00101"></a>00101 <span class="comment">* x(n+N/2 ) = xc + j * yc   </span>
 123 <a name="l00102"></a>00102 <span class="comment">* x(n+3N 4) = xd + j * yd   </span>
 124 <a name="l00103"></a>00103 <span class="comment">*   </span>
 125 <a name="l00104"></a>00104 <span class="comment">*   </span>
 126 <a name="l00105"></a>00105 <span class="comment">* Output real and imaginary data:   </span>
 127 <a name="l00106"></a>00106 <span class="comment">* x(4r) = xa&#39;+ j * ya&#39;   </span>
 128 <a name="l00107"></a>00107 <span class="comment">* x(4r+1) = xb&#39;+ j * yb&#39;   </span>
 129 <a name="l00108"></a>00108 <span class="comment">* x(4r+2) = xc&#39;+ j * yc&#39;   </span>
 130 <a name="l00109"></a>00109 <span class="comment">* x(4r+3) = xd&#39;+ j * yd&#39;   </span>
 131 <a name="l00110"></a>00110 <span class="comment">*   </span>
 132 <a name="l00111"></a>00111 <span class="comment">*   </span>
 133 <a name="l00112"></a>00112 <span class="comment">* Twiddle factors for radix-4 FFT:   </span>
 134 <a name="l00113"></a>00113 <span class="comment">* Wn = co1 + j * (- si1)   </span>
 135 <a name="l00114"></a>00114 <span class="comment">* W2n = co2 + j * (- si2)   </span>
 136 <a name="l00115"></a>00115 <span class="comment">* W3n = co3 + j * (- si3)   </span>
 137 <a name="l00116"></a>00116 <span class="comment">   </span>
 138 <a name="l00117"></a>00117 <span class="comment">* The real and imaginary output values for the radix-4 butterfly are   </span>
 139 <a name="l00118"></a>00118 <span class="comment">* xa&#39; = xa + xb + xc + xd   </span>
 140 <a name="l00119"></a>00119 <span class="comment">* ya&#39; = ya + yb + yc + yd   </span>
 141 <a name="l00120"></a>00120 <span class="comment">* xb&#39; = (xa+yb-xc-yd)* co1 + (ya-xb-yc+xd)* (si1)   </span>
 142 <a name="l00121"></a>00121 <span class="comment">* yb&#39; = (ya-xb-yc+xd)* co1 - (xa+yb-xc-yd)* (si1)   </span>
 143 <a name="l00122"></a>00122 <span class="comment">* xc&#39; = (xa-xb+xc-xd)* co2 + (ya-yb+yc-yd)* (si2)   </span>
 144 <a name="l00123"></a>00123 <span class="comment">* yc&#39; = (ya-yb+yc-yd)* co2 - (xa-xb+xc-xd)* (si2)   </span>
 145 <a name="l00124"></a>00124 <span class="comment">* xd&#39; = (xa-yb-xc+yd)* co3 + (ya+xb-yc-xd)* (si3)   </span>
 146 <a name="l00125"></a>00125 <span class="comment">* yd&#39; = (ya+xb-yc-xd)* co3 - (xa-yb-xc+yd)* (si3)   </span>
 147 <a name="l00126"></a>00126 <span class="comment">*   </span>
 148 <a name="l00127"></a>00127 <span class="comment">*/</span>
 149 <a name="l00128"></a>00128
 150 <a name="l00138"></a><a class="code" href="arm__math_8h.html#a2d01d2045f280c32036da97d33c52440">00138</a> <span class="keywordtype">void</span> <a class="code" href="arm__cfft__radix4__q15_8c.html#a2d01d2045f280c32036da97d33c52440" title="Core function for the Q15 CFFT butterfly process.">arm_radix4_butterfly_q15</a>(
 151 <a name="l00139"></a>00139   <a class="code" href="arm__math_8h.html#ab5a8fb21a5b3b983d5f54f31614052ea" title="16-bit fractional data type in 1.15 format.">q15_t</a> * pSrc16,
 152 <a name="l00140"></a>00140   uint32_t fftLen,
 153 <a name="l00141"></a>00141   <a class="code" href="arm__math_8h.html#ab5a8fb21a5b3b983d5f54f31614052ea" title="16-bit fractional data type in 1.15 format.">q15_t</a> * pCoef16,
 154 <a name="l00142"></a>00142   uint32_t twidCoefModifier)
 155 <a name="l00143"></a>00143 {
 156 <a name="l00144"></a>00144
 157 <a name="l00145"></a>00145 <span class="preprocessor">#ifndef ARM_MATH_CM0</span>
 158 <a name="l00146"></a>00146 <span class="preprocessor"></span>
 159 <a name="l00147"></a>00147   <span class="comment">/* Run the below code for Cortex-M4 and Cortex-M3 */</span>
 160 <a name="l00148"></a>00148
 161 <a name="l00149"></a>00149   <a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> R, S, T, U;
 162 <a name="l00150"></a>00150   <a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> C1, C2, C3, out1, out2;
 163 <a name="l00151"></a>00151   <a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> *pSrc, *pCoeff;
 164 <a name="l00152"></a>00152   uint32_t n1, n2, ic, i0, i1, i2, i3, j, k;
 165 <a name="l00153"></a>00153   <a class="code" href="arm__math_8h.html#ab5a8fb21a5b3b983d5f54f31614052ea" title="16-bit fractional data type in 1.15 format.">q15_t</a> in;
 166 <a name="l00154"></a>00154
 167 <a name="l00155"></a>00155   <span class="comment">/* Total process is divided into three stages */</span>
 168 <a name="l00156"></a>00156
 169 <a name="l00157"></a>00157   <span class="comment">/* process first stage, middle stages, &amp; last stage */</span>
 170 <a name="l00158"></a>00158
 171 <a name="l00159"></a>00159   <span class="comment">/*  pointer initializations for SIMD calculations */</span>
 172 <a name="l00160"></a>00160   pSrc = (<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> *) pSrc16;
 173 <a name="l00161"></a>00161   pCoeff = (<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> *) pCoef16;
 174 <a name="l00162"></a>00162
 175 <a name="l00163"></a>00163   <span class="comment">/*  Initializations for the first stage */</span>
 176 <a name="l00164"></a>00164   n2 = fftLen;
 177 <a name="l00165"></a>00165   n1 = n2;
 178 <a name="l00166"></a>00166
 179 <a name="l00167"></a>00167   <span class="comment">/* n2 = fftLen/4 */</span>
 180 <a name="l00168"></a>00168   n2 &gt;&gt;= 2u;
 181 <a name="l00169"></a>00169
 182 <a name="l00170"></a>00170   <span class="comment">/* Index for twiddle coefficient */</span>
 183 <a name="l00171"></a>00171   ic = 0u;
 184 <a name="l00172"></a>00172
 185 <a name="l00173"></a>00173   <span class="comment">/* Index for input read and output write */</span>
 186 <a name="l00174"></a>00174   i0 = 0u;
 187 <a name="l00175"></a>00175   j = n2;
 188 <a name="l00176"></a>00176
 189 <a name="l00177"></a>00177   <span class="comment">/* Input is in 1.15(q15) format */</span>
 190 <a name="l00178"></a>00178
 191 <a name="l00179"></a>00179   <span class="comment">/*  start of first stage process */</span>
 192 <a name="l00180"></a>00180   <span class="keywordflow">do</span>
 193 <a name="l00181"></a>00181   {
 194 <a name="l00182"></a>00182     <span class="comment">/*  Butterfly implementation */</span>
 195 <a name="l00183"></a>00183
 196 <a name="l00184"></a>00184     <span class="comment">/*  index calculation for the input as, */</span>
 197 <a name="l00185"></a>00185     <span class="comment">/*  pSrc[i0 + 0], pSrc[i0 + fftLen/4], pSrc[i0 + fftLen/2], pSrc[i0 + 3fftLen/4] */</span>
 198 <a name="l00186"></a>00186     i1 = i0 + n2;
 199 <a name="l00187"></a>00187     i2 = i1 + n2;
 200 <a name="l00188"></a>00188     i3 = i2 + n2;
 201 <a name="l00189"></a>00189
 202 <a name="l00190"></a>00190     <span class="comment">/*  Reading i0, i0+fftLen/2 inputs */</span>
 203 <a name="l00191"></a>00191     <span class="comment">/* Read ya (real), xa(imag) input */</span>
 204 <a name="l00192"></a>00192     T = pSrc[i0];
 205 <a name="l00193"></a>00193     in = ((int16_t) (T &amp; 0xFFFF)) &gt;&gt; 2;
 206 <a name="l00194"></a>00194     T = ((T &gt;&gt; 2) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
 207 <a name="l00195"></a>00195     <span class="comment">/* Read yc (real), xc(imag) input */</span>
 208 <a name="l00196"></a>00196     S = pSrc[i2];
 209 <a name="l00197"></a>00197     in = ((int16_t) (S &amp; 0xFFFF)) &gt;&gt; 2;
 210 <a name="l00198"></a>00198     S = ((S &gt;&gt; 2) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
 211 <a name="l00199"></a>00199     <span class="comment">/* R = packed((ya + yc), (xa + xc) ) */</span>
 212 <a name="l00200"></a>00200     R = __QADD16(T, S);
 213 <a name="l00201"></a>00201     <span class="comment">/* S = packed((ya - yc), (xa - xc) ) */</span>
 214 <a name="l00202"></a>00202     S = __QSUB16(T, S);
 215 <a name="l00203"></a>00203
 216 <a name="l00204"></a>00204     <span class="comment">/*  Reading i0+fftLen/4 , i0+3fftLen/4 inputs */</span>
 217 <a name="l00205"></a>00205     <span class="comment">/* Read yb (real), xb(imag) input */</span>
 218 <a name="l00206"></a>00206     T = pSrc[i1];
 219 <a name="l00207"></a>00207     in = ((int16_t) (T &amp; 0xFFFF)) &gt;&gt; 2;
 220 <a name="l00208"></a>00208     T = ((T &gt;&gt; 2) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
 221 <a name="l00209"></a>00209     <span class="comment">/* Read yd (real), xd(imag) input */</span>
 222 <a name="l00210"></a>00210     U = pSrc[i3];
 223 <a name="l00211"></a>00211     in = ((int16_t) (U &amp; 0xFFFF)) &gt;&gt; 2;
 224 <a name="l00212"></a>00212     U = ((U &gt;&gt; 2) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
 225 <a name="l00213"></a>00213     <span class="comment">/* T = packed((yb + yd), (xb + xd) ) */</span>
 226 <a name="l00214"></a>00214     T = __QADD16(T, U);
 227 <a name="l00215"></a>00215
 228 <a name="l00216"></a>00216     <span class="comment">/*  writing the butterfly processed i0 sample */</span>
 229 <a name="l00217"></a>00217     <span class="comment">/* xa&#39; = xa + xb + xc + xd */</span>
 230 <a name="l00218"></a>00218     <span class="comment">/* ya&#39; = ya + yb + yc + yd */</span>
 231 <a name="l00219"></a>00219     pSrc[i0] = __SHADD16(R, T);
 232 <a name="l00220"></a>00220
 233 <a name="l00221"></a>00221     <span class="comment">/* R = packed((ya + yc) - (yb + yd), (xa + xc)- (xb + xd)) */</span>
 234 <a name="l00222"></a>00222     R = __QSUB16(R, T);
 235 <a name="l00223"></a>00223
 236 <a name="l00224"></a>00224     <span class="comment">/* co2 &amp; si2 are read from SIMD Coefficient pointer */</span>
 237 <a name="l00225"></a>00225     C2 = pCoeff[2u * ic];
 238 <a name="l00226"></a>00226
 239 <a name="l00227"></a>00227
 240 <a name="l00228"></a>00228 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
 241 <a name="l00229"></a>00229 <span class="preprocessor"></span>
 242 <a name="l00230"></a>00230     <span class="comment">/* xc&#39; = (xa-xb+xc-xd)* co2 + (ya-yb+yc-yd)* (si2) */</span>
 243 <a name="l00231"></a>00231     out1 = __SMUAD(C2, R) &gt;&gt; 16u;
 244 <a name="l00232"></a>00232     <span class="comment">/* yc&#39; = (ya-yb+yc-yd)* co2 - (xa-xb+xc-xd)* (si2) */</span>
 245 <a name="l00233"></a>00233     out2 = __SMUSDX(C2, R);
 246 <a name="l00234"></a>00234
 247 <a name="l00235"></a>00235 <span class="preprocessor">#else</span>
 248 <a name="l00236"></a>00236 <span class="preprocessor"></span>
 249 <a name="l00237"></a>00237     <span class="comment">/* xc&#39; = (ya-yb+yc-yd)* co2 - (xa-xb+xc-xd)* (si2) */</span>
 250 <a name="l00238"></a>00238     out1 = __SMUSDX(R, C2) &gt;&gt; 16u;
 251 <a name="l00239"></a>00239     <span class="comment">/* yc&#39; = (xa-xb+xc-xd)* co2 + (ya-yb+yc-yd)* (si2) */</span>
 252 <a name="l00240"></a>00240     out2 = __SMUAD(C2, R);
 253 <a name="l00241"></a>00241
 254 <a name="l00242"></a>00242 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
 255 <a name="l00243"></a>00243
 256 <a name="l00244"></a>00244     <span class="comment">/*  Reading i0+fftLen/4 */</span>
 257 <a name="l00245"></a>00245     <span class="comment">/* T = packed(yb, xb) */</span>
 258 <a name="l00246"></a>00246     T = pSrc[i1];
 259 <a name="l00247"></a>00247     in = ((int16_t) (T &amp; 0xFFFF)) &gt;&gt; 2;
 260 <a name="l00248"></a>00248     T = ((T &gt;&gt; 2) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
 261 <a name="l00249"></a>00249
 262 <a name="l00250"></a>00250     <span class="comment">/* writing the butterfly processed i0 + fftLen/4 sample */</span>
 263 <a name="l00251"></a>00251     <span class="comment">/* writing output(xc&#39;, yc&#39;) in little endian format */</span>
 264 <a name="l00252"></a>00252     pSrc[i1] = (<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a>) ((out2) &amp; 0xFFFF0000) | (out1 &amp; 0x0000FFFF);
 265 <a name="l00253"></a>00253
 266 <a name="l00254"></a>00254     <span class="comment">/*  Butterfly calculations */</span>
 267 <a name="l00255"></a>00255     <span class="comment">/* U = packed(yd, xd) */</span>
 268 <a name="l00256"></a>00256     U = pSrc[i3];
 269 <a name="l00257"></a>00257     in = ((int16_t) (U &amp; 0xFFFF)) &gt;&gt; 2;
 270 <a name="l00258"></a>00258     U = ((U &gt;&gt; 2) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
 271 <a name="l00259"></a>00259     <span class="comment">/* T = packed(yb-yd, xb-xd) */</span>
 272 <a name="l00260"></a>00260     T = __QSUB16(T, U);
 273 <a name="l00261"></a>00261
 274 <a name="l00262"></a>00262
 275 <a name="l00263"></a>00263 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
 276 <a name="l00264"></a>00264 <span class="preprocessor"></span>
 277 <a name="l00265"></a>00265     <span class="comment">/* R = packed((ya-yc) + (xb- xd) , (xa-xc) - (yb-yd)) */</span>
 278 <a name="l00266"></a>00266     R = __QASX(S, T);
 279 <a name="l00267"></a>00267     <span class="comment">/* S = packed((ya-yc) - (xb- xd),  (xa-xc) + (yb-yd)) */</span>
 280 <a name="l00268"></a>00268     S = __QSAX(S, T);
 281 <a name="l00269"></a>00269
 282 <a name="l00270"></a>00270 <span class="preprocessor">#else</span>
 283 <a name="l00271"></a>00271 <span class="preprocessor"></span>
 284 <a name="l00272"></a>00272     <span class="comment">/* R = packed((ya-yc) + (xb- xd) , (xa-xc) - (yb-yd)) */</span>
 285 <a name="l00273"></a>00273     R = __QSAX(S, T);
 286 <a name="l00274"></a>00274     <span class="comment">/* S = packed((ya-yc) - (xb- xd),  (xa-xc) + (yb-yd)) */</span>
 287 <a name="l00275"></a>00275     S = __QASX(S, T);
 288 <a name="l00276"></a>00276
 289 <a name="l00277"></a>00277 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
 290 <a name="l00278"></a>00278
 291 <a name="l00279"></a>00279     <span class="comment">/* co1 &amp; si1 are read from SIMD Coefficient pointer */</span>
 292 <a name="l00280"></a>00280     C1 = pCoeff[ic];
 293 <a name="l00281"></a>00281     <span class="comment">/*  Butterfly process for the i0+fftLen/2 sample */</span>
 294 <a name="l00282"></a>00282
 295 <a name="l00283"></a>00283 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
 296 <a name="l00284"></a>00284 <span class="preprocessor"></span>
 297 <a name="l00285"></a>00285     <span class="comment">/* xb&#39; = (xa+yb-xc-yd)* co1 + (ya-xb-yc+xd)* (si1) */</span>
 298 <a name="l00286"></a>00286     out1 = __SMUAD(C1, S) &gt;&gt; 16u;
 299 <a name="l00287"></a>00287     <span class="comment">/* yb&#39; = (ya-xb-yc+xd)* co1 - (xa+yb-xc-yd)* (si1) */</span>
 300 <a name="l00288"></a>00288     out2 = __SMUSDX(C1, S);
 301 <a name="l00289"></a>00289
 302 <a name="l00290"></a>00290 <span class="preprocessor">#else</span>
 303 <a name="l00291"></a>00291 <span class="preprocessor"></span>
 304 <a name="l00292"></a>00292     <span class="comment">/* xb&#39; = (ya-xb-yc+xd)* co1 - (xa+yb-xc-yd)* (si1) */</span>
 305 <a name="l00293"></a>00293     out1 = __SMUSDX(S, C1) &gt;&gt; 16u;
 306 <a name="l00294"></a>00294     <span class="comment">/* yb&#39; = (xa+yb-xc-yd)* co1 + (ya-xb-yc+xd)* (si1) */</span>
 307 <a name="l00295"></a>00295     out2 = __SMUAD(C1, S);
 308 <a name="l00296"></a>00296
 309 <a name="l00297"></a>00297 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
 310 <a name="l00298"></a>00298
 311 <a name="l00299"></a>00299     <span class="comment">/* writing output(xb&#39;, yb&#39;) in little endian format */</span>
 312 <a name="l00300"></a>00300     pSrc[i2] = ((out2) &amp; 0xFFFF0000) | ((out1) &amp; 0x0000FFFF);
 313 <a name="l00301"></a>00301
 314 <a name="l00302"></a>00302
 315 <a name="l00303"></a>00303     <span class="comment">/* co3 &amp; si3 are read from SIMD Coefficient pointer */</span>
 316 <a name="l00304"></a>00304     C3 = pCoeff[3u * ic];
 317 <a name="l00305"></a>00305     <span class="comment">/*  Butterfly process for the i0+3fftLen/4 sample */</span>
 318 <a name="l00306"></a>00306
 319 <a name="l00307"></a>00307 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
 320 <a name="l00308"></a>00308 <span class="preprocessor"></span>
 321 <a name="l00309"></a>00309     <span class="comment">/* xd&#39; = (xa-yb-xc+yd)* co3 + (ya+xb-yc-xd)* (si3) */</span>
 322 <a name="l00310"></a>00310     out1 = __SMUAD(C3, R) &gt;&gt; 16u;
 323 <a name="l00311"></a>00311     <span class="comment">/* yd&#39; = (ya+xb-yc-xd)* co3 - (xa-yb-xc+yd)* (si3) */</span>
 324 <a name="l00312"></a>00312     out2 = __SMUSDX(C3, R);
 325 <a name="l00313"></a>00313
 326 <a name="l00314"></a>00314 <span class="preprocessor">#else</span>
 327 <a name="l00315"></a>00315 <span class="preprocessor"></span>
 328 <a name="l00316"></a>00316     <span class="comment">/* xd&#39; = (ya+xb-yc-xd)* co3 - (xa-yb-xc+yd)* (si3) */</span>
 329 <a name="l00317"></a>00317     out1 = __SMUSDX(R, C3) &gt;&gt; 16u;
 330 <a name="l00318"></a>00318     <span class="comment">/* yd&#39; = (xa-yb-xc+yd)* co3 + (ya+xb-yc-xd)* (si3) */</span>
 331 <a name="l00319"></a>00319     out2 = __SMUAD(C3, R);
 332 <a name="l00320"></a>00320
 333 <a name="l00321"></a>00321 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
 334 <a name="l00322"></a>00322
 335 <a name="l00323"></a>00323     <span class="comment">/* writing output(xd&#39;, yd&#39;) in little endian format */</span>
 336 <a name="l00324"></a>00324     pSrc[i3] = ((out2) &amp; 0xFFFF0000) | (out1 &amp; 0x0000FFFF);
 337 <a name="l00325"></a>00325
 338 <a name="l00326"></a>00326     <span class="comment">/*  Twiddle coefficients index modifier */</span>
 339 <a name="l00327"></a>00327     ic = ic + twidCoefModifier;
 340 <a name="l00328"></a>00328
 341 <a name="l00329"></a>00329     <span class="comment">/*  Updating input index */</span>
 342 <a name="l00330"></a>00330     i0 = i0 + 1u;
 343 <a name="l00331"></a>00331
 344 <a name="l00332"></a>00332   } <span class="keywordflow">while</span>(--j);
 345 <a name="l00333"></a>00333   <span class="comment">/* data is in 4.11(q11) format */</span>
 346 <a name="l00334"></a>00334
 347 <a name="l00335"></a>00335   <span class="comment">/* end of first stage process */</span>
 348 <a name="l00336"></a>00336
 349 <a name="l00337"></a>00337
 350 <a name="l00338"></a>00338   <span class="comment">/* start of middle stage process */</span>
 351 <a name="l00339"></a>00339
 352 <a name="l00340"></a>00340   <span class="comment">/*  Twiddle coefficients index modifier */</span>
 353 <a name="l00341"></a>00341   twidCoefModifier &lt;&lt;= 2u;
 354 <a name="l00342"></a>00342
 355 <a name="l00343"></a>00343   <span class="comment">/*  Calculation of Middle stage */</span>
 356 <a name="l00344"></a>00344   <span class="keywordflow">for</span> (k = fftLen / 4u; k &gt; 4u; k &gt;&gt;= 2u)
 357 <a name="l00345"></a>00345   {
 358 <a name="l00346"></a>00346     <span class="comment">/*  Initializations for the middle stage */</span>
 359 <a name="l00347"></a>00347     n1 = n2;
 360 <a name="l00348"></a>00348     n2 &gt;&gt;= 2u;
 361 <a name="l00349"></a>00349     ic = 0u;
 362 <a name="l00350"></a>00350
 363 <a name="l00351"></a>00351     <span class="keywordflow">for</span> (j = 0u; j &lt;= (n2 - 1u); j++)
 364 <a name="l00352"></a>00352     {
 365 <a name="l00353"></a>00353       <span class="comment">/*  index calculation for the coefficients */</span>
 366 <a name="l00354"></a>00354       C1 = pCoeff[ic];
 367 <a name="l00355"></a>00355       C2 = pCoeff[2u * ic];
 368 <a name="l00356"></a>00356       C3 = pCoeff[3u * ic];
 369 <a name="l00357"></a>00357
 370 <a name="l00358"></a>00358       <span class="comment">/*  Twiddle coefficients index modifier */</span>
 371 <a name="l00359"></a>00359       ic = ic + twidCoefModifier;
 372 <a name="l00360"></a>00360
 373 <a name="l00361"></a>00361       <span class="comment">/*  Butterfly implementation */</span>
 374 <a name="l00362"></a>00362       <span class="keywordflow">for</span> (i0 = j; i0 &lt; fftLen; i0 += n1)
 375 <a name="l00363"></a>00363       {
 376 <a name="l00364"></a>00364         <span class="comment">/*  index calculation for the input as, */</span>
 377 <a name="l00365"></a>00365         <span class="comment">/*  pSrc[i0 + 0], pSrc[i0 + fftLen/4], pSrc[i0 + fftLen/2], pSrc[i0 + 3fftLen/4] */</span>
 378 <a name="l00366"></a>00366         i1 = i0 + n2;
 379 <a name="l00367"></a>00367         i2 = i1 + n2;
 380 <a name="l00368"></a>00368         i3 = i2 + n2;
 381 <a name="l00369"></a>00369
 382 <a name="l00370"></a>00370         <span class="comment">/*  Reading i0, i0+fftLen/2 inputs */</span>
 383 <a name="l00371"></a>00371         <span class="comment">/* Read ya (real), xa(imag) input */</span>
 384 <a name="l00372"></a>00372         T = pSrc[i0];
 385 <a name="l00373"></a>00373
 386 <a name="l00374"></a>00374         <span class="comment">/* Read yc (real), xc(imag) input */</span>
 387 <a name="l00375"></a>00375         S = pSrc[i2];
 388 <a name="l00376"></a>00376
 389 <a name="l00377"></a>00377         <span class="comment">/* R = packed( (ya + yc), (xa + xc)) */</span>
 390 <a name="l00378"></a>00378         R = __QADD16(T, S);
 391 <a name="l00379"></a>00379
 392 <a name="l00380"></a>00380         <span class="comment">/* S = packed((ya - yc), (xa - xc)) */</span>
 393 <a name="l00381"></a>00381         S = __QSUB16(T, S);
 394 <a name="l00382"></a>00382
 395 <a name="l00383"></a>00383         <span class="comment">/*  Reading i0+fftLen/4 , i0+3fftLen/4 inputs */</span>
 396 <a name="l00384"></a>00384         <span class="comment">/* Read yb (real), xb(imag) input */</span>
 397 <a name="l00385"></a>00385         T = pSrc[i1];
 398 <a name="l00386"></a>00386
 399 <a name="l00387"></a>00387         <span class="comment">/* Read yd (real), xd(imag) input */</span>
 400 <a name="l00388"></a>00388         U = pSrc[i3];
 401 <a name="l00389"></a>00389
 402 <a name="l00390"></a>00390
 403 <a name="l00391"></a>00391         <span class="comment">/* T = packed( (yb + yd), (xb + xd)) */</span>
 404 <a name="l00392"></a>00392         T = __QADD16(T, U);
 405 <a name="l00393"></a>00393
 406 <a name="l00394"></a>00394
 407 <a name="l00395"></a>00395         <span class="comment">/*  writing the butterfly processed i0 sample */</span>
 408 <a name="l00396"></a>00396
 409 <a name="l00397"></a>00397         <span class="comment">/* xa&#39; = xa + xb + xc + xd */</span>
 410 <a name="l00398"></a>00398         <span class="comment">/* ya&#39; = ya + yb + yc + yd */</span>
 411 <a name="l00399"></a>00399         out1 = __SHADD16(R, T);
 412 <a name="l00400"></a>00400         in = ((int16_t) (out1 &amp; 0xFFFF)) &gt;&gt; 1;
 413 <a name="l00401"></a>00401         out1 = ((out1 &gt;&gt; 1) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
 414 <a name="l00402"></a>00402         pSrc[i0] = out1;
 415 <a name="l00403"></a>00403
 416 <a name="l00404"></a>00404         <span class="comment">/* R = packed( (ya + yc) - (yb + yd), (xa + xc) - (xb + xd)) */</span>
 417 <a name="l00405"></a>00405         R = __SHSUB16(R, T);
 418 <a name="l00406"></a>00406
 419 <a name="l00407"></a>00407
 420 <a name="l00408"></a>00408 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
 421 <a name="l00409"></a>00409 <span class="preprocessor"></span>
 422 <a name="l00410"></a>00410         <span class="comment">/* (ya-yb+yc-yd)* (si2) + (xa-xb+xc-xd)* co2 */</span>
 423 <a name="l00411"></a>00411         out1 = __SMUAD(C2, R) &gt;&gt; 16u;
 424 <a name="l00412"></a>00412
 425 <a name="l00413"></a>00413         <span class="comment">/* (ya-yb+yc-yd)* co2 - (xa-xb+xc-xd)* (si2) */</span>
 426 <a name="l00414"></a>00414         out2 = __SMUSDX(C2, R);
 427 <a name="l00415"></a>00415
 428 <a name="l00416"></a>00416 <span class="preprocessor">#else</span>
 429 <a name="l00417"></a>00417 <span class="preprocessor"></span>
 430 <a name="l00418"></a>00418         <span class="comment">/* (ya-yb+yc-yd)* co2 - (xa-xb+xc-xd)* (si2) */</span>
 431 <a name="l00419"></a>00419         out1 = __SMUSDX(R, C2) &gt;&gt; 16u;
 432 <a name="l00420"></a>00420
 433 <a name="l00421"></a>00421         <span class="comment">/* (ya-yb+yc-yd)* (si2) + (xa-xb+xc-xd)* co2 */</span>
 434 <a name="l00422"></a>00422         out2 = __SMUAD(C2, R);
 435 <a name="l00423"></a>00423
 436 <a name="l00424"></a>00424 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
 437 <a name="l00425"></a>00425
 438 <a name="l00426"></a>00426         <span class="comment">/*  Reading i0+3fftLen/4 */</span>
 439 <a name="l00427"></a>00427         <span class="comment">/* Read yb (real), xb(imag) input */</span>
 440 <a name="l00428"></a>00428         T = pSrc[i1];
 441 <a name="l00429"></a>00429
 442 <a name="l00430"></a>00430         <span class="comment">/*  writing the butterfly processed i0 + fftLen/4 sample */</span>
 443 <a name="l00431"></a>00431         <span class="comment">/* xc&#39; = (xa-xb+xc-xd)* co2 + (ya-yb+yc-yd)* (si2) */</span>
 444 <a name="l00432"></a>00432         <span class="comment">/* yc&#39; = (ya-yb+yc-yd)* co2 - (xa-xb+xc-xd)* (si2) */</span>
 445 <a name="l00433"></a>00433         pSrc[i1] = ((out2) &amp; 0xFFFF0000) | (out1 &amp; 0x0000FFFF);
 446 <a name="l00434"></a>00434
 447 <a name="l00435"></a>00435         <span class="comment">/*  Butterfly calculations */</span>
 448 <a name="l00436"></a>00436
 449 <a name="l00437"></a>00437         <span class="comment">/* Read yd (real), xd(imag) input */</span>
 450 <a name="l00438"></a>00438         U = pSrc[i3];
 451 <a name="l00439"></a>00439
 452 <a name="l00440"></a>00440         <span class="comment">/* T = packed(yb-yd, xb-xd) */</span>
 453 <a name="l00441"></a>00441         T = __QSUB16(T, U);
 454 <a name="l00442"></a>00442
 455 <a name="l00443"></a>00443
 456 <a name="l00444"></a>00444 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
 457 <a name="l00445"></a>00445 <span class="preprocessor"></span>
 458 <a name="l00446"></a>00446         <span class="comment">/* R = packed((ya-yc) + (xb- xd) , (xa-xc) - (yb-yd)) */</span>
 459 <a name="l00447"></a>00447         R = __SHASX(S, T);
 460 <a name="l00448"></a>00448
 461 <a name="l00449"></a>00449         <span class="comment">/* S = packed((ya-yc) - (xb- xd),  (xa-xc) + (yb-yd)) */</span>
 462 <a name="l00450"></a>00450         S = __SHSAX(S, T);
 463 <a name="l00451"></a>00451
 464 <a name="l00452"></a>00452
 465 <a name="l00453"></a>00453         <span class="comment">/*  Butterfly process for the i0+fftLen/2 sample */</span>
 466 <a name="l00454"></a>00454         out1 = __SMUAD(C1, S) &gt;&gt; 16u;
 467 <a name="l00455"></a>00455         out2 = __SMUSDX(C1, S);
 468 <a name="l00456"></a>00456
 469 <a name="l00457"></a>00457 <span class="preprocessor">#else</span>
 470 <a name="l00458"></a>00458 <span class="preprocessor"></span>
 471 <a name="l00459"></a>00459         <span class="comment">/* R = packed((ya-yc) + (xb- xd) , (xa-xc) - (yb-yd)) */</span>
 472 <a name="l00460"></a>00460         R = __SHSAX(S, T);
 473 <a name="l00461"></a>00461
 474 <a name="l00462"></a>00462         <span class="comment">/* S = packed((ya-yc) - (xb- xd),  (xa-xc) + (yb-yd)) */</span>
 475 <a name="l00463"></a>00463         S = __SHASX(S, T);
 476 <a name="l00464"></a>00464
 477 <a name="l00465"></a>00465
 478 <a name="l00466"></a>00466         <span class="comment">/*  Butterfly process for the i0+fftLen/2 sample */</span>
 479 <a name="l00467"></a>00467         out1 = __SMUSDX(S, C1) &gt;&gt; 16u;
 480 <a name="l00468"></a>00468         out2 = __SMUAD(C1, S);
 481 <a name="l00469"></a>00469
 482 <a name="l00470"></a>00470 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
 483 <a name="l00471"></a>00471
 484 <a name="l00472"></a>00472         <span class="comment">/* xb&#39; = (xa+yb-xc-yd)* co1 + (ya-xb-yc+xd)* (si1) */</span>
 485 <a name="l00473"></a>00473         <span class="comment">/* yb&#39; = (ya-xb-yc+xd)* co1 - (xa+yb-xc-yd)* (si1) */</span>
 486 <a name="l00474"></a>00474         pSrc[i2] = ((out2) &amp; 0xFFFF0000) | (out1 &amp; 0x0000FFFF);
 487 <a name="l00475"></a>00475
 488 <a name="l00476"></a>00476         <span class="comment">/*  Butterfly process for the i0+3fftLen/4 sample */</span>
 489 <a name="l00477"></a>00477
 490 <a name="l00478"></a>00478 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
 491 <a name="l00479"></a>00479 <span class="preprocessor"></span>
 492 <a name="l00480"></a>00480         out1 = __SMUAD(C3, R) &gt;&gt; 16u;
 493 <a name="l00481"></a>00481         out2 = __SMUSDX(C3, R);
 494 <a name="l00482"></a>00482
 495 <a name="l00483"></a>00483 <span class="preprocessor">#else</span>
 496 <a name="l00484"></a>00484 <span class="preprocessor"></span>
 497 <a name="l00485"></a>00485         out1 = __SMUSDX(R, C3) &gt;&gt; 16u;
 498 <a name="l00486"></a>00486         out2 = __SMUAD(C3, R);
 499 <a name="l00487"></a>00487
 500 <a name="l00488"></a>00488 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
 501 <a name="l00489"></a>00489
 502 <a name="l00490"></a>00490         <span class="comment">/* xd&#39; = (xa-yb-xc+yd)* co3 + (ya+xb-yc-xd)* (si3) */</span>
 503 <a name="l00491"></a>00491         <span class="comment">/* yd&#39; = (ya+xb-yc-xd)* co3 - (xa-yb-xc+yd)* (si3) */</span>
 504 <a name="l00492"></a>00492         pSrc[i3] = ((out2) &amp; 0xFFFF0000) | (out1 &amp; 0x0000FFFF);
 505 <a name="l00493"></a>00493       }
 506 <a name="l00494"></a>00494     }
 507 <a name="l00495"></a>00495     <span class="comment">/*  Twiddle coefficients index modifier */</span>
 508 <a name="l00496"></a>00496     twidCoefModifier &lt;&lt;= 2u;
 509 <a name="l00497"></a>00497   }
 510 <a name="l00498"></a>00498   <span class="comment">/* end of middle stage process */</span>
 511 <a name="l00499"></a>00499
 512 <a name="l00500"></a>00500
 513 <a name="l00501"></a>00501   <span class="comment">/* data is in 10.6(q6) format for the 1024 point */</span>
 514 <a name="l00502"></a>00502   <span class="comment">/* data is in 8.8(q8) format for the 256 point */</span>
 515 <a name="l00503"></a>00503   <span class="comment">/* data is in 6.10(q10) format for the 64 point */</span>
 516 <a name="l00504"></a>00504   <span class="comment">/* data is in 4.12(q12) format for the 16 point */</span>
 517 <a name="l00505"></a>00505
 518 <a name="l00506"></a>00506   <span class="comment">/*  Initializations for the last stage */</span>
 519 <a name="l00507"></a>00507   n1 = n2;
 520 <a name="l00508"></a>00508   n2 &gt;&gt;= 2u;
 521 <a name="l00509"></a>00509
 522 <a name="l00510"></a>00510   <span class="comment">/* start of last stage process */</span>
 523 <a name="l00511"></a>00511
 524 <a name="l00512"></a>00512   <span class="comment">/*  Butterfly implementation */</span>
 525 <a name="l00513"></a>00513   <span class="keywordflow">for</span> (i0 = 0u; i0 &lt;= (fftLen - n1); i0 += n1)
 526 <a name="l00514"></a>00514   {
 527 <a name="l00515"></a>00515     <span class="comment">/*  index calculation for the input as, */</span>
 528 <a name="l00516"></a>00516     <span class="comment">/*  pSrc[i0 + 0], pSrc[i0 + fftLen/4], pSrc[i0 + fftLen/2], pSrc[i0 + 3fftLen/4] */</span>
 529 <a name="l00517"></a>00517     i1 = i0 + n2;
 530 <a name="l00518"></a>00518     i2 = i1 + n2;
 531 <a name="l00519"></a>00519     i3 = i2 + n2;
 532 <a name="l00520"></a>00520
 533 <a name="l00521"></a>00521     <span class="comment">/*  Reading i0, i0+fftLen/2 inputs */</span>
 534 <a name="l00522"></a>00522     <span class="comment">/* Read ya (real), xa(imag) input */</span>
 535 <a name="l00523"></a>00523     T = pSrc[i0];
 536 <a name="l00524"></a>00524     <span class="comment">/* Read yc (real), xc(imag) input */</span>
 537 <a name="l00525"></a>00525     S = pSrc[i2];
 538 <a name="l00526"></a>00526
 539 <a name="l00527"></a>00527     <span class="comment">/* R = packed((ya + yc), (xa + xc)) */</span>
 540 <a name="l00528"></a>00528     R = __QADD16(T, S);
 541 <a name="l00529"></a>00529     <span class="comment">/* S = packed((ya - yc), (xa - xc)) */</span>
 542 <a name="l00530"></a>00530     S = __QSUB16(T, S);
 543 <a name="l00531"></a>00531
 544 <a name="l00532"></a>00532     <span class="comment">/*  Reading i0+fftLen/4 , i0+3fftLen/4 inputs */</span>
 545 <a name="l00533"></a>00533     <span class="comment">/* Read yb (real), xb(imag) input */</span>
 546 <a name="l00534"></a>00534     T = pSrc[i1];
 547 <a name="l00535"></a>00535     <span class="comment">/* Read yd (real), xd(imag) input */</span>
 548 <a name="l00536"></a>00536     U = pSrc[i3];
 549 <a name="l00537"></a>00537
 550 <a name="l00538"></a>00538     <span class="comment">/* T = packed((yb + yd), (xb + xd)) */</span>
 551 <a name="l00539"></a>00539     T = __QADD16(T, U);
 552 <a name="l00540"></a>00540
 553 <a name="l00541"></a>00541     <span class="comment">/*  writing the butterfly processed i0 sample */</span>
 554 <a name="l00542"></a>00542     <span class="comment">/* xa&#39; = xa + xb + xc + xd */</span>
 555 <a name="l00543"></a>00543     <span class="comment">/* ya&#39; = ya + yb + yc + yd */</span>
 556 <a name="l00544"></a>00544     pSrc[i0] = __SHADD16(R, T);
 557 <a name="l00545"></a>00545
 558 <a name="l00546"></a>00546     <span class="comment">/* R = packed((ya + yc) - (yb + yd), (xa + xc) - (xb + xd)) */</span>
 559 <a name="l00547"></a>00547     R = __SHSUB16(R, T);
 560 <a name="l00548"></a>00548
 561 <a name="l00549"></a>00549     <span class="comment">/* Read yb (real), xb(imag) input */</span>
 562 <a name="l00550"></a>00550     T = pSrc[i1];
 563 <a name="l00551"></a>00551
 564 <a name="l00552"></a>00552     <span class="comment">/*  writing the butterfly processed i0 + fftLen/4 sample */</span>
 565 <a name="l00553"></a>00553     <span class="comment">/* xc&#39; = (xa-xb+xc-xd) */</span>
 566 <a name="l00554"></a>00554     <span class="comment">/* yc&#39; = (ya-yb+yc-yd) */</span>
 567 <a name="l00555"></a>00555     pSrc[i1] = R;
 568 <a name="l00556"></a>00556
 569 <a name="l00557"></a>00557     <span class="comment">/* Read yd (real), xd(imag) input */</span>
 570 <a name="l00558"></a>00558     U = pSrc[i3];
 571 <a name="l00559"></a>00559     <span class="comment">/* T = packed( (yb - yd), (xb - xd))  */</span>
 572 <a name="l00560"></a>00560     T = __QSUB16(T, U);
 573 <a name="l00561"></a>00561
 574 <a name="l00562"></a>00562
 575 <a name="l00563"></a>00563 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
 576 <a name="l00564"></a>00564 <span class="preprocessor"></span>
 577 <a name="l00565"></a>00565     <span class="comment">/*  writing the butterfly processed i0 + fftLen/2 sample */</span>
 578 <a name="l00566"></a>00566     <span class="comment">/* xb&#39; = (xa+yb-xc-yd) */</span>
 579 <a name="l00567"></a>00567     <span class="comment">/* yb&#39; = (ya-xb-yc+xd) */</span>
 580 <a name="l00568"></a>00568     pSrc[i2] = __SHSAX(S, T);
 581 <a name="l00569"></a>00569
 582 <a name="l00570"></a>00570     <span class="comment">/*  writing the butterfly processed i0 + 3fftLen/4 sample */</span>
 583 <a name="l00571"></a>00571     <span class="comment">/* xd&#39; = (xa-yb-xc+yd) */</span>
 584 <a name="l00572"></a>00572     <span class="comment">/* yd&#39; = (ya+xb-yc-xd) */</span>
 585 <a name="l00573"></a>00573     pSrc[i3] = __SHASX(S, T);
 586 <a name="l00574"></a>00574
 587 <a name="l00575"></a>00575 <span class="preprocessor">#else</span>
 588 <a name="l00576"></a>00576 <span class="preprocessor"></span>
 589 <a name="l00577"></a>00577     <span class="comment">/*  writing the butterfly processed i0 + fftLen/2 sample */</span>
 590 <a name="l00578"></a>00578     <span class="comment">/* xb&#39; = (xa+yb-xc-yd) */</span>
 591 <a name="l00579"></a>00579     <span class="comment">/* yb&#39; = (ya-xb-yc+xd) */</span>
 592 <a name="l00580"></a>00580     pSrc[i2] = __SHASX(S, T);
 593 <a name="l00581"></a>00581
 594 <a name="l00582"></a>00582     <span class="comment">/*  writing the butterfly processed i0 + 3fftLen/4 sample */</span>
 595 <a name="l00583"></a>00583     <span class="comment">/* xd&#39; = (xa-yb-xc+yd) */</span>
 596 <a name="l00584"></a>00584     <span class="comment">/* yd&#39; = (ya+xb-yc-xd) */</span>
 597 <a name="l00585"></a>00585     pSrc[i3] = __SHSAX(S, T);
 598 <a name="l00586"></a>00586
 599 <a name="l00587"></a>00587 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
 600 <a name="l00588"></a>00588
 601 <a name="l00589"></a>00589   }
 602 <a name="l00590"></a>00590
 603 <a name="l00591"></a>00591   <span class="comment">/* end of last stage process */</span>
 604 <a name="l00592"></a>00592
 605 <a name="l00593"></a>00593   <span class="comment">/* output is in 11.5(q5) format for the 1024 point */</span>
 606 <a name="l00594"></a>00594   <span class="comment">/* output is in 9.7(q7) format for the 256 point   */</span>
 607 <a name="l00595"></a>00595   <span class="comment">/* output is in 7.9(q9) format for the 64 point  */</span>
 608 <a name="l00596"></a>00596   <span class="comment">/* output is in 5.11(q11) format for the 16 point  */</span>
 609 <a name="l00597"></a>00597
 610 <a name="l00598"></a>00598
 611 <a name="l00599"></a>00599 <span class="preprocessor">#else</span>
 612 <a name="l00600"></a>00600 <span class="preprocessor"></span>
 613 <a name="l00601"></a>00601   <span class="comment">/* Run the below code for Cortex-M0 */</span>
 614 <a name="l00602"></a>00602
 615 <a name="l00603"></a>00603   <a class="code" href="arm__math_8h.html#ab5a8fb21a5b3b983d5f54f31614052ea" title="16-bit fractional data type in 1.15 format.">q15_t</a> R0, R1, S0, S1, T0, T1, U0, U1;
 616 <a name="l00604"></a>00604   <a class="code" href="arm__math_8h.html#ab5a8fb21a5b3b983d5f54f31614052ea" title="16-bit fractional data type in 1.15 format.">q15_t</a> Co1, Si1, Co2, Si2, Co3, Si3, out1, out2;
 617 <a name="l00605"></a>00605   uint32_t n1, n2, ic, i0, i1, i2, i3, j, k;
 618 <a name="l00606"></a>00606
 619 <a name="l00607"></a>00607   <span class="comment">/* Total process is divided into three stages */</span>
 620 <a name="l00608"></a>00608
 621 <a name="l00609"></a>00609   <span class="comment">/* process first stage, middle stages, &amp; last stage */</span>
 622 <a name="l00610"></a>00610
 623 <a name="l00611"></a>00611   <span class="comment">/*  Initializations for the first stage */</span>
 624 <a name="l00612"></a>00612   n2 = fftLen;
 625 <a name="l00613"></a>00613   n1 = n2;
 626 <a name="l00614"></a>00614
 627 <a name="l00615"></a>00615   <span class="comment">/* n2 = fftLen/4 */</span>
 628 <a name="l00616"></a>00616   n2 &gt;&gt;= 2u;
 629 <a name="l00617"></a>00617
 630 <a name="l00618"></a>00618   <span class="comment">/* Index for twiddle coefficient */</span>
 631 <a name="l00619"></a>00619   ic = 0u;
 632 <a name="l00620"></a>00620
 633 <a name="l00621"></a>00621   <span class="comment">/* Index for input read and output write */</span>
 634 <a name="l00622"></a>00622   i0 = 0u;
 635 <a name="l00623"></a>00623   j = n2;
 636 <a name="l00624"></a>00624
 637 <a name="l00625"></a>00625   <span class="comment">/* Input is in 1.15(q15) format */</span>
 638 <a name="l00626"></a>00626
 639 <a name="l00627"></a>00627   <span class="comment">/*  start of first stage process */</span>
 640 <a name="l00628"></a>00628   <span class="keywordflow">do</span>
 641 <a name="l00629"></a>00629   {
 642 <a name="l00630"></a>00630     <span class="comment">/*  Butterfly implementation */</span>
 643 <a name="l00631"></a>00631
 644 <a name="l00632"></a>00632     <span class="comment">/*  index calculation for the input as, */</span>
 645 <a name="l00633"></a>00633     <span class="comment">/*  pSrc16[i0 + 0], pSrc16[i0 + fftLen/4], pSrc16[i0 + fftLen/2], pSrc16[i0 + 3fftLen/4] */</span>
 646 <a name="l00634"></a>00634     i1 = i0 + n2;
 647 <a name="l00635"></a>00635     i2 = i1 + n2;
 648 <a name="l00636"></a>00636     i3 = i2 + n2;
 649 <a name="l00637"></a>00637
 650 <a name="l00638"></a>00638     <span class="comment">/*  Reading i0, i0+fftLen/2 inputs */</span>
 651 <a name="l00639"></a>00639
 652 <a name="l00640"></a>00640     <span class="comment">/* input is down scale by 4 to avoid overflow */</span>
 653 <a name="l00641"></a>00641     <span class="comment">/* Read ya (real), xa(imag) input */</span>
 654 <a name="l00642"></a>00642     T0 = pSrc16[i0 * 2u] &gt;&gt; 2u;
 655 <a name="l00643"></a>00643     T1 = pSrc16[(i0 * 2u) + 1u] &gt;&gt; 2u;
 656 <a name="l00644"></a>00644
 657 <a name="l00645"></a>00645     <span class="comment">/* input is down scale by 4 to avoid overflow */</span>
 658 <a name="l00646"></a>00646     <span class="comment">/* Read yc (real), xc(imag) input */</span>
 659 <a name="l00647"></a>00647     S0 = pSrc16[i2 * 2u] &gt;&gt; 2u;
 660 <a name="l00648"></a>00648     S1 = pSrc16[(i2 * 2u) + 1u] &gt;&gt; 2u;
 661 <a name="l00649"></a>00649
 662 <a name="l00650"></a>00650     <span class="comment">/* R0 = (ya + yc) */</span>
 663 <a name="l00651"></a>00651     R0 = __SSAT(T0 + S0, 16u);
 664 <a name="l00652"></a>00652     <span class="comment">/* R1 = (xa + xc) */</span>
 665 <a name="l00653"></a>00653     R1 = __SSAT(T1 + S1, 16u);
 666 <a name="l00654"></a>00654
 667 <a name="l00655"></a>00655     <span class="comment">/* S0 = (ya - yc) */</span>
 668 <a name="l00656"></a>00656     S0 = __SSAT(T0 - S0, 16);
 669 <a name="l00657"></a>00657     <span class="comment">/* S1 = (xa - xc) */</span>
 670 <a name="l00658"></a>00658     S1 = __SSAT(T1 - S1, 16);
 671 <a name="l00659"></a>00659
 672 <a name="l00660"></a>00660     <span class="comment">/*  Reading i0+fftLen/4 , i0+3fftLen/4 inputs */</span>
 673 <a name="l00661"></a>00661     <span class="comment">/* input is down scale by 4 to avoid overflow */</span>
 674 <a name="l00662"></a>00662     <span class="comment">/* Read yb (real), xb(imag) input */</span>
 675 <a name="l00663"></a>00663     T0 = pSrc16[i1 * 2u] &gt;&gt; 2u;
 676 <a name="l00664"></a>00664     T1 = pSrc16[(i1 * 2u) + 1u] &gt;&gt; 2u;
 677 <a name="l00665"></a>00665
 678 <a name="l00666"></a>00666     <span class="comment">/* input is down scale by 4 to avoid overflow */</span>
 679 <a name="l00667"></a>00667     <span class="comment">/* Read yd (real), xd(imag) input */</span>
 680 <a name="l00668"></a>00668     U0 = pSrc16[i3 * 2u] &gt;&gt; 2u;
 681 <a name="l00669"></a>00669     U1 = pSrc16[(i3 * 2u) + 1] &gt;&gt; 2u;
 682 <a name="l00670"></a>00670
 683 <a name="l00671"></a>00671     <span class="comment">/* T0 = (yb + yd) */</span>
 684 <a name="l00672"></a>00672     T0 = __SSAT(T0 + U0, 16u);
 685 <a name="l00673"></a>00673     <span class="comment">/* T1 = (xb + xd) */</span>
 686 <a name="l00674"></a>00674     T1 = __SSAT(T1 + U1, 16u);
 687 <a name="l00675"></a>00675
 688 <a name="l00676"></a>00676     <span class="comment">/*  writing the butterfly processed i0 sample */</span>
 689 <a name="l00677"></a>00677     <span class="comment">/* ya&#39; = ya + yb + yc + yd */</span>
 690 <a name="l00678"></a>00678     <span class="comment">/* xa&#39; = xa + xb + xc + xd */</span>
 691 <a name="l00679"></a>00679     pSrc16[i0 * 2u] = (R0 &gt;&gt; 1u) + (T0 &gt;&gt; 1u);
 692 <a name="l00680"></a>00680     pSrc16[(i0 * 2u) + 1u] = (R1 &gt;&gt; 1u) + (T1 &gt;&gt; 1u);
 693 <a name="l00681"></a>00681
 694 <a name="l00682"></a>00682     <span class="comment">/* R0 = (ya + yc) - (yb + yd) */</span>
 695 <a name="l00683"></a>00683     <span class="comment">/* R1 = (xa + xc) - (xb + xd) */</span>
 696 <a name="l00684"></a>00684     R0 = __SSAT(R0 - T0, 16u);
 697 <a name="l00685"></a>00685     R1 = __SSAT(R1 - T1, 16u);
 698 <a name="l00686"></a>00686
 699 <a name="l00687"></a>00687     <span class="comment">/* co2 &amp; si2 are read from Coefficient pointer */</span>
 700 <a name="l00688"></a>00688     Co2 = pCoef16[2u * ic * 2u];
 701 <a name="l00689"></a>00689     Si2 = pCoef16[(2u * ic * 2u) + 1];
 702 <a name="l00690"></a>00690
 703 <a name="l00691"></a>00691     <span class="comment">/* xc&#39; = (xa-xb+xc-xd)* co2 + (ya-yb+yc-yd)* (si2) */</span>
 704 <a name="l00692"></a>00692     out1 = (short) ((Co2 * R0 + Si2 * R1) &gt;&gt; 16u);
 705 <a name="l00693"></a>00693     <span class="comment">/* yc&#39; = (ya-yb+yc-yd)* co2 - (xa-xb+xc-xd)* (si2) */</span>
 706 <a name="l00694"></a>00694     out2 = (short) ((-Si2 * R0 + Co2 * R1) &gt;&gt; 16u);
 707 <a name="l00695"></a>00695
 708 <a name="l00696"></a>00696     <span class="comment">/*  Reading i0+fftLen/4 */</span>
 709 <a name="l00697"></a>00697     <span class="comment">/* input is down scale by 4 to avoid overflow */</span>
 710 <a name="l00698"></a>00698     <span class="comment">/* T0 = yb, T1 =  xb */</span>
 711 <a name="l00699"></a>00699     T0 = pSrc16[i1 * 2u] &gt;&gt; 2;
 712 <a name="l00700"></a>00700     T1 = pSrc16[(i1 * 2u) + 1] &gt;&gt; 2;
 713 <a name="l00701"></a>00701
 714 <a name="l00702"></a>00702     <span class="comment">/* writing the butterfly processed i0 + fftLen/4 sample */</span>
 715 <a name="l00703"></a>00703     <span class="comment">/* writing output(xc&#39;, yc&#39;) in little endian format */</span>
 716 <a name="l00704"></a>00704     pSrc16[i1 * 2u] = out1;
 717 <a name="l00705"></a>00705     pSrc16[(i1 * 2u) + 1] = out2;
 718 <a name="l00706"></a>00706
 719 <a name="l00707"></a>00707     <span class="comment">/*  Butterfly calculations */</span>
 720 <a name="l00708"></a>00708     <span class="comment">/* input is down scale by 4 to avoid overflow */</span>
 721 <a name="l00709"></a>00709     <span class="comment">/* U0 = yd, U1 = xd */</span>
 722 <a name="l00710"></a>00710     U0 = pSrc16[i3 * 2u] &gt;&gt; 2;
 723 <a name="l00711"></a>00711     U1 = pSrc16[(i3 * 2u) + 1] &gt;&gt; 2;
 724 <a name="l00712"></a>00712     <span class="comment">/* T0 = yb-yd */</span>
 725 <a name="l00713"></a>00713     T0 = __SSAT(T0 - U0, 16);
 726 <a name="l00714"></a>00714     <span class="comment">/* T1 = xb-xd */</span>
 727 <a name="l00715"></a>00715     T1 = __SSAT(T1 - U1, 16);
 728 <a name="l00716"></a>00716
 729 <a name="l00717"></a>00717     <span class="comment">/* R1 = (ya-yc) + (xb- xd),  R0 = (xa-xc) - (yb-yd)) */</span>
 730 <a name="l00718"></a>00718     R0 = (short) __SSAT((<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a>) (S0 - T1), 16);
 731 <a name="l00719"></a>00719     R1 = (short) __SSAT((<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a>) (S1 + T0), 16);
 732 <a name="l00720"></a>00720
 733 <a name="l00721"></a>00721     <span class="comment">/* S1 = (ya-yc) - (xb- xd), S0 = (xa-xc) + (yb-yd)) */</span>
 734 <a name="l00722"></a>00722     S0 = (short) __SSAT(((<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a>) S0 + T1), 16u);
 735 <a name="l00723"></a>00723     S1 = (short) __SSAT(((<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a>) S1 - T0), 16u);
 736 <a name="l00724"></a>00724
 737 <a name="l00725"></a>00725     <span class="comment">/* co1 &amp; si1 are read from Coefficient pointer */</span>
 738 <a name="l00726"></a>00726     Co1 = pCoef16[ic * 2u];
 739 <a name="l00727"></a>00727     Si1 = pCoef16[(ic * 2u) + 1];
 740 <a name="l00728"></a>00728     <span class="comment">/*  Butterfly process for the i0+fftLen/2 sample */</span>
 741 <a name="l00729"></a>00729     <span class="comment">/* xb&#39; = (xa+yb-xc-yd)* co1 + (ya-xb-yc+xd)* (si1) */</span>
 742 <a name="l00730"></a>00730     out1 = (short) ((Si1 * S1 + Co1 * S0) &gt;&gt; 16);
 743 <a name="l00731"></a>00731     <span class="comment">/* yb&#39; = (ya-xb-yc+xd)* co1 - (xa+yb-xc-yd)* (si1) */</span>
 744 <a name="l00732"></a>00732     out2 = (short) ((-Si1 * S0 + Co1 * S1) &gt;&gt; 16);
 745 <a name="l00733"></a>00733
 746 <a name="l00734"></a>00734     <span class="comment">/* writing output(xb&#39;, yb&#39;) in little endian format */</span>
 747 <a name="l00735"></a>00735     pSrc16[i2 * 2u] = out1;
 748 <a name="l00736"></a>00736     pSrc16[(i2 * 2u) + 1] = out2;
 749 <a name="l00737"></a>00737
 750 <a name="l00738"></a>00738     <span class="comment">/* Co3 &amp; si3 are read from Coefficient pointer */</span>
 751 <a name="l00739"></a>00739     Co3 = pCoef16[3u * (ic * 2u)];
 752 <a name="l00740"></a>00740     Si3 = pCoef16[(3u * (ic * 2u)) + 1];
 753 <a name="l00741"></a>00741     <span class="comment">/*  Butterfly process for the i0+3fftLen/4 sample */</span>
 754 <a name="l00742"></a>00742     <span class="comment">/* xd&#39; = (xa-yb-xc+yd)* Co3 + (ya+xb-yc-xd)* (si3) */</span>
 755 <a name="l00743"></a>00743     out1 = (short) ((Si3 * R1 + Co3 * R0) &gt;&gt; 16u);
 756 <a name="l00744"></a>00744     <span class="comment">/* yd&#39; = (ya+xb-yc-xd)* Co3 - (xa-yb-xc+yd)* (si3) */</span>
 757 <a name="l00745"></a>00745     out2 = (short) ((-Si3 * R0 + Co3 * R1) &gt;&gt; 16u);
 758 <a name="l00746"></a>00746     <span class="comment">/* writing output(xd&#39;, yd&#39;) in little endian format */</span>
 759 <a name="l00747"></a>00747     pSrc16[i3 * 2u] = out1;
 760 <a name="l00748"></a>00748     pSrc16[(i3 * 2u) + 1] = out2;
 761 <a name="l00749"></a>00749
 762 <a name="l00750"></a>00750     <span class="comment">/*  Twiddle coefficients index modifier */</span>
 763 <a name="l00751"></a>00751     ic = ic + twidCoefModifier;
 764 <a name="l00752"></a>00752
 765 <a name="l00753"></a>00753     <span class="comment">/*  Updating input index */</span>
 766 <a name="l00754"></a>00754     i0 = i0 + 1u;
 767 <a name="l00755"></a>00755
 768 <a name="l00756"></a>00756   } <span class="keywordflow">while</span>(--j);
 769 <a name="l00757"></a>00757   <span class="comment">/* data is in 4.11(q11) format */</span>
 770 <a name="l00758"></a>00758
 771 <a name="l00759"></a>00759   <span class="comment">/* end of first stage process */</span>
 772 <a name="l00760"></a>00760
 773 <a name="l00761"></a>00761
 774 <a name="l00762"></a>00762   <span class="comment">/* start of middle stage process */</span>
 775 <a name="l00763"></a>00763
 776 <a name="l00764"></a>00764   <span class="comment">/*  Twiddle coefficients index modifier */</span>
 777 <a name="l00765"></a>00765   twidCoefModifier &lt;&lt;= 2u;
 778 <a name="l00766"></a>00766
 779 <a name="l00767"></a>00767   <span class="comment">/*  Calculation of Middle stage */</span>
 780 <a name="l00768"></a>00768   <span class="keywordflow">for</span> (k = fftLen / 4u; k &gt; 4u; k &gt;&gt;= 2u)
 781 <a name="l00769"></a>00769   {
 782 <a name="l00770"></a>00770     <span class="comment">/*  Initializations for the middle stage */</span>
 783 <a name="l00771"></a>00771     n1 = n2;
 784 <a name="l00772"></a>00772     n2 &gt;&gt;= 2u;
 785 <a name="l00773"></a>00773     ic = 0u;
 786 <a name="l00774"></a>00774
 787 <a name="l00775"></a>00775     <span class="keywordflow">for</span> (j = 0u; j &lt;= (n2 - 1u); j++)
 788 <a name="l00776"></a>00776     {
 789 <a name="l00777"></a>00777       <span class="comment">/*  index calculation for the coefficients */</span>
 790 <a name="l00778"></a>00778       Co1 = pCoef16[ic * 2u];
 791 <a name="l00779"></a>00779       Si1 = pCoef16[(ic * 2u) + 1u];
 792 <a name="l00780"></a>00780       Co2 = pCoef16[2u * (ic * 2u)];
 793 <a name="l00781"></a>00781       Si2 = pCoef16[(2u * (ic * 2u)) + 1u];
 794 <a name="l00782"></a>00782       Co3 = pCoef16[3u * (ic * 2u)];
 795 <a name="l00783"></a>00783       Si3 = pCoef16[(3u * (ic * 2u)) + 1u];
 796 <a name="l00784"></a>00784
 797 <a name="l00785"></a>00785       <span class="comment">/*  Twiddle coefficients index modifier */</span>
 798 <a name="l00786"></a>00786       ic = ic + twidCoefModifier;
 799 <a name="l00787"></a>00787
 800 <a name="l00788"></a>00788       <span class="comment">/*  Butterfly implementation */</span>
 801 <a name="l00789"></a>00789       <span class="keywordflow">for</span> (i0 = j; i0 &lt; fftLen; i0 += n1)
 802 <a name="l00790"></a>00790       {
 803 <a name="l00791"></a>00791         <span class="comment">/*  index calculation for the input as, */</span>
 804 <a name="l00792"></a>00792         <span class="comment">/*  pSrc16[i0 + 0], pSrc16[i0 + fftLen/4], pSrc16[i0 + fftLen/2], pSrc16[i0 + 3fftLen/4] */</span>
 805 <a name="l00793"></a>00793         i1 = i0 + n2;
 806 <a name="l00794"></a>00794         i2 = i1 + n2;
 807 <a name="l00795"></a>00795         i3 = i2 + n2;
 808 <a name="l00796"></a>00796
 809 <a name="l00797"></a>00797         <span class="comment">/*  Reading i0, i0+fftLen/2 inputs */</span>
 810 <a name="l00798"></a>00798         <span class="comment">/* Read ya (real), xa(imag) input */</span>
 811 <a name="l00799"></a>00799         T0 = pSrc16[i0 * 2u];
 812 <a name="l00800"></a>00800         T1 = pSrc16[(i0 * 2u) + 1u];
 813 <a name="l00801"></a>00801
 814 <a name="l00802"></a>00802         <span class="comment">/* Read yc (real), xc(imag) input */</span>
 815 <a name="l00803"></a>00803         S0 = pSrc16[i2 * 2u];
 816 <a name="l00804"></a>00804         S1 = pSrc16[(i2 * 2u) + 1u];
 817 <a name="l00805"></a>00805
 818 <a name="l00806"></a>00806         <span class="comment">/* R0 = (ya + yc), R1 = (xa + xc) */</span>
 819 <a name="l00807"></a>00807         R0 = __SSAT(T0 + S0, 16);
 820 <a name="l00808"></a>00808         R1 = __SSAT(T1 + S1, 16);
 821 <a name="l00809"></a>00809
 822 <a name="l00810"></a>00810         <span class="comment">/* S0 = (ya - yc), S1 =(xa - xc) */</span>
 823 <a name="l00811"></a>00811         S0 = __SSAT(T0 - S0, 16);
 824 <a name="l00812"></a>00812         S1 = __SSAT(T1 - S1, 16);
 825 <a name="l00813"></a>00813
 826 <a name="l00814"></a>00814         <span class="comment">/*  Reading i0+fftLen/4 , i0+3fftLen/4 inputs */</span>
 827 <a name="l00815"></a>00815         <span class="comment">/* Read yb (real), xb(imag) input */</span>
 828 <a name="l00816"></a>00816         T0 = pSrc16[i1 * 2u];
 829 <a name="l00817"></a>00817         T1 = pSrc16[(i1 * 2u) + 1u];
 830 <a name="l00818"></a>00818
 831 <a name="l00819"></a>00819         <span class="comment">/* Read yd (real), xd(imag) input */</span>
 832 <a name="l00820"></a>00820         U0 = pSrc16[i3 * 2u];
 833 <a name="l00821"></a>00821         U1 = pSrc16[(i3 * 2u) + 1u];
 834 <a name="l00822"></a>00822
 835 <a name="l00823"></a>00823
 836 <a name="l00824"></a>00824         <span class="comment">/* T0 = (yb + yd), T1 = (xb + xd) */</span>
 837 <a name="l00825"></a>00825         T0 = __SSAT(T0 + U0, 16);
 838 <a name="l00826"></a>00826         T1 = __SSAT(T1 + U1, 16);
 839 <a name="l00827"></a>00827
 840 <a name="l00828"></a>00828         <span class="comment">/*  writing the butterfly processed i0 sample */</span>
 841 <a name="l00829"></a>00829
 842 <a name="l00830"></a>00830         <span class="comment">/* xa&#39; = xa + xb + xc + xd */</span>
 843 <a name="l00831"></a>00831         <span class="comment">/* ya&#39; = ya + yb + yc + yd */</span>
 844 <a name="l00832"></a>00832         out1 = ((R0 &gt;&gt; 1u) + (T0 &gt;&gt; 1u)) &gt;&gt; 1u;
 845 <a name="l00833"></a>00833         out2 = ((R1 &gt;&gt; 1u) + (T1 &gt;&gt; 1u)) &gt;&gt; 1u;
 846 <a name="l00834"></a>00834
 847 <a name="l00835"></a>00835         pSrc16[i0 * 2u] = out1;
 848 <a name="l00836"></a>00836         pSrc16[(2u * i0) + 1u] = out2;
 849 <a name="l00837"></a>00837
 850 <a name="l00838"></a>00838         <span class="comment">/* R0 = (ya + yc) - (yb + yd), R1 = (xa + xc) - (xb + xd) */</span>
 851 <a name="l00839"></a>00839         R0 = (R0 &gt;&gt; 1u) - (T0 &gt;&gt; 1u);
 852 <a name="l00840"></a>00840         R1 = (R1 &gt;&gt; 1u) - (T1 &gt;&gt; 1u);
 853 <a name="l00841"></a>00841
 854 <a name="l00842"></a>00842         <span class="comment">/* (ya-yb+yc-yd)* (si2) + (xa-xb+xc-xd)* co2 */</span>
 855 <a name="l00843"></a>00843         out1 = (short) ((Co2 * R0 + Si2 * R1) &gt;&gt; 16u);
 856 <a name="l00844"></a>00844
 857 <a name="l00845"></a>00845         <span class="comment">/* (ya-yb+yc-yd)* co2 - (xa-xb+xc-xd)* (si2) */</span>
 858 <a name="l00846"></a>00846         out2 = (short) ((-Si2 * R0 + Co2 * R1) &gt;&gt; 16u);
 859 <a name="l00847"></a>00847
 860 <a name="l00848"></a>00848         <span class="comment">/*  Reading i0+3fftLen/4 */</span>
 861 <a name="l00849"></a>00849         <span class="comment">/* Read yb (real), xb(imag) input */</span>
 862 <a name="l00850"></a>00850         T0 = pSrc16[i1 * 2u];
 863 <a name="l00851"></a>00851         T1 = pSrc16[(i1 * 2u) + 1u];
 864 <a name="l00852"></a>00852
 865 <a name="l00853"></a>00853         <span class="comment">/*  writing the butterfly processed i0 + fftLen/4 sample */</span>
 866 <a name="l00854"></a>00854         <span class="comment">/* xc&#39; = (xa-xb+xc-xd)* co2 + (ya-yb+yc-yd)* (si2) */</span>
 867 <a name="l00855"></a>00855         <span class="comment">/* yc&#39; = (ya-yb+yc-yd)* co2 - (xa-xb+xc-xd)* (si2) */</span>
 868 <a name="l00856"></a>00856         pSrc16[i1 * 2u] = out1;
 869 <a name="l00857"></a>00857         pSrc16[(i1 * 2u) + 1u] = out2;
 870 <a name="l00858"></a>00858
 871 <a name="l00859"></a>00859         <span class="comment">/*  Butterfly calculations */</span>
 872 <a name="l00860"></a>00860
 873 <a name="l00861"></a>00861         <span class="comment">/* Read yd (real), xd(imag) input */</span>
 874 <a name="l00862"></a>00862         U0 = pSrc16[i3 * 2u];
 875 <a name="l00863"></a>00863         U1 = pSrc16[(i3 * 2u) + 1u];
 876 <a name="l00864"></a>00864
 877 <a name="l00865"></a>00865         <span class="comment">/* T0 = yb-yd, T1 = xb-xd */</span>
 878 <a name="l00866"></a>00866         T0 = __SSAT(T0 - U0, 16);
 879 <a name="l00867"></a>00867         T1 = __SSAT(T1 - U1, 16);
 880 <a name="l00868"></a>00868
 881 <a name="l00869"></a>00869         <span class="comment">/* R0 = (ya-yc) + (xb- xd), R1 = (xa-xc) - (yb-yd)) */</span>
 882 <a name="l00870"></a>00870         R0 = (S0 &gt;&gt; 1u) - (T1 &gt;&gt; 1u);
 883 <a name="l00871"></a>00871         R1 = (S1 &gt;&gt; 1u) + (T0 &gt;&gt; 1u);
 884 <a name="l00872"></a>00872
 885 <a name="l00873"></a>00873         <span class="comment">/* S0 = (ya-yc) - (xb- xd), S1 = (xa-xc) + (yb-yd)) */</span>
 886 <a name="l00874"></a>00874         S0 = (S0 &gt;&gt; 1u) + (T1 &gt;&gt; 1u);
 887 <a name="l00875"></a>00875         S1 = (S1 &gt;&gt; 1u) - (T0 &gt;&gt; 1u);
 888 <a name="l00876"></a>00876
 889 <a name="l00877"></a>00877         <span class="comment">/*  Butterfly process for the i0+fftLen/2 sample */</span>
 890 <a name="l00878"></a>00878         out1 = (short) ((Co1 * S0 + Si1 * S1) &gt;&gt; 16u);
 891 <a name="l00879"></a>00879
 892 <a name="l00880"></a>00880         out2 = (short) ((-Si1 * S0 + Co1 * S1) &gt;&gt; 16u);
 893 <a name="l00881"></a>00881
 894 <a name="l00882"></a>00882         <span class="comment">/* xb&#39; = (xa+yb-xc-yd)* co1 + (ya-xb-yc+xd)* (si1) */</span>
 895 <a name="l00883"></a>00883         <span class="comment">/* yb&#39; = (ya-xb-yc+xd)* co1 - (xa+yb-xc-yd)* (si1) */</span>
 896 <a name="l00884"></a>00884         pSrc16[i2 * 2u] = out1;
 897 <a name="l00885"></a>00885         pSrc16[(i2 * 2u) + 1u] = out2;
 898 <a name="l00886"></a>00886
 899 <a name="l00887"></a>00887         <span class="comment">/*  Butterfly process for the i0+3fftLen/4 sample */</span>
 900 <a name="l00888"></a>00888         out1 = (short) ((Si3 * R1 + Co3 * R0) &gt;&gt; 16u);
 901 <a name="l00889"></a>00889
 902 <a name="l00890"></a>00890         out2 = (short) ((-Si3 * R0 + Co3 * R1) &gt;&gt; 16u);
 903 <a name="l00891"></a>00891         <span class="comment">/* xd&#39; = (xa-yb-xc+yd)* Co3 + (ya+xb-yc-xd)* (si3) */</span>
 904 <a name="l00892"></a>00892         <span class="comment">/* yd&#39; = (ya+xb-yc-xd)* Co3 - (xa-yb-xc+yd)* (si3) */</span>
 905 <a name="l00893"></a>00893         pSrc16[i3 * 2u] = out1;
 906 <a name="l00894"></a>00894         pSrc16[(i3 * 2u) + 1u] = out2;
 907 <a name="l00895"></a>00895       }
 908 <a name="l00896"></a>00896     }
 909 <a name="l00897"></a>00897     <span class="comment">/*  Twiddle coefficients index modifier */</span>
 910 <a name="l00898"></a>00898     twidCoefModifier &lt;&lt;= 2u;
 911 <a name="l00899"></a>00899   }
 912 <a name="l00900"></a>00900   <span class="comment">/* end of middle stage process */</span>
 913 <a name="l00901"></a>00901
 914 <a name="l00902"></a>00902
 915 <a name="l00903"></a>00903   <span class="comment">/* data is in 10.6(q6) format for the 1024 point */</span>
 916 <a name="l00904"></a>00904   <span class="comment">/* data is in 8.8(q8) format for the 256 point */</span>
 917 <a name="l00905"></a>00905   <span class="comment">/* data is in 6.10(q10) format for the 64 point */</span>
 918 <a name="l00906"></a>00906   <span class="comment">/* data is in 4.12(q12) format for the 16 point */</span>
 919 <a name="l00907"></a>00907
 920 <a name="l00908"></a>00908   <span class="comment">/*  Initializations for the last stage */</span>
 921 <a name="l00909"></a>00909   n1 = n2;
 922 <a name="l00910"></a>00910   n2 &gt;&gt;= 2u;
 923 <a name="l00911"></a>00911
 924 <a name="l00912"></a>00912   <span class="comment">/* start of last stage process */</span>
 925 <a name="l00913"></a>00913
 926 <a name="l00914"></a>00914   <span class="comment">/*  Butterfly implementation */</span>
 927 <a name="l00915"></a>00915   <span class="keywordflow">for</span> (i0 = 0u; i0 &lt;= (fftLen - n1); i0 += n1)
 928 <a name="l00916"></a>00916   {
 929 <a name="l00917"></a>00917     <span class="comment">/*  index calculation for the input as, */</span>
 930 <a name="l00918"></a>00918     <span class="comment">/*  pSrc16[i0 + 0], pSrc16[i0 + fftLen/4], pSrc16[i0 + fftLen/2], pSrc16[i0 + 3fftLen/4] */</span>
 931 <a name="l00919"></a>00919     i1 = i0 + n2;
 932 <a name="l00920"></a>00920     i2 = i1 + n2;
 933 <a name="l00921"></a>00921     i3 = i2 + n2;
 934 <a name="l00922"></a>00922
 935 <a name="l00923"></a>00923     <span class="comment">/*  Reading i0, i0+fftLen/2 inputs */</span>
 936 <a name="l00924"></a>00924     <span class="comment">/* Read ya (real), xa(imag) input */</span>
 937 <a name="l00925"></a>00925     T0 = pSrc16[i0 * 2u];
 938 <a name="l00926"></a>00926     T1 = pSrc16[(i0 * 2u) + 1u];
 939 <a name="l00927"></a>00927
 940 <a name="l00928"></a>00928     <span class="comment">/* Read yc (real), xc(imag) input */</span>
 941 <a name="l00929"></a>00929     S0 = pSrc16[i2 * 2u];
 942 <a name="l00930"></a>00930     S1 = pSrc16[(i2 * 2u) + 1u];
 943 <a name="l00931"></a>00931
 944 <a name="l00932"></a>00932     <span class="comment">/* R0 = (ya + yc), R1 = (xa + xc) */</span>
 945 <a name="l00933"></a>00933     R0 = __SSAT(T0 + S0, 16u);
 946 <a name="l00934"></a>00934     R1 = __SSAT(T1 + S1, 16u);
 947 <a name="l00935"></a>00935
 948 <a name="l00936"></a>00936     <span class="comment">/* S0 = (ya - yc), S1 = (xa - xc) */</span>
 949 <a name="l00937"></a>00937     S0 = __SSAT(T0 - S0, 16u);
 950 <a name="l00938"></a>00938     S1 = __SSAT(T1 - S1, 16u);
 951 <a name="l00939"></a>00939
 952 <a name="l00940"></a>00940     <span class="comment">/*  Reading i0+fftLen/4 , i0+3fftLen/4 inputs */</span>
 953 <a name="l00941"></a>00941     <span class="comment">/* Read yb (real), xb(imag) input */</span>
 954 <a name="l00942"></a>00942     T0 = pSrc16[i1 * 2u];
 955 <a name="l00943"></a>00943     T1 = pSrc16[(i1 * 2u) + 1u];
 956 <a name="l00944"></a>00944     <span class="comment">/* Read yd (real), xd(imag) input */</span>
 957 <a name="l00945"></a>00945     U0 = pSrc16[i3 * 2u];
 958 <a name="l00946"></a>00946     U1 = pSrc16[(i3 * 2u) + 1u];
 959 <a name="l00947"></a>00947
 960 <a name="l00948"></a>00948     <span class="comment">/* T0 = (yb + yd), T1 = (xb + xd)) */</span>
 961 <a name="l00949"></a>00949     T0 = __SSAT(T0 + U0, 16u);
 962 <a name="l00950"></a>00950     T1 = __SSAT(T1 + U1, 16u);
 963 <a name="l00951"></a>00951
 964 <a name="l00952"></a>00952     <span class="comment">/*  writing the butterfly processed i0 sample */</span>
 965 <a name="l00953"></a>00953     <span class="comment">/* xa&#39; = xa + xb + xc + xd */</span>
 966 <a name="l00954"></a>00954     <span class="comment">/* ya&#39; = ya + yb + yc + yd */</span>
 967 <a name="l00955"></a>00955     pSrc16[i0 * 2u] = (R0 &gt;&gt; 1u) + (T0 &gt;&gt; 1u);
 968 <a name="l00956"></a>00956     pSrc16[(i0 * 2u) + 1u] = (R1 &gt;&gt; 1u) + (T1 &gt;&gt; 1u);
 969 <a name="l00957"></a>00957
 970 <a name="l00958"></a>00958     <span class="comment">/* R0 = (ya + yc) - (yb + yd), R1 = (xa + xc) - (xb + xd) */</span>
 971 <a name="l00959"></a>00959     R0 = (R0 &gt;&gt; 1u) - (T0 &gt;&gt; 1u);
 972 <a name="l00960"></a>00960     R1 = (R1 &gt;&gt; 1u) - (T1 &gt;&gt; 1u);
 973 <a name="l00961"></a>00961     <span class="comment">/* Read yb (real), xb(imag) input */</span>
 974 <a name="l00962"></a>00962     T0 = pSrc16[i1 * 2u];
 975 <a name="l00963"></a>00963     T1 = pSrc16[(i1 * 2u) + 1u];
 976 <a name="l00964"></a>00964
 977 <a name="l00965"></a>00965     <span class="comment">/*  writing the butterfly processed i0 + fftLen/4 sample */</span>
 978 <a name="l00966"></a>00966     <span class="comment">/* xc&#39; = (xa-xb+xc-xd) */</span>
 979 <a name="l00967"></a>00967     <span class="comment">/* yc&#39; = (ya-yb+yc-yd) */</span>
 980 <a name="l00968"></a>00968     pSrc16[i1 * 2u] = R0;
 981 <a name="l00969"></a>00969     pSrc16[(i1 * 2u) + 1u] = R1;
 982 <a name="l00970"></a>00970
 983 <a name="l00971"></a>00971     <span class="comment">/* Read yd (real), xd(imag) input */</span>
 984 <a name="l00972"></a>00972     U0 = pSrc16[i3 * 2u];
 985 <a name="l00973"></a>00973     U1 = pSrc16[(i3 * 2u) + 1u];
 986 <a name="l00974"></a>00974     <span class="comment">/* T0 = (yb - yd), T1 = (xb - xd)  */</span>
 987 <a name="l00975"></a>00975     T0 = __SSAT(T0 - U0, 16u);
 988 <a name="l00976"></a>00976     T1 = __SSAT(T1 - U1, 16u);
 989 <a name="l00977"></a>00977
 990 <a name="l00978"></a>00978     <span class="comment">/*  writing the butterfly processed i0 + fftLen/2 sample */</span>
 991 <a name="l00979"></a>00979     <span class="comment">/* xb&#39; = (xa+yb-xc-yd) */</span>
 992 <a name="l00980"></a>00980     <span class="comment">/* yb&#39; = (ya-xb-yc+xd) */</span>
 993 <a name="l00981"></a>00981     pSrc16[i2 * 2u] = (S0 &gt;&gt; 1u) + (T1 &gt;&gt; 1u);
 994 <a name="l00982"></a>00982     pSrc16[(i2 * 2u) + 1u] = (S1 &gt;&gt; 1u) - (T0 &gt;&gt; 1u);
 995 <a name="l00983"></a>00983
 996 <a name="l00984"></a>00984     <span class="comment">/*  writing the butterfly processed i0 + 3fftLen/4 sample */</span>
 997 <a name="l00985"></a>00985     <span class="comment">/* xd&#39; = (xa-yb-xc+yd) */</span>
 998 <a name="l00986"></a>00986     <span class="comment">/* yd&#39; = (ya+xb-yc-xd) */</span>
 999 <a name="l00987"></a>00987     pSrc16[i3 * 2u] = (S0 &gt;&gt; 1u) - (T1 &gt;&gt; 1u);
1000 <a name="l00988"></a>00988     pSrc16[(i3 * 2u) + 1u] = (S1 &gt;&gt; 1u) + (T0 &gt;&gt; 1u);
1001 <a name="l00989"></a>00989
1002 <a name="l00990"></a>00990   }
1003 <a name="l00991"></a>00991
1004 <a name="l00992"></a>00992   <span class="comment">/* end of last stage process */</span>
1005 <a name="l00993"></a>00993
1006 <a name="l00994"></a>00994   <span class="comment">/* output is in 11.5(q5) format for the 1024 point */</span>
1007 <a name="l00995"></a>00995   <span class="comment">/* output is in 9.7(q7) format for the 256 point   */</span>
1008 <a name="l00996"></a>00996   <span class="comment">/* output is in 7.9(q9) format for the 64 point  */</span>
1009 <a name="l00997"></a>00997   <span class="comment">/* output is in 5.11(q11) format for the 16 point  */</span>
1010 <a name="l00998"></a>00998
1011 <a name="l00999"></a>00999 <span class="preprocessor">#endif </span><span class="comment">/* #ifndef ARM_MATH_CM0 */</span>
1012 <a name="l01000"></a>01000
1013 <a name="l01001"></a>01001 }
1014 <a name="l01002"></a>01002
1015 <a name="l01003"></a>01003
1016 <a name="l01013"></a>01013 <span class="comment">/*   </span>
1017 <a name="l01014"></a>01014 <span class="comment">* Radix-4 IFFT algorithm used is :   </span>
1018 <a name="l01015"></a>01015 <span class="comment">*   </span>
1019 <a name="l01016"></a>01016 <span class="comment">* CIFFT uses same twiddle coefficients as CFFT function   </span>
1020 <a name="l01017"></a>01017 <span class="comment">*  x[k] = x[n] + (j)k * x[n + fftLen/4] + (-1)k * x[n+fftLen/2] + (-j)k * x[n+3*fftLen/4]   </span>
1021 <a name="l01018"></a>01018 <span class="comment">*   </span>
1022 <a name="l01019"></a>01019 <span class="comment">*   </span>
1023 <a name="l01020"></a>01020 <span class="comment">* IFFT is implemented with following changes in equations from FFT   </span>
1024 <a name="l01021"></a>01021 <span class="comment">*   </span>
1025 <a name="l01022"></a>01022 <span class="comment">* Input real and imaginary data:   </span>
1026 <a name="l01023"></a>01023 <span class="comment">* x(n) = xa + j * ya   </span>
1027 <a name="l01024"></a>01024 <span class="comment">* x(n+N/4 ) = xb + j * yb   </span>
1028 <a name="l01025"></a>01025 <span class="comment">* x(n+N/2 ) = xc + j * yc   </span>
1029 <a name="l01026"></a>01026 <span class="comment">* x(n+3N 4) = xd + j * yd   </span>
1030 <a name="l01027"></a>01027 <span class="comment">*   </span>
1031 <a name="l01028"></a>01028 <span class="comment">*   </span>
1032 <a name="l01029"></a>01029 <span class="comment">* Output real and imaginary data:   </span>
1033 <a name="l01030"></a>01030 <span class="comment">* x(4r) = xa&#39;+ j * ya&#39;   </span>
1034 <a name="l01031"></a>01031 <span class="comment">* x(4r+1) = xb&#39;+ j * yb&#39;   </span>
1035 <a name="l01032"></a>01032 <span class="comment">* x(4r+2) = xc&#39;+ j * yc&#39;   </span>
1036 <a name="l01033"></a>01033 <span class="comment">* x(4r+3) = xd&#39;+ j * yd&#39;   </span>
1037 <a name="l01034"></a>01034 <span class="comment">*   </span>
1038 <a name="l01035"></a>01035 <span class="comment">*   </span>
1039 <a name="l01036"></a>01036 <span class="comment">* Twiddle factors for radix-4 IFFT:   </span>
1040 <a name="l01037"></a>01037 <span class="comment">* Wn = co1 + j * (si1)   </span>
1041 <a name="l01038"></a>01038 <span class="comment">* W2n = co2 + j * (si2)   </span>
1042 <a name="l01039"></a>01039 <span class="comment">* W3n = co3 + j * (si3)   </span>
1043 <a name="l01040"></a>01040 <span class="comment">   </span>
1044 <a name="l01041"></a>01041 <span class="comment">* The real and imaginary output values for the radix-4 butterfly are   </span>
1045 <a name="l01042"></a>01042 <span class="comment">* xa&#39; = xa + xb + xc + xd   </span>
1046 <a name="l01043"></a>01043 <span class="comment">* ya&#39; = ya + yb + yc + yd   </span>
1047 <a name="l01044"></a>01044 <span class="comment">* xb&#39; = (xa-yb-xc+yd)* co1 - (ya+xb-yc-xd)* (si1)   </span>
1048 <a name="l01045"></a>01045 <span class="comment">* yb&#39; = (ya+xb-yc-xd)* co1 + (xa-yb-xc+yd)* (si1)   </span>
1049 <a name="l01046"></a>01046 <span class="comment">* xc&#39; = (xa-xb+xc-xd)* co2 - (ya-yb+yc-yd)* (si2)   </span>
1050 <a name="l01047"></a>01047 <span class="comment">* yc&#39; = (ya-yb+yc-yd)* co2 + (xa-xb+xc-xd)* (si2)   </span>
1051 <a name="l01048"></a>01048 <span class="comment">* xd&#39; = (xa+yb-xc-yd)* co3 - (ya-xb-yc+xd)* (si3)   </span>
1052 <a name="l01049"></a>01049 <span class="comment">* yd&#39; = (ya-xb-yc+xd)* co3 + (xa+yb-xc-yd)* (si3)   </span>
1053 <a name="l01050"></a>01050 <span class="comment">*   </span>
1054 <a name="l01051"></a>01051 <span class="comment">*/</span>
1055 <a name="l01052"></a>01052
1056 <a name="l01053"></a><a class="code" href="arm__math_8h.html#aad04e8439d17dab5617bf1be268bb391">01053</a> <span class="keywordtype">void</span> <a class="code" href="arm__cfft__radix4__q15_8c.html#aad04e8439d17dab5617bf1be268bb391" title="Core function for the Q15 CIFFT butterfly process.">arm_radix4_butterfly_inverse_q15</a>(
1057 <a name="l01054"></a>01054   <a class="code" href="arm__math_8h.html#ab5a8fb21a5b3b983d5f54f31614052ea" title="16-bit fractional data type in 1.15 format.">q15_t</a> * pSrc16,
1058 <a name="l01055"></a>01055   uint32_t fftLen,
1059 <a name="l01056"></a>01056   <a class="code" href="arm__math_8h.html#ab5a8fb21a5b3b983d5f54f31614052ea" title="16-bit fractional data type in 1.15 format.">q15_t</a> * pCoef16,
1060 <a name="l01057"></a>01057   uint32_t twidCoefModifier)
1061 <a name="l01058"></a>01058 {
1062 <a name="l01059"></a>01059
1063 <a name="l01060"></a>01060 <span class="preprocessor">#ifndef ARM_MATH_CM0</span>
1064 <a name="l01061"></a>01061 <span class="preprocessor"></span>
1065 <a name="l01062"></a>01062   <span class="comment">/* Run the below code for Cortex-M4 and Cortex-M3 */</span>
1066 <a name="l01063"></a>01063
1067 <a name="l01064"></a>01064   <a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> R, S, T, U;
1068 <a name="l01065"></a>01065   <a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> C1, C2, C3, out1, out2;
1069 <a name="l01066"></a>01066   <a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> *pSrc, *pCoeff;
1070 <a name="l01067"></a>01067   uint32_t n1, n2, ic, i0, i1, i2, i3, j, k;
1071 <a name="l01068"></a>01068   <a class="code" href="arm__math_8h.html#ab5a8fb21a5b3b983d5f54f31614052ea" title="16-bit fractional data type in 1.15 format.">q15_t</a> in;
1072 <a name="l01069"></a>01069
1073 <a name="l01070"></a>01070   <span class="comment">/* Total process is divided into three stages */</span>
1074 <a name="l01071"></a>01071
1075 <a name="l01072"></a>01072   <span class="comment">/* process first stage, middle stages, &amp; last stage */</span>
1076 <a name="l01073"></a>01073
1077 <a name="l01074"></a>01074   <span class="comment">/*  pointer initializations for SIMD calculations */</span>
1078 <a name="l01075"></a>01075   pSrc = (<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> *) pSrc16;
1079 <a name="l01076"></a>01076   pCoeff = (<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> *) pCoef16;
1080 <a name="l01077"></a>01077
1081 <a name="l01078"></a>01078   <span class="comment">/*  Initializations for the first stage */</span>
1082 <a name="l01079"></a>01079   n2 = fftLen;
1083 <a name="l01080"></a>01080   n1 = n2;
1084 <a name="l01081"></a>01081
1085 <a name="l01082"></a>01082   <span class="comment">/* n2 = fftLen/4 */</span>
1086 <a name="l01083"></a>01083   n2 &gt;&gt;= 2u;
1087 <a name="l01084"></a>01084
1088 <a name="l01085"></a>01085   <span class="comment">/* Index for twiddle coefficient */</span>
1089 <a name="l01086"></a>01086   ic = 0u;
1090 <a name="l01087"></a>01087
1091 <a name="l01088"></a>01088   <span class="comment">/* Index for input read and output write */</span>
1092 <a name="l01089"></a>01089   i0 = 0u;
1093 <a name="l01090"></a>01090
1094 <a name="l01091"></a>01091   j = n2;
1095 <a name="l01092"></a>01092
1096 <a name="l01093"></a>01093   <span class="comment">/* Input is in 1.15(q15) format */</span>
1097 <a name="l01094"></a>01094
1098 <a name="l01095"></a>01095   <span class="comment">/*  Start of first stage process */</span>
1099 <a name="l01096"></a>01096   <span class="keywordflow">do</span>
1100 <a name="l01097"></a>01097   {
1101 <a name="l01098"></a>01098     <span class="comment">/*  Butterfly implementation */</span>
1102 <a name="l01099"></a>01099
1103 <a name="l01100"></a>01100     <span class="comment">/*  index calculation for the input as, */</span>
1104 <a name="l01101"></a>01101     <span class="comment">/*  pSrc[i0 + 0], pSrc[i0 + fftLen/4], pSrc[i0 + fftLen/2], pSrc[i0 + 3fftLen/4] */</span>
1105 <a name="l01102"></a>01102     i1 = i0 + n2;
1106 <a name="l01103"></a>01103     i2 = i1 + n2;
1107 <a name="l01104"></a>01104     i3 = i2 + n2;
1108 <a name="l01105"></a>01105
1109 <a name="l01106"></a>01106     <span class="comment">/*  Reading i0, i0+fftLen/2 inputs */</span>
1110 <a name="l01107"></a>01107     <span class="comment">/* Read ya (real), xa(imag) input */</span>
1111 <a name="l01108"></a>01108     T = pSrc[i0];
1112 <a name="l01109"></a>01109     in = ((int16_t) (T &amp; 0xFFFF)) &gt;&gt; 2;
1113 <a name="l01110"></a>01110     T = ((T &gt;&gt; 2) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
1114 <a name="l01111"></a>01111     <span class="comment">/* Read yc (real), xc(imag) input */</span>
1115 <a name="l01112"></a>01112     S = pSrc[i2];
1116 <a name="l01113"></a>01113     in = ((int16_t) (S &amp; 0xFFFF)) &gt;&gt; 2;
1117 <a name="l01114"></a>01114     S = ((S &gt;&gt; 2) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
1118 <a name="l01115"></a>01115
1119 <a name="l01116"></a>01116     <span class="comment">/* R = packed((ya + yc), (xa + xc) ) */</span>
1120 <a name="l01117"></a>01117     R = __QADD16(T, S);
1121 <a name="l01118"></a>01118     <span class="comment">/* S = packed((ya - yc), (xa - xc) ) */</span>
1122 <a name="l01119"></a>01119     S = __QSUB16(T, S);
1123 <a name="l01120"></a>01120
1124 <a name="l01121"></a>01121     <span class="comment">/*  Reading i0+fftLen/4 , i0+3fftLen/4 inputs */</span>
1125 <a name="l01122"></a>01122     <span class="comment">/* Read yb (real), xb(imag) input */</span>
1126 <a name="l01123"></a>01123     T = pSrc[i1];
1127 <a name="l01124"></a>01124     in = ((int16_t) (T &amp; 0xFFFF)) &gt;&gt; 2;
1128 <a name="l01125"></a>01125     T = ((T &gt;&gt; 2) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
1129 <a name="l01126"></a>01126     <span class="comment">/* Read yd (real), xd(imag) input */</span>
1130 <a name="l01127"></a>01127     U = pSrc[i3];
1131 <a name="l01128"></a>01128     in = ((int16_t) (U &amp; 0xFFFF)) &gt;&gt; 2;
1132 <a name="l01129"></a>01129     U = ((U &gt;&gt; 2) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
1133 <a name="l01130"></a>01130
1134 <a name="l01131"></a>01131     <span class="comment">/* T = packed((yb + yd), (xb + xd) ) */</span>
1135 <a name="l01132"></a>01132     T = __QADD16(T, U);
1136 <a name="l01133"></a>01133
1137 <a name="l01134"></a>01134     <span class="comment">/*  writing the butterfly processed i0 sample */</span>
1138 <a name="l01135"></a>01135     <span class="comment">/* xa&#39; = xa + xb + xc + xd */</span>
1139 <a name="l01136"></a>01136     <span class="comment">/* ya&#39; = ya + yb + yc + yd */</span>
1140 <a name="l01137"></a>01137     pSrc[i0] = __SHADD16(R, T);
1141 <a name="l01138"></a>01138
1142 <a name="l01139"></a>01139     <span class="comment">/* R = packed((ya + yc) - (yb + yd), (xa + xc)- (xb + xd)) */</span>
1143 <a name="l01140"></a>01140     R = __QSUB16(R, T);
1144 <a name="l01141"></a>01141     <span class="comment">/* co2 &amp; si2 are read from SIMD Coefficient pointer */</span>
1145 <a name="l01142"></a>01142     C2 = pCoeff[2u * ic];
1146 <a name="l01143"></a>01143
1147 <a name="l01144"></a>01144 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
1148 <a name="l01145"></a>01145 <span class="preprocessor"></span>
1149 <a name="l01146"></a>01146     <span class="comment">/* xc&#39; = (xa-xb+xc-xd)* co2 - (ya-yb+yc-yd)* (si2) */</span>
1150 <a name="l01147"></a>01147     out1 = __SMUSD(C2, R) &gt;&gt; 16u;
1151 <a name="l01148"></a>01148     <span class="comment">/* yc&#39; = (ya-yb+yc-yd)* co2 + (xa-xb+xc-xd)* (si2) */</span>
1152 <a name="l01149"></a>01149     out2 = __SMUADX(C2, R);
1153 <a name="l01150"></a>01150
1154 <a name="l01151"></a>01151 <span class="preprocessor">#else</span>
1155 <a name="l01152"></a>01152 <span class="preprocessor"></span>
1156 <a name="l01153"></a>01153     <span class="comment">/* xc&#39; = (ya-yb+yc-yd)* co2 + (xa-xb+xc-xd)* (si2) */</span>
1157 <a name="l01154"></a>01154     out1 = __SMUADX(C2, R) &gt;&gt; 16u;
1158 <a name="l01155"></a>01155     <span class="comment">/* yc&#39; = (xa-xb+xc-xd)* co2 - (ya-yb+yc-yd)* (si2) */</span>
1159 <a name="l01156"></a>01156     out2 = __SMUSD(-C2, R);
1160 <a name="l01157"></a>01157
1161 <a name="l01158"></a>01158 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
1162 <a name="l01159"></a>01159
1163 <a name="l01160"></a>01160     <span class="comment">/*  Reading i0+fftLen/4 */</span>
1164 <a name="l01161"></a>01161     <span class="comment">/* T = packed(yb, xb) */</span>
1165 <a name="l01162"></a>01162     T = pSrc[i1];
1166 <a name="l01163"></a>01163     in = ((int16_t) (T &amp; 0xFFFF)) &gt;&gt; 2;
1167 <a name="l01164"></a>01164     T = ((T &gt;&gt; 2) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
1168 <a name="l01165"></a>01165
1169 <a name="l01166"></a>01166     <span class="comment">/* writing the butterfly processed i0 + fftLen/4 sample */</span>
1170 <a name="l01167"></a>01167     <span class="comment">/* writing output(xc&#39;, yc&#39;) in little endian format */</span>
1171 <a name="l01168"></a>01168     pSrc[i1] = (<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a>) ((out2) &amp; 0xFFFF0000) | (out1 &amp; 0x0000FFFF);
1172 <a name="l01169"></a>01169
1173 <a name="l01170"></a>01170     <span class="comment">/*  Butterfly calculations */</span>
1174 <a name="l01171"></a>01171     <span class="comment">/* U = packed(yd, xd) */</span>
1175 <a name="l01172"></a>01172     U = pSrc[i3];
1176 <a name="l01173"></a>01173     in = ((int16_t) (U &amp; 0xFFFF)) &gt;&gt; 2;
1177 <a name="l01174"></a>01174     U = ((U &gt;&gt; 2) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
1178 <a name="l01175"></a>01175
1179 <a name="l01176"></a>01176     <span class="comment">/* T = packed(yb-yd, xb-xd) */</span>
1180 <a name="l01177"></a>01177     T = __QSUB16(T, U);
1181 <a name="l01178"></a>01178
1182 <a name="l01179"></a>01179 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
1183 <a name="l01180"></a>01180 <span class="preprocessor"></span>
1184 <a name="l01181"></a>01181     <span class="comment">/* R = packed((ya-yc) - (xb- xd) , (xa-xc) + (yb-yd)) */</span>
1185 <a name="l01182"></a>01182     R = __QSAX(S, T);
1186 <a name="l01183"></a>01183     <span class="comment">/* S = packed((ya-yc) + (xb- xd),  (xa-xc) - (yb-yd)) */</span>
1187 <a name="l01184"></a>01184     S = __QASX(S, T);
1188 <a name="l01185"></a>01185
1189 <a name="l01186"></a>01186 <span class="preprocessor">#else</span>
1190 <a name="l01187"></a>01187 <span class="preprocessor"></span>
1191 <a name="l01188"></a>01188     <span class="comment">/* R = packed((ya-yc) - (xb- xd) , (xa-xc) + (yb-yd)) */</span>
1192 <a name="l01189"></a>01189     R = __QASX(S, T);
1193 <a name="l01190"></a>01190     <span class="comment">/* S = packed((ya-yc) + (xb- xd),  (xa-xc) - (yb-yd)) */</span>
1194 <a name="l01191"></a>01191     S = __QSAX(S, T);
1195 <a name="l01192"></a>01192
1196 <a name="l01193"></a>01193 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
1197 <a name="l01194"></a>01194
1198 <a name="l01195"></a>01195     <span class="comment">/* co1 &amp; si1 are read from SIMD Coefficient pointer */</span>
1199 <a name="l01196"></a>01196     C1 = pCoeff[ic];
1200 <a name="l01197"></a>01197     <span class="comment">/*  Butterfly process for the i0+fftLen/2 sample */</span>
1201 <a name="l01198"></a>01198
1202 <a name="l01199"></a>01199 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
1203 <a name="l01200"></a>01200 <span class="preprocessor"></span>
1204 <a name="l01201"></a>01201     <span class="comment">/* xb&#39; = (xa-yb-xc+yd)* co1 - (ya+xb-yc-xd)* (si1) */</span>
1205 <a name="l01202"></a>01202     out1 = __SMUSD(C1, S) &gt;&gt; 16u;
1206 <a name="l01203"></a>01203     <span class="comment">/* yb&#39; = (ya+xb-yc-xd)* co1 + (xa-yb-xc+yd)* (si1) */</span>
1207 <a name="l01204"></a>01204     out2 = __SMUADX(C1, S);
1208 <a name="l01205"></a>01205
1209 <a name="l01206"></a>01206 <span class="preprocessor">#else</span>
1210 <a name="l01207"></a>01207 <span class="preprocessor"></span>
1211 <a name="l01208"></a>01208     <span class="comment">/* xb&#39; = (ya+xb-yc-xd)* co1 + (xa-yb-xc+yd)* (si1) */</span>
1212 <a name="l01209"></a>01209     out1 = __SMUADX(C1, S) &gt;&gt; 16u;
1213 <a name="l01210"></a>01210     <span class="comment">/* yb&#39; = (xa-yb-xc+yd)* co1 - (ya+xb-yc-xd)* (si1) */</span>
1214 <a name="l01211"></a>01211     out2 = __SMUSD(-C1, S);
1215 <a name="l01212"></a>01212
1216 <a name="l01213"></a>01213 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
1217 <a name="l01214"></a>01214
1218 <a name="l01215"></a>01215     <span class="comment">/* writing output(xb&#39;, yb&#39;) in little endian format */</span>
1219 <a name="l01216"></a>01216     pSrc[i2] = ((out2) &amp; 0xFFFF0000) | ((out1) &amp; 0x0000FFFF);
1220 <a name="l01217"></a>01217
1221 <a name="l01218"></a>01218     <span class="comment">/* co3 &amp; si3 are read from SIMD Coefficient pointer */</span>
1222 <a name="l01219"></a>01219     C3 = pCoeff[3u * ic];
1223 <a name="l01220"></a>01220     <span class="comment">/*  Butterfly process for the i0+3fftLen/4 sample */</span>
1224 <a name="l01221"></a>01221
1225 <a name="l01222"></a>01222 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
1226 <a name="l01223"></a>01223 <span class="preprocessor"></span>
1227 <a name="l01224"></a>01224     <span class="comment">/* xd&#39; = (xa+yb-xc-yd)* co3 - (ya-xb-yc+xd)* (si3) */</span>
1228 <a name="l01225"></a>01225     out1 = __SMUSD(C3, R) &gt;&gt; 16u;
1229 <a name="l01226"></a>01226     <span class="comment">/* yd&#39; = (ya-xb-yc+xd)* co3 + (xa+yb-xc-yd)* (si3) */</span>
1230 <a name="l01227"></a>01227     out2 = __SMUADX(C3, R);
1231 <a name="l01228"></a>01228
1232 <a name="l01229"></a>01229 <span class="preprocessor">#else</span>
1233 <a name="l01230"></a>01230 <span class="preprocessor"></span>
1234 <a name="l01231"></a>01231     <span class="comment">/* xd&#39; = (ya-xb-yc+xd)* co3 + (xa+yb-xc-yd)* (si3) */</span>
1235 <a name="l01232"></a>01232     out1 = __SMUADX(C3, R) &gt;&gt; 16u;
1236 <a name="l01233"></a>01233     <span class="comment">/* yd&#39; = (xa+yb-xc-yd)* co3 - (ya-xb-yc+xd)* (si3) */</span>
1237 <a name="l01234"></a>01234     out2 = __SMUSD(-C3, R);
1238 <a name="l01235"></a>01235
1239 <a name="l01236"></a>01236 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
1240 <a name="l01237"></a>01237
1241 <a name="l01238"></a>01238     <span class="comment">/* writing output(xd&#39;, yd&#39;) in little endian format */</span>
1242 <a name="l01239"></a>01239     pSrc[i3] = ((out2) &amp; 0xFFFF0000) | (out1 &amp; 0x0000FFFF);
1243 <a name="l01240"></a>01240
1244 <a name="l01241"></a>01241     <span class="comment">/*  Twiddle coefficients index modifier */</span>
1245 <a name="l01242"></a>01242     ic = ic + twidCoefModifier;
1246 <a name="l01243"></a>01243
1247 <a name="l01244"></a>01244     <span class="comment">/*  Updating input index */</span>
1248 <a name="l01245"></a>01245     i0 = i0 + 1u;
1249 <a name="l01246"></a>01246
1250 <a name="l01247"></a>01247   } <span class="keywordflow">while</span>(--j);
1251 <a name="l01248"></a>01248
1252 <a name="l01249"></a>01249   <span class="comment">/*  End of first stage process */</span>
1253 <a name="l01250"></a>01250
1254 <a name="l01251"></a>01251   <span class="comment">/* data is in 4.11(q11) format */</span>
1255 <a name="l01252"></a>01252
1256 <a name="l01253"></a>01253
1257 <a name="l01254"></a>01254   <span class="comment">/*  Start of Middle stage process */</span>
1258 <a name="l01255"></a>01255
1259 <a name="l01256"></a>01256   <span class="comment">/*  Twiddle coefficients index modifier */</span>
1260 <a name="l01257"></a>01257   twidCoefModifier &lt;&lt;= 2u;
1261 <a name="l01258"></a>01258
1262 <a name="l01259"></a>01259   <span class="comment">/*  Calculation of Middle stage */</span>
1263 <a name="l01260"></a>01260   <span class="keywordflow">for</span> (k = fftLen / 4u; k &gt; 4u; k &gt;&gt;= 2u)
1264 <a name="l01261"></a>01261   {
1265 <a name="l01262"></a>01262     <span class="comment">/*  Initializations for the middle stage */</span>
1266 <a name="l01263"></a>01263     n1 = n2;
1267 <a name="l01264"></a>01264     n2 &gt;&gt;= 2u;
1268 <a name="l01265"></a>01265     ic = 0u;
1269 <a name="l01266"></a>01266
1270 <a name="l01267"></a>01267     <span class="keywordflow">for</span> (j = 0u; j &lt;= (n2 - 1u); j++)
1271 <a name="l01268"></a>01268     {
1272 <a name="l01269"></a>01269       <span class="comment">/*  index calculation for the coefficients */</span>
1273 <a name="l01270"></a>01270       C1 = pCoeff[ic];
1274 <a name="l01271"></a>01271       C2 = pCoeff[2u * ic];
1275 <a name="l01272"></a>01272       C3 = pCoeff[3u * ic];
1276 <a name="l01273"></a>01273
1277 <a name="l01274"></a>01274       <span class="comment">/*  Twiddle coefficients index modifier */</span>
1278 <a name="l01275"></a>01275       ic = ic + twidCoefModifier;
1279 <a name="l01276"></a>01276
1280 <a name="l01277"></a>01277       <span class="comment">/*  Butterfly implementation */</span>
1281 <a name="l01278"></a>01278       <span class="keywordflow">for</span> (i0 = j; i0 &lt; fftLen; i0 += n1)
1282 <a name="l01279"></a>01279       {
1283 <a name="l01280"></a>01280         <span class="comment">/*  index calculation for the input as, */</span>
1284 <a name="l01281"></a>01281         <span class="comment">/*  pSrc[i0 + 0], pSrc[i0 + fftLen/4], pSrc[i0 + fftLen/2], pSrc[i0 + 3fftLen/4] */</span>
1285 <a name="l01282"></a>01282         i1 = i0 + n2;
1286 <a name="l01283"></a>01283         i2 = i1 + n2;
1287 <a name="l01284"></a>01284         i3 = i2 + n2;
1288 <a name="l01285"></a>01285
1289 <a name="l01286"></a>01286         <span class="comment">/*  Reading i0, i0+fftLen/2 inputs */</span>
1290 <a name="l01287"></a>01287         <span class="comment">/* Read ya (real), xa(imag) input */</span>
1291 <a name="l01288"></a>01288         T = pSrc[i0];
1292 <a name="l01289"></a>01289
1293 <a name="l01290"></a>01290         <span class="comment">/* Read yc (real), xc(imag) input */</span>
1294 <a name="l01291"></a>01291         S = pSrc[i2];
1295 <a name="l01292"></a>01292
1296 <a name="l01293"></a>01293
1297 <a name="l01294"></a>01294         <span class="comment">/* R = packed( (ya + yc), (xa + xc)) */</span>
1298 <a name="l01295"></a>01295         R = __QADD16(T, S);
1299 <a name="l01296"></a>01296         <span class="comment">/* S = packed((ya - yc), (xa - xc)) */</span>
1300 <a name="l01297"></a>01297         S = __QSUB16(T, S);
1301 <a name="l01298"></a>01298
1302 <a name="l01299"></a>01299         <span class="comment">/*  Reading i0+fftLen/4 , i0+3fftLen/4 inputs */</span>
1303 <a name="l01300"></a>01300         <span class="comment">/* Read yb (real), xb(imag) input */</span>
1304 <a name="l01301"></a>01301         T = pSrc[i1];
1305 <a name="l01302"></a>01302
1306 <a name="l01303"></a>01303         <span class="comment">/* Read yd (real), xd(imag) input */</span>
1307 <a name="l01304"></a>01304         U = pSrc[i3];
1308 <a name="l01305"></a>01305
1309 <a name="l01306"></a>01306
1310 <a name="l01307"></a>01307         <span class="comment">/* T = packed( (yb + yd), (xb + xd)) */</span>
1311 <a name="l01308"></a>01308         T = __QADD16(T, U);
1312 <a name="l01309"></a>01309
1313 <a name="l01310"></a>01310         <span class="comment">/*  writing the butterfly processed i0 sample */</span>
1314 <a name="l01311"></a>01311         <span class="comment">/* xa&#39; = xa + xb + xc + xd */</span>
1315 <a name="l01312"></a>01312         <span class="comment">/* ya&#39; = ya + yb + yc + yd */</span>
1316 <a name="l01313"></a>01313         out1 = __SHADD16(R, T);
1317 <a name="l01314"></a>01314         in = ((int16_t) (out1 &amp; 0xFFFF)) &gt;&gt; 1;
1318 <a name="l01315"></a>01315         out1 = ((out1 &gt;&gt; 1) &amp; 0xFFFF0000) | (in &amp; 0xFFFF);
1319 <a name="l01316"></a>01316         pSrc[i0] = out1;
1320 <a name="l01317"></a>01317
1321 <a name="l01318"></a>01318
1322 <a name="l01319"></a>01319
1323 <a name="l01320"></a>01320         <span class="comment">/* R = packed( (ya + yc) - (yb + yd), (xa + xc) - (xb + xd)) */</span>
1324 <a name="l01321"></a>01321         R = __SHSUB16(R, T);
1325 <a name="l01322"></a>01322
1326 <a name="l01323"></a>01323
1327 <a name="l01324"></a>01324 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
1328 <a name="l01325"></a>01325 <span class="preprocessor"></span>
1329 <a name="l01326"></a>01326         <span class="comment">/* (ya-yb+yc-yd)* (si2) - (xa-xb+xc-xd)* co2 */</span>
1330 <a name="l01327"></a>01327         out1 = __SMUSD(C2, R) &gt;&gt; 16u;
1331 <a name="l01328"></a>01328         <span class="comment">/* (ya-yb+yc-yd)* co2 + (xa-xb+xc-xd)* (si2) */</span>
1332 <a name="l01329"></a>01329         out2 = __SMUADX(C2, R);
1333 <a name="l01330"></a>01330
1334 <a name="l01331"></a>01331 <span class="preprocessor">#else</span>
1335 <a name="l01332"></a>01332 <span class="preprocessor"></span>
1336 <a name="l01333"></a>01333         <span class="comment">/* (ya-yb+yc-yd)* co2 + (xa-xb+xc-xd)* (si2) */</span>
1337 <a name="l01334"></a>01334         out1 = __SMUADX(R, C2) &gt;&gt; 16u;
1338 <a name="l01335"></a>01335         <span class="comment">/* (ya-yb+yc-yd)* (si2) - (xa-xb+xc-xd)* co2 */</span>
1339 <a name="l01336"></a>01336         out2 = __SMUSD(-C2, R);
1340 <a name="l01337"></a>01337
1341 <a name="l01338"></a>01338 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
1342 <a name="l01339"></a>01339
1343 <a name="l01340"></a>01340         <span class="comment">/*  Reading i0+3fftLen/4 */</span>
1344 <a name="l01341"></a>01341         <span class="comment">/* Read yb (real), xb(imag) input */</span>
1345 <a name="l01342"></a>01342         T = pSrc[i1];
1346 <a name="l01343"></a>01343
1347 <a name="l01344"></a>01344         <span class="comment">/*  writing the butterfly processed i0 + fftLen/4 sample */</span>
1348 <a name="l01345"></a>01345         <span class="comment">/* xc&#39; = (xa-xb+xc-xd)* co2 - (ya-yb+yc-yd)* (si2) */</span>
1349 <a name="l01346"></a>01346         <span class="comment">/* yc&#39; = (ya-yb+yc-yd)* co2 + (xa-xb+xc-xd)* (si2) */</span>
1350 <a name="l01347"></a>01347         pSrc[i1] = ((out2) &amp; 0xFFFF0000) | (out1 &amp; 0x0000FFFF);
1351 <a name="l01348"></a>01348
1352 <a name="l01349"></a>01349         <span class="comment">/*  Butterfly calculations */</span>
1353 <a name="l01350"></a>01350         <span class="comment">/* Read yd (real), xd(imag) input */</span>
1354 <a name="l01351"></a>01351         U = pSrc[i3];
1355 <a name="l01352"></a>01352
1356 <a name="l01353"></a>01353         <span class="comment">/* T = packed(yb-yd, xb-xd) */</span>
1357 <a name="l01354"></a>01354         T = __QSUB16(T, U);
1358 <a name="l01355"></a>01355
1359 <a name="l01356"></a>01356
1360 <a name="l01357"></a>01357 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
1361 <a name="l01358"></a>01358 <span class="preprocessor"></span>
1362 <a name="l01359"></a>01359         <span class="comment">/* R = packed((ya-yc) - (xb- xd) , (xa-xc) + (yb-yd)) */</span>
1363 <a name="l01360"></a>01360         R = __SHSAX(S, T);
1364 <a name="l01361"></a>01361
1365 <a name="l01362"></a>01362         <span class="comment">/* S = packed((ya-yc) + (xb- xd),  (xa-xc) - (yb-yd)) */</span>
1366 <a name="l01363"></a>01363         S = __SHASX(S, T);
1367 <a name="l01364"></a>01364         <span class="comment">/*  Butterfly process for the i0+fftLen/2 sample */</span>
1368 <a name="l01365"></a>01365         out1 = __SMUSD(C1, S) &gt;&gt; 16u;
1369 <a name="l01366"></a>01366         out2 = __SMUADX(C1, S);
1370 <a name="l01367"></a>01367
1371 <a name="l01368"></a>01368 <span class="preprocessor">#else</span>
1372 <a name="l01369"></a>01369 <span class="preprocessor"></span>
1373 <a name="l01370"></a>01370         <span class="comment">/* R = packed((ya-yc) - (xb- xd) , (xa-xc) + (yb-yd)) */</span>
1374 <a name="l01371"></a>01371         R = __SHASX(S, T);
1375 <a name="l01372"></a>01372
1376 <a name="l01373"></a>01373         <span class="comment">/* S = packed((ya-yc) + (xb- xd),  (xa-xc) - (yb-yd)) */</span>
1377 <a name="l01374"></a>01374         S = __SHSAX(S, T);
1378 <a name="l01375"></a>01375         <span class="comment">/*  Butterfly process for the i0+fftLen/2 sample */</span>
1379 <a name="l01376"></a>01376         out1 = __SMUADX(S, C1) &gt;&gt; 16u;
1380 <a name="l01377"></a>01377         out2 = __SMUSD(-C1, S);
1381 <a name="l01378"></a>01378
1382 <a name="l01379"></a>01379 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
1383 <a name="l01380"></a>01380
1384 <a name="l01381"></a>01381         <span class="comment">/* xb&#39; = (xa-yb-xc+yd)* co1 - (ya+xb-yc-xd)* (si1) */</span>
1385 <a name="l01382"></a>01382         <span class="comment">/* yb&#39; = (ya+xb-yc-xd)* co1 + (xa-yb-xc+yd)* (si1) */</span>
1386 <a name="l01383"></a>01383         pSrc[i2] = ((out2) &amp; 0xFFFF0000) | (out1 &amp; 0x0000FFFF);
1387 <a name="l01384"></a>01384
1388 <a name="l01385"></a>01385         <span class="comment">/*  Butterfly process for the i0+3fftLen/4 sample */</span>
1389 <a name="l01386"></a>01386
1390 <a name="l01387"></a>01387 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
1391 <a name="l01388"></a>01388 <span class="preprocessor"></span>
1392 <a name="l01389"></a>01389         out1 = __SMUSD(C3, R) &gt;&gt; 16u;
1393 <a name="l01390"></a>01390         out2 = __SMUADX(C3, R);
1394 <a name="l01391"></a>01391
1395 <a name="l01392"></a>01392 <span class="preprocessor">#else</span>
1396 <a name="l01393"></a>01393 <span class="preprocessor"></span>
1397 <a name="l01394"></a>01394         out1 = __SMUADX(C3, R) &gt;&gt; 16u;
1398 <a name="l01395"></a>01395         out2 = __SMUSD(-C3, R);
1399 <a name="l01396"></a>01396
1400 <a name="l01397"></a>01397 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
1401 <a name="l01398"></a>01398
1402 <a name="l01399"></a>01399         <span class="comment">/* xd&#39; = (xa+yb-xc-yd)* co3 - (ya-xb-yc+xd)* (si3) */</span>
1403 <a name="l01400"></a>01400         <span class="comment">/* yd&#39; = (ya-xb-yc+xd)* co3 + (xa+yb-xc-yd)* (si3) */</span>
1404 <a name="l01401"></a>01401         pSrc[i3] = ((out2) &amp; 0xFFFF0000) | (out1 &amp; 0x0000FFFF);
1405 <a name="l01402"></a>01402
1406 <a name="l01403"></a>01403
1407 <a name="l01404"></a>01404       }
1408 <a name="l01405"></a>01405     }
1409 <a name="l01406"></a>01406     <span class="comment">/*  Twiddle coefficients index modifier */</span>
1410 <a name="l01407"></a>01407     twidCoefModifier &lt;&lt;= 2u;
1411 <a name="l01408"></a>01408   }
1412 <a name="l01409"></a>01409   <span class="comment">/*  End of Middle stages process */</span>
1413 <a name="l01410"></a>01410
1414 <a name="l01411"></a>01411
1415 <a name="l01412"></a>01412   <span class="comment">/* data is in 10.6(q6) format for the 1024 point */</span>
1416 <a name="l01413"></a>01413   <span class="comment">/* data is in 8.8(q8) format for the 256 point   */</span>
1417 <a name="l01414"></a>01414   <span class="comment">/* data is in 6.10(q10) format for the 64 point  */</span>
1418 <a name="l01415"></a>01415   <span class="comment">/* data is in 4.12(q12) format for the 16 point  */</span>
1419 <a name="l01416"></a>01416
1420 <a name="l01417"></a>01417   <span class="comment">/* start of last stage process */</span>
1421 <a name="l01418"></a>01418
1422 <a name="l01419"></a>01419
1423 <a name="l01420"></a>01420   <span class="comment">/*  Initializations for the last stage */</span>
1424 <a name="l01421"></a>01421   n1 = n2;
1425 <a name="l01422"></a>01422   n2 &gt;&gt;= 2u;
1426 <a name="l01423"></a>01423
1427 <a name="l01424"></a>01424   <span class="comment">/*  Butterfly implementation */</span>
1428 <a name="l01425"></a>01425   <span class="keywordflow">for</span> (i0 = 0u; i0 &lt;= (fftLen - n1); i0 += n1)
1429 <a name="l01426"></a>01426   {
1430 <a name="l01427"></a>01427     <span class="comment">/*  index calculation for the input as, */</span>
1431 <a name="l01428"></a>01428     <span class="comment">/*  pSrc[i0 + 0], pSrc[i0 + fftLen/4], pSrc[i0 + fftLen/2], pSrc[i0 + 3fftLen/4] */</span>
1432 <a name="l01429"></a>01429     i1 = i0 + n2;
1433 <a name="l01430"></a>01430     i2 = i1 + n2;
1434 <a name="l01431"></a>01431     i3 = i2 + n2;
1435 <a name="l01432"></a>01432
1436 <a name="l01433"></a>01433     <span class="comment">/*  Reading i0, i0+fftLen/2 inputs */</span>
1437 <a name="l01434"></a>01434     <span class="comment">/* Read ya (real), xa(imag) input */</span>
1438 <a name="l01435"></a>01435     T = pSrc[i0];
1439 <a name="l01436"></a>01436     <span class="comment">/* Read yc (real), xc(imag) input */</span>
1440 <a name="l01437"></a>01437     S = pSrc[i2];
1441 <a name="l01438"></a>01438
1442 <a name="l01439"></a>01439     <span class="comment">/* R = packed((ya + yc), (xa + xc)) */</span>
1443 <a name="l01440"></a>01440     R = __QADD16(T, S);
1444 <a name="l01441"></a>01441     <span class="comment">/* S = packed((ya - yc), (xa - xc)) */</span>
1445 <a name="l01442"></a>01442     S = __QSUB16(T, S);
1446 <a name="l01443"></a>01443
1447 <a name="l01444"></a>01444     <span class="comment">/*  Reading i0+fftLen/4 , i0+3fftLen/4 inputs */</span>
1448 <a name="l01445"></a>01445     <span class="comment">/* Read yb (real), xb(imag) input */</span>
1449 <a name="l01446"></a>01446     T = pSrc[i1];
1450 <a name="l01447"></a>01447     <span class="comment">/* Read yd (real), xd(imag) input */</span>
1451 <a name="l01448"></a>01448     U = pSrc[i3];
1452 <a name="l01449"></a>01449
1453 <a name="l01450"></a>01450     <span class="comment">/* T = packed((yb + yd), (xb + xd)) */</span>
1454 <a name="l01451"></a>01451     T = __QADD16(T, U);
1455 <a name="l01452"></a>01452
1456 <a name="l01453"></a>01453     <span class="comment">/*  writing the butterfly processed i0 sample */</span>
1457 <a name="l01454"></a>01454     <span class="comment">/* xa&#39; = xa + xb + xc + xd */</span>
1458 <a name="l01455"></a>01455     <span class="comment">/* ya&#39; = ya + yb + yc + yd */</span>
1459 <a name="l01456"></a>01456     pSrc[i0] = __SHADD16(R, T);
1460 <a name="l01457"></a>01457
1461 <a name="l01458"></a>01458     <span class="comment">/* R = packed((ya + yc) - (yb + yd), (xa + xc) - (xb + xd)) */</span>
1462 <a name="l01459"></a>01459     R = __SHSUB16(R, T);
1463 <a name="l01460"></a>01460
1464 <a name="l01461"></a>01461     <span class="comment">/* Read yb (real), xb(imag) input */</span>
1465 <a name="l01462"></a>01462     T = pSrc[i1];
1466 <a name="l01463"></a>01463
1467 <a name="l01464"></a>01464     <span class="comment">/*  writing the butterfly processed i0 + fftLen/4 sample */</span>
1468 <a name="l01465"></a>01465     <span class="comment">/* xc&#39; = (xa-xb+xc-xd) */</span>
1469 <a name="l01466"></a>01466     <span class="comment">/* yc&#39; = (ya-yb+yc-yd) */</span>
1470 <a name="l01467"></a>01467     pSrc[i1] = R;
1471 <a name="l01468"></a>01468
1472 <a name="l01469"></a>01469     <span class="comment">/* Read yd (real), xd(imag) input */</span>
1473 <a name="l01470"></a>01470     U = pSrc[i3];
1474 <a name="l01471"></a>01471     <span class="comment">/* T = packed( (yb - yd), (xb - xd))  */</span>
1475 <a name="l01472"></a>01472     T = __QSUB16(T, U);
1476 <a name="l01473"></a>01473
1477 <a name="l01474"></a>01474
1478 <a name="l01475"></a>01475 <span class="preprocessor">#ifndef ARM_MATH_BIG_ENDIAN</span>
1479 <a name="l01476"></a>01476 <span class="preprocessor"></span>
1480 <a name="l01477"></a>01477     <span class="comment">/*  writing the butterfly processed i0 + fftLen/2 sample */</span>
1481 <a name="l01478"></a>01478     <span class="comment">/* xb&#39; = (xa-yb-xc+yd) */</span>
1482 <a name="l01479"></a>01479     <span class="comment">/* yb&#39; = (ya+xb-yc-xd) */</span>
1483 <a name="l01480"></a>01480     pSrc[i2] = __SHASX(S, T);
1484 <a name="l01481"></a>01481
1485 <a name="l01482"></a>01482     <span class="comment">/*  writing the butterfly processed i0 + 3fftLen/4 sample */</span>
1486 <a name="l01483"></a>01483     <span class="comment">/* xd&#39; = (xa+yb-xc-yd) */</span>
1487 <a name="l01484"></a>01484     <span class="comment">/* yd&#39; = (ya-xb-yc+xd) */</span>
1488 <a name="l01485"></a>01485     pSrc[i3] = __SHSAX(S, T);
1489 <a name="l01486"></a>01486
1490 <a name="l01487"></a>01487
1491 <a name="l01488"></a>01488 <span class="preprocessor">#else</span>
1492 <a name="l01489"></a>01489 <span class="preprocessor"></span>
1493 <a name="l01490"></a>01490     <span class="comment">/*  writing the butterfly processed i0 + fftLen/2 sample */</span>
1494 <a name="l01491"></a>01491     <span class="comment">/* xb&#39; = (xa-yb-xc+yd) */</span>
1495 <a name="l01492"></a>01492     <span class="comment">/* yb&#39; = (ya+xb-yc-xd) */</span>
1496 <a name="l01493"></a>01493     pSrc[i2] = __SHSAX(S, T);
1497 <a name="l01494"></a>01494
1498 <a name="l01495"></a>01495     <span class="comment">/*  writing the butterfly processed i0 + 3fftLen/4 sample */</span>
1499 <a name="l01496"></a>01496     <span class="comment">/* xd&#39; = (xa+yb-xc-yd) */</span>
1500 <a name="l01497"></a>01497     <span class="comment">/* yd&#39; = (ya-xb-yc+xd) */</span>
1501 <a name="l01498"></a>01498     pSrc[i3] = __SHASX(S, T);
1502 <a name="l01499"></a>01499
1503 <a name="l01500"></a>01500 <span class="preprocessor">#endif </span><span class="comment">/*      #ifndef ARM_MATH_BIG_ENDIAN     */</span>
1504 <a name="l01501"></a>01501
1505 <a name="l01502"></a>01502   }
1506 <a name="l01503"></a>01503   <span class="comment">/* end of last stage  process */</span>
1507 <a name="l01504"></a>01504
1508 <a name="l01505"></a>01505   <span class="comment">/* output is in 11.5(q5) format for the 1024 point */</span>
1509 <a name="l01506"></a>01506   <span class="comment">/* output is in 9.7(q7) format for the 256 point   */</span>
1510 <a name="l01507"></a>01507   <span class="comment">/* output is in 7.9(q9) format for the 64 point  */</span>
1511 <a name="l01508"></a>01508   <span class="comment">/* output is in 5.11(q11) format for the 16 point  */</span>
1512 <a name="l01509"></a>01509
1513 <a name="l01510"></a>01510
1514 <a name="l01511"></a>01511 <span class="preprocessor">#else</span>
1515 <a name="l01512"></a>01512 <span class="preprocessor"></span>
1516 <a name="l01513"></a>01513   <span class="comment">/* Run the below code for Cortex-M0 */</span>
1517 <a name="l01514"></a>01514
1518 <a name="l01515"></a>01515   <a class="code" href="arm__math_8h.html#ab5a8fb21a5b3b983d5f54f31614052ea" title="16-bit fractional data type in 1.15 format.">q15_t</a> R0, R1, S0, S1, T0, T1, U0, U1;
1519 <a name="l01516"></a>01516   <a class="code" href="arm__math_8h.html#ab5a8fb21a5b3b983d5f54f31614052ea" title="16-bit fractional data type in 1.15 format.">q15_t</a> Co1, Si1, Co2, Si2, Co3, Si3, out1, out2;
1520 <a name="l01517"></a>01517   uint32_t n1, n2, ic, i0, i1, i2, i3, j, k;
1521 <a name="l01518"></a>01518
1522 <a name="l01519"></a>01519   <span class="comment">/* Total process is divided into three stages */</span>
1523 <a name="l01520"></a>01520
1524 <a name="l01521"></a>01521   <span class="comment">/* process first stage, middle stages, &amp; last stage */</span>
1525 <a name="l01522"></a>01522
1526 <a name="l01523"></a>01523   <span class="comment">/*  Initializations for the first stage */</span>
1527 <a name="l01524"></a>01524   n2 = fftLen;
1528 <a name="l01525"></a>01525   n1 = n2;
1529 <a name="l01526"></a>01526
1530 <a name="l01527"></a>01527   <span class="comment">/* n2 = fftLen/4 */</span>
1531 <a name="l01528"></a>01528   n2 &gt;&gt;= 2u;
1532 <a name="l01529"></a>01529
1533 <a name="l01530"></a>01530   <span class="comment">/* Index for twiddle coefficient */</span>
1534 <a name="l01531"></a>01531   ic = 0u;
1535 <a name="l01532"></a>01532
1536 <a name="l01533"></a>01533   <span class="comment">/* Index for input read and output write */</span>
1537 <a name="l01534"></a>01534   i0 = 0u;
1538 <a name="l01535"></a>01535
1539 <a name="l01536"></a>01536   j = n2;
1540 <a name="l01537"></a>01537
1541 <a name="l01538"></a>01538   <span class="comment">/* Input is in 1.15(q15) format */</span>
1542 <a name="l01539"></a>01539
1543 <a name="l01540"></a>01540   <span class="comment">/*  Start of first stage process */</span>
1544 <a name="l01541"></a>01541   <span class="keywordflow">do</span>
1545 <a name="l01542"></a>01542   {
1546 <a name="l01543"></a>01543     <span class="comment">/*  Butterfly implementation */</span>
1547 <a name="l01544"></a>01544
1548 <a name="l01545"></a>01545     <span class="comment">/*  index calculation for the input as, */</span>
1549 <a name="l01546"></a>01546     <span class="comment">/*  pSrc16[i0 + 0], pSrc16[i0 + fftLen/4], pSrc16[i0 + fftLen/2], pSrc16[i0 + 3fftLen/4] */</span>
1550 <a name="l01547"></a>01547     i1 = i0 + n2;
1551 <a name="l01548"></a>01548     i2 = i1 + n2;
1552 <a name="l01549"></a>01549     i3 = i2 + n2;
1553 <a name="l01550"></a>01550
1554 <a name="l01551"></a>01551     <span class="comment">/*  Reading i0, i0+fftLen/2 inputs */</span>
1555 <a name="l01552"></a>01552     <span class="comment">/* input is down scale by 4 to avoid overflow */</span>
1556 <a name="l01553"></a>01553     <span class="comment">/* Read ya (real), xa(imag) input */</span>
1557 <a name="l01554"></a>01554     T0 = pSrc16[i0 * 2u] &gt;&gt; 2u;
1558 <a name="l01555"></a>01555     T1 = pSrc16[(i0 * 2u) + 1u] &gt;&gt; 2u;
1559 <a name="l01556"></a>01556     <span class="comment">/* input is down scale by 4 to avoid overflow */</span>
1560 <a name="l01557"></a>01557     <span class="comment">/* Read yc (real), xc(imag) input */</span>
1561 <a name="l01558"></a>01558     S0 = pSrc16[i2 * 2u] &gt;&gt; 2u;
1562 <a name="l01559"></a>01559     S1 = pSrc16[(i2 * 2u) + 1u] &gt;&gt; 2u;
1563 <a name="l01560"></a>01560
1564 <a name="l01561"></a>01561     <span class="comment">/* R0 = (ya + yc), R1 = (xa + xc) */</span>
1565 <a name="l01562"></a>01562     R0 = __SSAT(T0 + S0, 16u);
1566 <a name="l01563"></a>01563     R1 = __SSAT(T1 + S1, 16u);
1567 <a name="l01564"></a>01564     <span class="comment">/* S0 = (ya - yc), S1 = (xa - xc) */</span>
1568 <a name="l01565"></a>01565     S0 = __SSAT(T0 - S0, 16u);
1569 <a name="l01566"></a>01566     S1 = __SSAT(T1 - S1, 16u);
1570 <a name="l01567"></a>01567
1571 <a name="l01568"></a>01568     <span class="comment">/*  Reading i0+fftLen/4 , i0+3fftLen/4 inputs */</span>
1572 <a name="l01569"></a>01569     <span class="comment">/* input is down scale by 4 to avoid overflow */</span>
1573 <a name="l01570"></a>01570     <span class="comment">/* Read yb (real), xb(imag) input */</span>
1574 <a name="l01571"></a>01571     T0 = pSrc16[i1 * 2u] &gt;&gt; 2u;
1575 <a name="l01572"></a>01572     T1 = pSrc16[(i1 * 2u) + 1u] &gt;&gt; 2u;
1576 <a name="l01573"></a>01573     <span class="comment">/* Read yd (real), xd(imag) input */</span>
1577 <a name="l01574"></a>01574     <span class="comment">/* input is down scale by 4 to avoid overflow */</span>
1578 <a name="l01575"></a>01575     U0 = pSrc16[i3 * 2u] &gt;&gt; 2u;
1579 <a name="l01576"></a>01576     U1 = pSrc16[(i3 * 2u) + 1u] &gt;&gt; 2u;
1580 <a name="l01577"></a>01577
1581 <a name="l01578"></a>01578     <span class="comment">/* T0 = (yb + yd), T1 = (xb + xd) */</span>
1582 <a name="l01579"></a>01579     T0 = __SSAT(T0 + U0, 16u);
1583 <a name="l01580"></a>01580     T1 = __SSAT(T1 + U1, 16u);
1584 <a name="l01581"></a>01581
1585 <a name="l01582"></a>01582     <span class="comment">/*  writing the butterfly processed i0 sample */</span>
1586 <a name="l01583"></a>01583     <span class="comment">/* xa&#39; = xa + xb + xc + xd */</span>
1587 <a name="l01584"></a>01584     <span class="comment">/* ya&#39; = ya + yb + yc + yd */</span>
1588 <a name="l01585"></a>01585     pSrc16[i0 * 2u] = (R0 &gt;&gt; 1u) + (T0 &gt;&gt; 1u);
1589 <a name="l01586"></a>01586     pSrc16[(i0 * 2u) + 1u] = (R1 &gt;&gt; 1u) + (T1 &gt;&gt; 1u);
1590 <a name="l01587"></a>01587
1591 <a name="l01588"></a>01588     <span class="comment">/* R0 = (ya + yc) - (yb + yd), R1 = (xa + xc)- (xb + xd) */</span>
1592 <a name="l01589"></a>01589     R0 = __SSAT(R0 - T0, 16u);
1593 <a name="l01590"></a>01590     R1 = __SSAT(R1 - T1, 16u);
1594 <a name="l01591"></a>01591     <span class="comment">/* co2 &amp; si2 are read from Coefficient pointer */</span>
1595 <a name="l01592"></a>01592     Co2 = pCoef16[2u * ic * 2u];
1596 <a name="l01593"></a>01593     Si2 = pCoef16[(2u * ic * 2u) + 1u];
1597 <a name="l01594"></a>01594     <span class="comment">/* xc&#39; = (xa-xb+xc-xd)* co2 - (ya-yb+yc-yd)* (si2) */</span>
1598 <a name="l01595"></a>01595     out1 = (short) ((Co2 * R0 - Si2 * R1) &gt;&gt; 16u);
1599 <a name="l01596"></a>01596     <span class="comment">/* yc&#39; = (ya-yb+yc-yd)* co2 + (xa-xb+xc-xd)* (si2) */</span>
1600 <a name="l01597"></a>01597     out2 = (short) ((Si2 * R0 + Co2 * R1) &gt;&gt; 16u);
1601 <a name="l01598"></a>01598
1602 <a name="l01599"></a>01599     <span class="comment">/*  Reading i0+fftLen/4 */</span>
1603 <a name="l01600"></a>01600     <span class="comment">/* input is down scale by 4 to avoid overflow */</span>
1604 <a name="l01601"></a>01601     <span class="comment">/* T0 = yb, T1 = xb */</span>
1605 <a name="l01602"></a>01602     T0 = pSrc16[i1 * 2u] &gt;&gt; 2u;
1606 <a name="l01603"></a>01603     T1 = pSrc16[(i1 * 2u) + 1u] &gt;&gt; 2u;
1607 <a name="l01604"></a>01604
1608 <a name="l01605"></a>01605     <span class="comment">/* writing the butterfly processed i0 + fftLen/4 sample */</span>
1609 <a name="l01606"></a>01606     <span class="comment">/* writing output(xc&#39;, yc&#39;) in little endian format */</span>
1610 <a name="l01607"></a>01607     pSrc16[i1 * 2u] = out1;
1611 <a name="l01608"></a>01608     pSrc16[(i1 * 2u) + 1u] = out2;
1612 <a name="l01609"></a>01609
1613 <a name="l01610"></a>01610     <span class="comment">/*  Butterfly calculations */</span>
1614 <a name="l01611"></a>01611     <span class="comment">/* input is down scale by 4 to avoid overflow */</span>
1615 <a name="l01612"></a>01612     <span class="comment">/* U0 = yd, U1 = xd) */</span>
1616 <a name="l01613"></a>01613     U0 = pSrc16[i3 * 2u] &gt;&gt; 2u;
1617 <a name="l01614"></a>01614     U1 = pSrc16[(i3 * 2u) + 1u] &gt;&gt; 2u;
1618 <a name="l01615"></a>01615
1619 <a name="l01616"></a>01616     <span class="comment">/* T0 = yb-yd, T1 = xb-xd) */</span>
1620 <a name="l01617"></a>01617     T0 = __SSAT(T0 - U0, 16u);
1621 <a name="l01618"></a>01618     T1 = __SSAT(T1 - U1, 16u);
1622 <a name="l01619"></a>01619     <span class="comment">/* R0 = (ya-yc) - (xb- xd) , R1 = (xa-xc) + (yb-yd) */</span>
1623 <a name="l01620"></a>01620     R0 = (short) __SSAT((<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a>) (S0 + T1), 16);
1624 <a name="l01621"></a>01621     R1 = (short) __SSAT((<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a>) (S1 - T0), 16);
1625 <a name="l01622"></a>01622     <span class="comment">/* S = (ya-yc) + (xb- xd), S1 = (xa-xc) - (yb-yd) */</span>
1626 <a name="l01623"></a>01623     S0 = (short) __SSAT((<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a>) (S0 - T1), 16);
1627 <a name="l01624"></a>01624     S1 = (short) __SSAT((<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a>) (S1 + T0), 16);
1628 <a name="l01625"></a>01625
1629 <a name="l01626"></a>01626     <span class="comment">/* co1 &amp; si1 are read from Coefficient pointer */</span>
1630 <a name="l01627"></a>01627     Co1 = pCoef16[ic * 2u];
1631 <a name="l01628"></a>01628     Si1 = pCoef16[(ic * 2u) + 1u];
1632 <a name="l01629"></a>01629     <span class="comment">/*  Butterfly process for the i0+fftLen/2 sample */</span>
1633 <a name="l01630"></a>01630     <span class="comment">/* xb&#39; = (xa-yb-xc+yd)* co1 - (ya+xb-yc-xd)* (si1) */</span>
1634 <a name="l01631"></a>01631     out1 = (short) ((Co1 * S0 - Si1 * S1) &gt;&gt; 16u);
1635 <a name="l01632"></a>01632     <span class="comment">/* yb&#39; = (ya+xb-yc-xd)* co1 + (xa-yb-xc+yd)* (si1) */</span>
1636 <a name="l01633"></a>01633     out2 = (short) ((Si1 * S0 + Co1 * S1) &gt;&gt; 16u);
1637 <a name="l01634"></a>01634     <span class="comment">/* writing output(xb&#39;, yb&#39;) in little endian format */</span>
1638 <a name="l01635"></a>01635     pSrc16[i2 * 2u] = out1;
1639 <a name="l01636"></a>01636     pSrc16[(i2 * 2u) + 1u] = out2;
1640 <a name="l01637"></a>01637
1641 <a name="l01638"></a>01638     <span class="comment">/* Co3 &amp; si3 are read from Coefficient pointer */</span>
1642 <a name="l01639"></a>01639     Co3 = pCoef16[3u * ic * 2u];
1643 <a name="l01640"></a>01640     Si3 = pCoef16[(3u * ic * 2u) + 1u];
1644 <a name="l01641"></a>01641     <span class="comment">/*  Butterfly process for the i0+3fftLen/4 sample */</span>
1645 <a name="l01642"></a>01642     <span class="comment">/* xd&#39; = (xa+yb-xc-yd)* Co3 - (ya-xb-yc+xd)* (si3) */</span>
1646 <a name="l01643"></a>01643     out1 = (short) ((Co3 * R0 - Si3 * R1) &gt;&gt; 16u);
1647 <a name="l01644"></a>01644     <span class="comment">/* yd&#39; = (ya-xb-yc+xd)* Co3 + (xa+yb-xc-yd)* (si3) */</span>
1648 <a name="l01645"></a>01645     out2 = (short) ((Si3 * R0 + Co3 * R1) &gt;&gt; 16u);
1649 <a name="l01646"></a>01646     <span class="comment">/* writing output(xd&#39;, yd&#39;) in little endian format */</span>
1650 <a name="l01647"></a>01647     pSrc16[i3 * 2u] = out1;
1651 <a name="l01648"></a>01648     pSrc16[(i3 * 2u) + 1u] = out2;
1652 <a name="l01649"></a>01649
1653 <a name="l01650"></a>01650     <span class="comment">/*  Twiddle coefficients index modifier */</span>
1654 <a name="l01651"></a>01651     ic = ic + twidCoefModifier;
1655 <a name="l01652"></a>01652
1656 <a name="l01653"></a>01653     <span class="comment">/*  Updating input index */</span>
1657 <a name="l01654"></a>01654     i0 = i0 + 1u;
1658 <a name="l01655"></a>01655
1659 <a name="l01656"></a>01656   } <span class="keywordflow">while</span>(--j);
1660 <a name="l01657"></a>01657
1661 <a name="l01658"></a>01658   <span class="comment">/*  End of first stage process */</span>
1662 <a name="l01659"></a>01659
1663 <a name="l01660"></a>01660   <span class="comment">/* data is in 4.11(q11) format */</span>
1664 <a name="l01661"></a>01661
1665 <a name="l01662"></a>01662
1666 <a name="l01663"></a>01663   <span class="comment">/*  Start of Middle stage process */</span>
1667 <a name="l01664"></a>01664
1668 <a name="l01665"></a>01665   <span class="comment">/*  Twiddle coefficients index modifier */</span>
1669 <a name="l01666"></a>01666   twidCoefModifier &lt;&lt;= 2u;
1670 <a name="l01667"></a>01667
1671 <a name="l01668"></a>01668   <span class="comment">/*  Calculation of Middle stage */</span>
1672 <a name="l01669"></a>01669   <span class="keywordflow">for</span> (k = fftLen / 4u; k &gt; 4u; k &gt;&gt;= 2u)
1673 <a name="l01670"></a>01670   {
1674 <a name="l01671"></a>01671     <span class="comment">/*  Initializations for the middle stage */</span>
1675 <a name="l01672"></a>01672     n1 = n2;
1676 <a name="l01673"></a>01673     n2 &gt;&gt;= 2u;
1677 <a name="l01674"></a>01674     ic = 0u;
1678 <a name="l01675"></a>01675
1679 <a name="l01676"></a>01676     <span class="keywordflow">for</span> (j = 0u; j &lt;= (n2 - 1u); j++)
1680 <a name="l01677"></a>01677     {
1681 <a name="l01678"></a>01678       <span class="comment">/*  index calculation for the coefficients */</span>
1682 <a name="l01679"></a>01679       Co1 = pCoef16[ic * 2u];
1683 <a name="l01680"></a>01680       Si1 = pCoef16[(ic * 2u) + 1u];
1684 <a name="l01681"></a>01681       Co2 = pCoef16[2u * ic * 2u];
1685 <a name="l01682"></a>01682       Si2 = pCoef16[2u * ic * 2u + 1u];
1686 <a name="l01683"></a>01683       Co3 = pCoef16[3u * ic * 2u];
1687 <a name="l01684"></a>01684       Si3 = pCoef16[(3u * ic * 2u) + 1u];
1688 <a name="l01685"></a>01685
1689 <a name="l01686"></a>01686       <span class="comment">/*  Twiddle coefficients index modifier */</span>
1690 <a name="l01687"></a>01687       ic = ic + twidCoefModifier;
1691 <a name="l01688"></a>01688
1692 <a name="l01689"></a>01689       <span class="comment">/*  Butterfly implementation */</span>
1693 <a name="l01690"></a>01690       <span class="keywordflow">for</span> (i0 = j; i0 &lt; fftLen; i0 += n1)
1694 <a name="l01691"></a>01691       {
1695 <a name="l01692"></a>01692         <span class="comment">/*  index calculation for the input as, */</span>
1696 <a name="l01693"></a>01693         <span class="comment">/*  pSrc16[i0 + 0], pSrc16[i0 + fftLen/4], pSrc16[i0 + fftLen/2], pSrc16[i0 + 3fftLen/4] */</span>
1697 <a name="l01694"></a>01694         i1 = i0 + n2;
1698 <a name="l01695"></a>01695         i2 = i1 + n2;
1699 <a name="l01696"></a>01696         i3 = i2 + n2;
1700 <a name="l01697"></a>01697
1701 <a name="l01698"></a>01698         <span class="comment">/*  Reading i0, i0+fftLen/2 inputs */</span>
1702 <a name="l01699"></a>01699         <span class="comment">/* Read ya (real), xa(imag) input */</span>
1703 <a name="l01700"></a>01700         T0 = pSrc16[i0 * 2u];
1704 <a name="l01701"></a>01701         T1 = pSrc16[(i0 * 2u) + 1u];
1705 <a name="l01702"></a>01702
1706 <a name="l01703"></a>01703         <span class="comment">/* Read yc (real), xc(imag) input */</span>
1707 <a name="l01704"></a>01704         S0 = pSrc16[i2 * 2u];
1708 <a name="l01705"></a>01705         S1 = pSrc16[(i2 * 2u) + 1u];
1709 <a name="l01706"></a>01706
1710 <a name="l01707"></a>01707
1711 <a name="l01708"></a>01708         <span class="comment">/* R0 = (ya + yc), R1 = (xa + xc) */</span>
1712 <a name="l01709"></a>01709         R0 = __SSAT(T0 + S0, 16u);
1713 <a name="l01710"></a>01710         R1 = __SSAT(T1 + S1, 16u);
1714 <a name="l01711"></a>01711         <span class="comment">/* S0 = (ya - yc), S1 = (xa - xc) */</span>
1715 <a name="l01712"></a>01712         S0 = __SSAT(T0 - S0, 16u);
1716 <a name="l01713"></a>01713         S1 = __SSAT(T1 - S1, 16u);
1717 <a name="l01714"></a>01714
1718 <a name="l01715"></a>01715         <span class="comment">/*  Reading i0+fftLen/4 , i0+3fftLen/4 inputs */</span>
1719 <a name="l01716"></a>01716         <span class="comment">/* Read yb (real), xb(imag) input */</span>
1720 <a name="l01717"></a>01717         T0 = pSrc16[i1 * 2u];
1721 <a name="l01718"></a>01718         T1 = pSrc16[(i1 * 2u) + 1u];
1722 <a name="l01719"></a>01719
1723 <a name="l01720"></a>01720         <span class="comment">/* Read yd (real), xd(imag) input */</span>
1724 <a name="l01721"></a>01721         U0 = pSrc16[i3 * 2u];
1725 <a name="l01722"></a>01722         U1 = pSrc16[(i3 * 2u) + 1u];
1726 <a name="l01723"></a>01723
1727 <a name="l01724"></a>01724         <span class="comment">/* T0 = (yb + yd), T1 = (xb + xd) */</span>
1728 <a name="l01725"></a>01725         T0 = __SSAT(T0 + U0, 16u);
1729 <a name="l01726"></a>01726         T1 = __SSAT(T1 + U1, 16u);
1730 <a name="l01727"></a>01727
1731 <a name="l01728"></a>01728         <span class="comment">/*  writing the butterfly processed i0 sample */</span>
1732 <a name="l01729"></a>01729         <span class="comment">/* xa&#39; = xa + xb + xc + xd */</span>
1733 <a name="l01730"></a>01730         <span class="comment">/* ya&#39; = ya + yb + yc + yd */</span>
1734 <a name="l01731"></a>01731         pSrc16[i0 * 2u] = ((R0 &gt;&gt; 1u) + (T0 &gt;&gt; 1u)) &gt;&gt; 1u;
1735 <a name="l01732"></a>01732         pSrc16[(i0 * 2u) + 1u] = ((R1 &gt;&gt; 1u) + (T1 &gt;&gt; 1u)) &gt;&gt; 1u;
1736 <a name="l01733"></a>01733
1737 <a name="l01734"></a>01734         <span class="comment">/* R0 = (ya + yc) - (yb + yd), R1 = (xa + xc) - (xb + xd) */</span>
1738 <a name="l01735"></a>01735         R0 = (R0 &gt;&gt; 1u) - (T0 &gt;&gt; 1u);
1739 <a name="l01736"></a>01736         R1 = (R1 &gt;&gt; 1u) - (T1 &gt;&gt; 1u);
1740 <a name="l01737"></a>01737
1741 <a name="l01738"></a>01738         <span class="comment">/* (ya-yb+yc-yd)* (si2) - (xa-xb+xc-xd)* co2 */</span>
1742 <a name="l01739"></a>01739         out1 = (short) ((Co2 * R0 - Si2 * R1) &gt;&gt; 16);
1743 <a name="l01740"></a>01740         <span class="comment">/* (ya-yb+yc-yd)* co2 + (xa-xb+xc-xd)* (si2) */</span>
1744 <a name="l01741"></a>01741         out2 = (short) ((Si2 * R0 + Co2 * R1) &gt;&gt; 16);
1745 <a name="l01742"></a>01742
1746 <a name="l01743"></a>01743         <span class="comment">/*  Reading i0+3fftLen/4 */</span>
1747 <a name="l01744"></a>01744         <span class="comment">/* Read yb (real), xb(imag) input */</span>
1748 <a name="l01745"></a>01745         T0 = pSrc16[i1 * 2u];
1749 <a name="l01746"></a>01746         T1 = pSrc16[(i1 * 2u) + 1u];
1750 <a name="l01747"></a>01747
1751 <a name="l01748"></a>01748         <span class="comment">/*  writing the butterfly processed i0 + fftLen/4 sample */</span>
1752 <a name="l01749"></a>01749         <span class="comment">/* xc&#39; = (xa-xb+xc-xd)* co2 - (ya-yb+yc-yd)* (si2) */</span>
1753 <a name="l01750"></a>01750         <span class="comment">/* yc&#39; = (ya-yb+yc-yd)* co2 + (xa-xb+xc-xd)* (si2) */</span>
1754 <a name="l01751"></a>01751         pSrc16[i1 * 2u] = out1;
1755 <a name="l01752"></a>01752         pSrc16[(i1 * 2u) + 1u] = out2;
1756 <a name="l01753"></a>01753
1757 <a name="l01754"></a>01754         <span class="comment">/*  Butterfly calculations */</span>
1758 <a name="l01755"></a>01755         <span class="comment">/* Read yd (real), xd(imag) input */</span>
1759 <a name="l01756"></a>01756         U0 = pSrc16[i3 * 2u];
1760 <a name="l01757"></a>01757         U1 = pSrc16[(i3 * 2u) + 1u];
1761 <a name="l01758"></a>01758
1762 <a name="l01759"></a>01759         <span class="comment">/* T0 = yb-yd, T1 = xb-xd) */</span>
1763 <a name="l01760"></a>01760         T0 = __SSAT(T0 - U0, 16u);
1764 <a name="l01761"></a>01761         T1 = __SSAT(T1 - U1, 16u);
1765 <a name="l01762"></a>01762
1766 <a name="l01763"></a>01763         <span class="comment">/* R0 = (ya-yc) - (xb- xd) , R1 = (xa-xc) + (yb-yd) */</span>
1767 <a name="l01764"></a>01764         R0 = (S0 &gt;&gt; 1u) + (T1 &gt;&gt; 1u);
1768 <a name="l01765"></a>01765         R1 = (S1 &gt;&gt; 1u) - (T0 &gt;&gt; 1u);
1769 <a name="l01766"></a>01766
1770 <a name="l01767"></a>01767         <span class="comment">/* S1 = (ya-yc) + (xb- xd), S1 = (xa-xc) - (yb-yd) */</span>
1771 <a name="l01768"></a>01768         S0 = (S0 &gt;&gt; 1u) - (T1 &gt;&gt; 1u);
1772 <a name="l01769"></a>01769         S1 = (S1 &gt;&gt; 1u) + (T0 &gt;&gt; 1u);
1773 <a name="l01770"></a>01770
1774 <a name="l01771"></a>01771         <span class="comment">/*  Butterfly process for the i0+fftLen/2 sample */</span>
1775 <a name="l01772"></a>01772         out1 = (short) ((Co1 * S0 - Si1 * S1) &gt;&gt; 16u);
1776 <a name="l01773"></a>01773         out2 = (short) ((Si1 * S0 + Co1 * S1) &gt;&gt; 16u);
1777 <a name="l01774"></a>01774         <span class="comment">/* xb&#39; = (xa-yb-xc+yd)* co1 - (ya+xb-yc-xd)* (si1) */</span>
1778 <a name="l01775"></a>01775         <span class="comment">/* yb&#39; = (ya+xb-yc-xd)* co1 + (xa-yb-xc+yd)* (si1) */</span>
1779 <a name="l01776"></a>01776         pSrc16[i2 * 2u] = out1;
1780 <a name="l01777"></a>01777         pSrc16[(i2 * 2u) + 1u] = out2;
1781 <a name="l01778"></a>01778
1782 <a name="l01779"></a>01779         <span class="comment">/*  Butterfly process for the i0+3fftLen/4 sample */</span>
1783 <a name="l01780"></a>01780         out1 = (short) ((Co3 * R0 - Si3 * R1) &gt;&gt; 16u);
1784 <a name="l01781"></a>01781
1785 <a name="l01782"></a>01782         out2 = (short) ((Si3 * R0 + Co3 * R1) &gt;&gt; 16u);
1786 <a name="l01783"></a>01783         <span class="comment">/* xd&#39; = (xa+yb-xc-yd)* Co3 - (ya-xb-yc+xd)* (si3) */</span>
1787 <a name="l01784"></a>01784         <span class="comment">/* yd&#39; = (ya-xb-yc+xd)* Co3 + (xa+yb-xc-yd)* (si3) */</span>
1788 <a name="l01785"></a>01785         pSrc16[i3 * 2u] = out1;
1789 <a name="l01786"></a>01786         pSrc16[(i3 * 2u) + 1u] = out2;
1790 <a name="l01787"></a>01787
1791 <a name="l01788"></a>01788
1792 <a name="l01789"></a>01789       }
1793 <a name="l01790"></a>01790     }
1794 <a name="l01791"></a>01791     <span class="comment">/*  Twiddle coefficients index modifier */</span>
1795 <a name="l01792"></a>01792     twidCoefModifier &lt;&lt;= 2u;
1796 <a name="l01793"></a>01793   }
1797 <a name="l01794"></a>01794   <span class="comment">/*  End of Middle stages process */</span>
1798 <a name="l01795"></a>01795
1799 <a name="l01796"></a>01796
1800 <a name="l01797"></a>01797   <span class="comment">/* data is in 10.6(q6) format for the 1024 point */</span>
1801 <a name="l01798"></a>01798   <span class="comment">/* data is in 8.8(q8) format for the 256 point   */</span>
1802 <a name="l01799"></a>01799   <span class="comment">/* data is in 6.10(q10) format for the 64 point  */</span>
1803 <a name="l01800"></a>01800   <span class="comment">/* data is in 4.12(q12) format for the 16 point  */</span>
1804 <a name="l01801"></a>01801
1805 <a name="l01802"></a>01802   <span class="comment">/* start of last stage process */</span>
1806 <a name="l01803"></a>01803
1807 <a name="l01804"></a>01804
1808 <a name="l01805"></a>01805   <span class="comment">/*  Initializations for the last stage */</span>
1809 <a name="l01806"></a>01806   n1 = n2;
1810 <a name="l01807"></a>01807   n2 &gt;&gt;= 2u;
1811 <a name="l01808"></a>01808
1812 <a name="l01809"></a>01809   <span class="comment">/*  Butterfly implementation */</span>
1813 <a name="l01810"></a>01810   <span class="keywordflow">for</span> (i0 = 0u; i0 &lt;= (fftLen - n1); i0 += n1)
1814 <a name="l01811"></a>01811   {
1815 <a name="l01812"></a>01812     <span class="comment">/*  index calculation for the input as, */</span>
1816 <a name="l01813"></a>01813     <span class="comment">/*  pSrc16[i0 + 0], pSrc16[i0 + fftLen/4], pSrc16[i0 + fftLen/2], pSrc16[i0 + 3fftLen/4] */</span>
1817 <a name="l01814"></a>01814     i1 = i0 + n2;
1818 <a name="l01815"></a>01815     i2 = i1 + n2;
1819 <a name="l01816"></a>01816     i3 = i2 + n2;
1820 <a name="l01817"></a>01817
1821 <a name="l01818"></a>01818     <span class="comment">/*  Reading i0, i0+fftLen/2 inputs */</span>
1822 <a name="l01819"></a>01819     <span class="comment">/* Read ya (real), xa(imag) input */</span>
1823 <a name="l01820"></a>01820     T0 = pSrc16[i0 * 2u];
1824 <a name="l01821"></a>01821     T1 = pSrc16[(i0 * 2u) + 1u];
1825 <a name="l01822"></a>01822     <span class="comment">/* Read yc (real), xc(imag) input */</span>
1826 <a name="l01823"></a>01823     S0 = pSrc16[i2 * 2u];
1827 <a name="l01824"></a>01824     S1 = pSrc16[(i2 * 2u) + 1u];
1828 <a name="l01825"></a>01825
1829 <a name="l01826"></a>01826     <span class="comment">/* R0 = (ya + yc), R1 = (xa + xc) */</span>
1830 <a name="l01827"></a>01827     R0 = __SSAT(T0 + S0, 16u);
1831 <a name="l01828"></a>01828     R1 = __SSAT(T1 + S1, 16u);
1832 <a name="l01829"></a>01829     <span class="comment">/* S0 = (ya - yc), S1 = (xa - xc) */</span>
1833 <a name="l01830"></a>01830     S0 = __SSAT(T0 - S0, 16u);
1834 <a name="l01831"></a>01831     S1 = __SSAT(T1 - S1, 16u);
1835 <a name="l01832"></a>01832
1836 <a name="l01833"></a>01833     <span class="comment">/*  Reading i0+fftLen/4 , i0+3fftLen/4 inputs */</span>
1837 <a name="l01834"></a>01834     <span class="comment">/* Read yb (real), xb(imag) input */</span>
1838 <a name="l01835"></a>01835     T0 = pSrc16[i1 * 2u];
1839 <a name="l01836"></a>01836     T1 = pSrc16[(i1 * 2u) + 1u];
1840 <a name="l01837"></a>01837     <span class="comment">/* Read yd (real), xd(imag) input */</span>
1841 <a name="l01838"></a>01838     U0 = pSrc16[i3 * 2u];
1842 <a name="l01839"></a>01839     U1 = pSrc16[(i3 * 2u) + 1u];
1843 <a name="l01840"></a>01840
1844 <a name="l01841"></a>01841     <span class="comment">/* T0 = (yb + yd), T1 = (xb + xd) */</span>
1845 <a name="l01842"></a>01842     T0 = __SSAT(T0 + U0, 16u);
1846 <a name="l01843"></a>01843     T1 = __SSAT(T1 + U1, 16u);
1847 <a name="l01844"></a>01844
1848 <a name="l01845"></a>01845     <span class="comment">/*  writing the butterfly processed i0 sample */</span>
1849 <a name="l01846"></a>01846     <span class="comment">/* xa&#39; = xa + xb + xc + xd */</span>
1850 <a name="l01847"></a>01847     <span class="comment">/* ya&#39; = ya + yb + yc + yd */</span>
1851 <a name="l01848"></a>01848     pSrc16[i0 * 2u] = (R0 &gt;&gt; 1u) + (T0 &gt;&gt; 1u);
1852 <a name="l01849"></a>01849     pSrc16[(i0 * 2u) + 1u] = (R1 &gt;&gt; 1u) + (T1 &gt;&gt; 1u);
1853 <a name="l01850"></a>01850
1854 <a name="l01851"></a>01851     <span class="comment">/* R0 = (ya + yc) - (yb + yd), R1 = (xa + xc) - (xb + xd) */</span>
1855 <a name="l01852"></a>01852     R0 = (R0 &gt;&gt; 1u) - (T0 &gt;&gt; 1u);
1856 <a name="l01853"></a>01853     R1 = (R1 &gt;&gt; 1u) - (T1 &gt;&gt; 1u);
1857 <a name="l01854"></a>01854
1858 <a name="l01855"></a>01855     <span class="comment">/* Read yb (real), xb(imag) input */</span>
1859 <a name="l01856"></a>01856     T0 = pSrc16[i1 * 2u];
1860 <a name="l01857"></a>01857     T1 = pSrc16[(i1 * 2u) + 1u];
1861 <a name="l01858"></a>01858
1862 <a name="l01859"></a>01859     <span class="comment">/*  writing the butterfly processed i0 + fftLen/4 sample */</span>
1863 <a name="l01860"></a>01860     <span class="comment">/* xc&#39; = (xa-xb+xc-xd) */</span>
1864 <a name="l01861"></a>01861     <span class="comment">/* yc&#39; = (ya-yb+yc-yd) */</span>
1865 <a name="l01862"></a>01862     pSrc16[i1 * 2u] = R0;
1866 <a name="l01863"></a>01863     pSrc16[(i1 * 2u) + 1u] = R1;
1867 <a name="l01864"></a>01864
1868 <a name="l01865"></a>01865     <span class="comment">/* Read yd (real), xd(imag) input */</span>
1869 <a name="l01866"></a>01866     U0 = pSrc16[i3 * 2u];
1870 <a name="l01867"></a>01867     U1 = pSrc16[(i3 * 2u) + 1u];
1871 <a name="l01868"></a>01868     <span class="comment">/* T0 = (yb - yd), T1 = (xb - xd) */</span>
1872 <a name="l01869"></a>01869     T0 = __SSAT(T0 - U0, 16u);
1873 <a name="l01870"></a>01870     T1 = __SSAT(T1 - U1, 16u);
1874 <a name="l01871"></a>01871
1875 <a name="l01872"></a>01872     <span class="comment">/*  writing the butterfly processed i0 + fftLen/2 sample */</span>
1876 <a name="l01873"></a>01873     <span class="comment">/* xb&#39; = (xa-yb-xc+yd) */</span>
1877 <a name="l01874"></a>01874     <span class="comment">/* yb&#39; = (ya+xb-yc-xd) */</span>
1878 <a name="l01875"></a>01875     pSrc16[i2 * 2u] = (S0 &gt;&gt; 1u) - (T1 &gt;&gt; 1u);
1879 <a name="l01876"></a>01876     pSrc16[(i2 * 2u) + 1u] = (S1 &gt;&gt; 1u) + (T0 &gt;&gt; 1u);
1880 <a name="l01877"></a>01877
1881 <a name="l01878"></a>01878
1882 <a name="l01879"></a>01879     <span class="comment">/*  writing the butterfly processed i0 + 3fftLen/4 sample */</span>
1883 <a name="l01880"></a>01880     <span class="comment">/* xd&#39; = (xa+yb-xc-yd) */</span>
1884 <a name="l01881"></a>01881     <span class="comment">/* yd&#39; = (ya-xb-yc+xd) */</span>
1885 <a name="l01882"></a>01882     pSrc16[i3 * 2u] = (S0 &gt;&gt; 1u) + (T1 &gt;&gt; 1u);
1886 <a name="l01883"></a>01883     pSrc16[(i3 * 2u) + 1u] = (S1 &gt;&gt; 1u) - (T0 &gt;&gt; 1u);
1887 <a name="l01884"></a>01884   }
1888 <a name="l01885"></a>01885   <span class="comment">/* end of last stage  process */</span>
1889 <a name="l01886"></a>01886
1890 <a name="l01887"></a>01887   <span class="comment">/* output is in 11.5(q5) format for the 1024 point */</span>
1891 <a name="l01888"></a>01888   <span class="comment">/* output is in 9.7(q7) format for the 256 point   */</span>
1892 <a name="l01889"></a>01889   <span class="comment">/* output is in 7.9(q9) format for the 64 point  */</span>
1893 <a name="l01890"></a>01890   <span class="comment">/* output is in 5.11(q11) format for the 16 point  */</span>
1894 <a name="l01891"></a>01891
1895 <a name="l01892"></a>01892 <span class="preprocessor">#endif </span><span class="comment">/* #ifndef ARM_MATH_CM0 */</span>
1896 <a name="l01893"></a>01893
1897 <a name="l01894"></a>01894 }
1898 <a name="l01895"></a>01895
1899 <a name="l01896"></a>01896
1900 <a name="l01897"></a>01897 <span class="comment">/*   </span>
1901 <a name="l01898"></a>01898 <span class="comment">   * @brief  In-place bit reversal function.  </span>
1902 <a name="l01899"></a>01899 <span class="comment">   * @param[in, out] *pSrc        points to the in-place buffer of Q15 data type.  </span>
1903 <a name="l01900"></a>01900 <span class="comment">   * @param[in]      fftLen       length of the FFT.  </span>
1904 <a name="l01901"></a>01901 <span class="comment">   * @param[in]      bitRevFactor bit reversal modifier that supports different size FFTs with the same bit reversal table  </span>
1905 <a name="l01902"></a>01902 <span class="comment">   * @param[in]      *pBitRevTab  points to bit reversal table.  </span>
1906 <a name="l01903"></a>01903 <span class="comment">   * @return none.  </span>
1907 <a name="l01904"></a>01904 <span class="comment"> */</span>
1908 <a name="l01905"></a>01905
1909 <a name="l01906"></a><a class="code" href="arm__math_8h.html#a73f48eaea9297605705ae25d3405343e">01906</a> <span class="keywordtype">void</span> <a class="code" href="arm__cfft__radix4__q15_8c.html#a12a07b49948c354172ae07358309a4a5" title="In-place bit reversal function.">arm_bitreversal_q15</a>(
1910 <a name="l01907"></a>01907   <a class="code" href="arm__math_8h.html#ab5a8fb21a5b3b983d5f54f31614052ea" title="16-bit fractional data type in 1.15 format.">q15_t</a> * pSrc16,
1911 <a name="l01908"></a>01908   uint32_t fftLen,
1912 <a name="l01909"></a>01909   uint16_t bitRevFactor,
1913 <a name="l01910"></a>01910   uint16_t * pBitRevTab)
1914 <a name="l01911"></a>01911 {
1915 <a name="l01912"></a>01912   <a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> *pSrc = (<a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> *) pSrc16;
1916 <a name="l01913"></a>01913   <a class="code" href="arm__math_8h.html#adc89a3547f5324b7b3b95adec3806bc0" title="32-bit fractional data type in 1.31 format.">q31_t</a> in;
1917 <a name="l01914"></a>01914   uint32_t fftLenBy2, fftLenBy2p1;
1918 <a name="l01915"></a>01915   uint32_t i, j;
1919 <a name="l01916"></a>01916
1920 <a name="l01917"></a>01917   <span class="comment">/*  Initializations */</span>
1921 <a name="l01918"></a>01918   j = 0u;
1922 <a name="l01919"></a>01919   fftLenBy2 = fftLen / 2u;
1923 <a name="l01920"></a>01920   fftLenBy2p1 = (fftLen / 2u) + 1u;
1924 <a name="l01921"></a>01921
1925 <a name="l01922"></a>01922   <span class="comment">/* Bit Reversal Implementation */</span>
1926 <a name="l01923"></a>01923   <span class="keywordflow">for</span> (i = 0u; i &lt;= (fftLenBy2 - 2u); i += 2u)
1927 <a name="l01924"></a>01924   {
1928 <a name="l01925"></a>01925     <span class="keywordflow">if</span>(i &lt; j)
1929 <a name="l01926"></a>01926     {
1930 <a name="l01927"></a>01927       <span class="comment">/*  pSrc[i] &lt;-&gt; pSrc[j]; */</span>
1931 <a name="l01928"></a>01928       <span class="comment">/*  pSrc[i+1u] &lt;-&gt; pSrc[j+1u] */</span>
1932 <a name="l01929"></a>01929       in = pSrc[i];
1933 <a name="l01930"></a>01930       pSrc[i] = pSrc[j];
1934 <a name="l01931"></a>01931       pSrc[j] = in;
1935 <a name="l01932"></a>01932
1936 <a name="l01933"></a>01933       <span class="comment">/*  pSrc[i + fftLenBy2p1] &lt;-&gt; pSrc[j + fftLenBy2p1];  */</span>
1937 <a name="l01934"></a>01934       <span class="comment">/*  pSrc[i + fftLenBy2p1+1u] &lt;-&gt; pSrc[j + fftLenBy2p1+1u] */</span>
1938 <a name="l01935"></a>01935       in = pSrc[i + fftLenBy2p1];
1939 <a name="l01936"></a>01936       pSrc[i + fftLenBy2p1] = pSrc[j + fftLenBy2p1];
1940 <a name="l01937"></a>01937       pSrc[j + fftLenBy2p1] = in;
1941 <a name="l01938"></a>01938     }
1942 <a name="l01939"></a>01939
1943 <a name="l01940"></a>01940     <span class="comment">/*  pSrc[i+1u] &lt;-&gt; pSrc[j+fftLenBy2];         */</span>
1944 <a name="l01941"></a>01941     <span class="comment">/*  pSrc[i+2] &lt;-&gt; pSrc[j+fftLenBy2+1u]  */</span>
1945 <a name="l01942"></a>01942     in = pSrc[i + 1u];
1946 <a name="l01943"></a>01943     pSrc[i + 1u] = pSrc[j + fftLenBy2];
1947 <a name="l01944"></a>01944     pSrc[j + fftLenBy2] = in;
1948 <a name="l01945"></a>01945
1949 <a name="l01946"></a>01946     <span class="comment">/*  Reading the index for the bit reversal */</span>
1950 <a name="l01947"></a>01947     j = *pBitRevTab;
1951 <a name="l01948"></a>01948
1952 <a name="l01949"></a>01949     <span class="comment">/*  Updating the bit reversal index depending on the fft length  */</span>
1953 <a name="l01950"></a>01950     pBitRevTab += bitRevFactor;
1954 <a name="l01951"></a>01951   }
1955 <a name="l01952"></a>01952 }
1956 </pre></div></div>
1957 </div>
1958 <!--- window showing the filter options -->
1959 <div id="MSearchSelectWindow"
1960      onmouseover="return searchBox.OnSearchSelectShow()"
1961      onmouseout="return searchBox.OnSearchSelectHide()"
1962      onkeydown="return searchBox.OnSearchSelectKey(event)">
1963 <a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Data Structures</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Defines</a></div>
1964
1965 <!-- iframe showing the search results (closed by default) -->
1966 <div id="MSearchResultsWindow">
1967 <iframe src="" frameborder="0"
1968         name="MSearchResults" id="MSearchResults">
1969 </iframe>
1970 </div>
1971
1972 <hr class="footer"/><address class="footer"><small>Generated on Fri Jul 15 2011 13:16:15 for CMSIS DSP Software Library by&#160;
1973 <a href="http://www.doxygen.org/index.html">
1974 <img class="footer" src="doxygen.png" alt="doxygen"/></a> 1.7.2 </small></address>
1975 </body>
1976 </html>