]> git.gag.com Git - debian/gnuradio/commitdiff
Backed out [8669]. Better fix for removing cruft from opreport
authoreb <eb@221aa14e-8319-0410-a670-987f0aec2ac5>
Mon, 23 Jun 2008 23:03:43 +0000 (23:03 +0000)
committereb <eb@221aa14e-8319-0410-a670-987f0aec2ac5>
Mon, 23 Jun 2008 23:03:43 +0000 (23:03 +0000)
git-svn-id: http://gnuradio.org/svn/gnuradio/trunk@8685 221aa14e-8319-0410-a670-987f0aec2ac5

22 files changed:
gnuradio-core/src/lib/filter/3dnow_float_dotprod_really_simple.S
gnuradio-core/src/lib/filter/3dnow_float_dotprod_simple.S
gnuradio-core/src/lib/filter/ccomplex_dotprod_3dnow.S
gnuradio-core/src/lib/filter/ccomplex_dotprod_3dnow64.S
gnuradio-core/src/lib/filter/ccomplex_dotprod_3dnowext.S
gnuradio-core/src/lib/filter/ccomplex_dotprod_3dnowext64.S
gnuradio-core/src/lib/filter/ccomplex_dotprod_sse.S
gnuradio-core/src/lib/filter/ccomplex_dotprod_sse64.S
gnuradio-core/src/lib/filter/complex_dotprod_3dnow.S
gnuradio-core/src/lib/filter/complex_dotprod_3dnow64.S
gnuradio-core/src/lib/filter/complex_dotprod_3dnowext.S
gnuradio-core/src/lib/filter/complex_dotprod_3dnowext64.S
gnuradio-core/src/lib/filter/complex_dotprod_sse.S
gnuradio-core/src/lib/filter/complex_dotprod_sse64.S
gnuradio-core/src/lib/filter/fcomplex_dotprod_3dnow.S
gnuradio-core/src/lib/filter/fcomplex_dotprod_3dnow64.S
gnuradio-core/src/lib/filter/fcomplex_dotprod_sse.S
gnuradio-core/src/lib/filter/fcomplex_dotprod_sse64.S
gnuradio-core/src/lib/filter/float_dotprod_3dnow.S
gnuradio-core/src/lib/filter/float_dotprod_3dnow64.S
gnuradio-core/src/lib/filter/float_dotprod_sse.S
gnuradio-core/src/lib/filter/float_dotprod_sse64.S

index b5f435b60814b3770d57fa6b410af873c54187d8..6050425acaf7326432a49e15b37534ba6469b13c 100644 (file)
@@ -72,14 +72,14 @@ sse_float_dotprod:
        shll    $1, %ecx                # count * 2
 
        .p2align 4
-.3dnow_float_dotprod_really_simple_loop1:
+.Loop1:
        movq    (%eax), %mm0
        pfmul   (%edx), %mm0
        pfadd   %mm0, %mm4
        addl    $8, %edx
        addl    $8, %eax
        decl    %ecx
-       jne     .3dnow_float_dotprod_really_simple_loop1
+       jne     .Loop1
        
        # at this point mm4 contains partial sums
 
index 91370bb138329f4a31eca8b7dabb2155f9001436..1097728cbd5f30bce7749e59699640b66e1a6806 100644 (file)
@@ -72,7 +72,7 @@ sse_float_dotprod:
        pxor    %mm5, %mm5              # mm5 = 0 0 
 
        .p2align 4
-.3dnow_float_dotprod_simple_loop1:
+.Loop1:
        movq    0(%eax), %mm0
        movq    8(%eax), %mm1
        
@@ -85,7 +85,7 @@ sse_float_dotprod:
        addl    $16, %edx
        addl    $16, %eax
        decl    %ecx
-       jne     .3dnow_float_dotprod_simple_loop1
+       jne     .Loop1
        
        # at this point mm4 and mm5 contain partial sums
 
index 51a09badb3f2a645ad48c5cde5ae3d7e60a248ae..26f5830f91e60b029568b00c010e28890bf3311f 100644 (file)
@@ -91,7 +91,7 @@ GLOB_SYMB(ccomplex_dotprod_3dnow):
        #
        
        .p2align 4
-.ccomplex_dotprod_3dnow_loop1: 
+.Loop1:        
 
 # complex prod: C += A * B,  w/ temp Z, mmPN=$80000000
 #
@@ -165,7 +165,7 @@ GLOB_SYMB(ccomplex_dotprod_3dnow):
 
 .L1_test:
        decl    %ecx
-       jge     .ccomplex_dotprod_3dnow_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Let's see if original n_2_ccomplex_blocks was odd.
index bc9859b2c6fdc994b3261202797cf5e954ed7797..feaf1cb0340b6b6715c2806bb0b1e793b979c713 100644 (file)
@@ -91,7 +91,7 @@ GLOB_SYMB(ccomplex_dotprod_3dnow):
        #
        
        .p2align 4
-.ccomplex_dotprod_3dnow64_loop1:       
+.Loop1:        
 
 # complex prod: C += A * B,  w/ temp Z, mmPN=$80000000
 #
@@ -165,7 +165,7 @@ GLOB_SYMB(ccomplex_dotprod_3dnow):
 
 .L1_test:
        dec     %rax
-       jge     .ccomplex_dotprod_3dnow64_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Let's see if original n_2_ccomplex_blocks was odd.
index ffe4d597cab0b9b4728c4f395212fde9765a2c37..1a09cc3e9463e53e948112177d2ab584660b58df 100644 (file)
@@ -89,7 +89,7 @@ GLOB_SYMB(ccomplex_dotprod_3dnowext):
        #
        
        .p2align 4
-.ccomplex_dotprod_3dnowext_loop1:      
+.Loop1:        
 
 # complex prod: C += A * B,  w/ temp Z
 #
@@ -144,7 +144,7 @@ GLOB_SYMB(ccomplex_dotprod_3dnowext):
 
 .L1_test:
        decl    %ecx
-       jge     .ccomplex_dotprod_3dnowext_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Let's see if original n_2_ccomplex_blocks was odd.
index 7fb4c306566541da9d7ea0918d51284c72bf77af..75f5af2801f90be68e37e4c0946f3f074b197705 100644 (file)
@@ -89,7 +89,7 @@ GLOB_SYMB(ccomplex_dotprod_3dnowext):
        #
        
        .p2align 4
-.ccomplex_dotprod_3dnowext64_loop1:    
+.Loop1:        
 
 # complex prod: C += A * B,  w/ temp Z
 #
@@ -144,7 +144,7 @@ GLOB_SYMB(ccomplex_dotprod_3dnowext):
 
 .L1_test:
        dec     %rax
-       jge     .ccomplex_dotprod_3dnowext64_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Let's see if original n_2_ccomplex_blocks was odd.
index 5107faecdd983302e3fb5d6b92adfa30748aed36..a06ce4d36f7290b31858db5fce1cdc00f69587f7 100644 (file)
@@ -85,7 +85,7 @@ GLOB_SYMB(ccomplex_dotprod_sse):
        #
        
        .p2align 4
-.ccomplex_dotprod_sse_loop1:   
+.Loop1:        
 
 # complex prod: C += A * B,  w/ temp Z & Y (or B), xmmPN=$0x8000000080000000
 #
@@ -141,7 +141,7 @@ GLOB_SYMB(ccomplex_dotprod_sse):
 
 .L1_test:
        decl    %ecx
-       jge     .ccomplex_dotprod_sse_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Let's sse if original n_2_ccomplex_blocks was odd.
index b9c3bad09017c61e718b3dc41f50d740c989c3d0..6da4f2eb41bc43dded08a4e22c83b7104246f8e3 100644 (file)
@@ -85,7 +85,7 @@ GLOB_SYMB(ccomplex_dotprod_sse):
        #
        
        .p2align 4
-.ccomplex_dotprod_sse64_loop1: 
+.Loop1:        
 
 # complex prod: C += A * B,  w/ temp Z & Y (or B), xmmPN=$0x8000000080000000
 #
@@ -141,7 +141,7 @@ GLOB_SYMB(ccomplex_dotprod_sse):
 
 .L1_test:
        dec     %rax
-       jge     .ccomplex_dotprod_sse64_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Let's sse if original n_2_ccomplex_blocks was odd.
index a2222f267707f77f71cf707e993d14dbfd9f5d4f..6e46bf7b878a9e95ba6cbd99e35aaed5471b7022 100644 (file)
@@ -100,7 +100,7 @@ GLOB_SYMB(complex_dotprod_3dnow):
        #
        
        .p2align 4
-.complex_dotprod_3dnow_loop1:  
+.Loop1:        
        pfmul   0(%edx), %mm0
        pfadd   %mm2, %mm6
 
@@ -145,7 +145,7 @@ GLOB_SYMB(complex_dotprod_3dnow):
 
 .L1_test:
        decl    %ecx
-       jge     .complex_dotprod_3dnow_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Now accumulate the final two additions and see if original
index d67448d86f2adce990918722294d21295b4a3097..fe9784550d9357402c085f169bcb0c4f05397454 100644 (file)
@@ -100,7 +100,7 @@ GLOB_SYMB(complex_dotprod_3dnow):
        #
        
        .p2align 4
-.complex_dotprod_3dnow64_loop1:        
+.Loop1:        
        pfmul   0(%rsi), %mm0
        pfadd   %mm2, %mm6
 
@@ -145,7 +145,7 @@ GLOB_SYMB(complex_dotprod_3dnow):
 
 .L1_test:
        dec     %rax
-       jge     .complex_dotprod_3dnow64_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Now accumulate the final two additions and see if original
index 03c9317051e27ad7a812ffba7c1ac9ace6241f1a..122fd2b59ed8548be83a94b3062cfe77efcd5ff2 100644 (file)
@@ -93,7 +93,7 @@ GLOB_SYMB(complex_dotprod_3dnowext):
        #
        
        .p2align 4
-.complex_dotprod_3dnowext_loop1:       
+.Loop1:        
        pfmul   0(%edx), %mm0
        pfadd   %mm2, %mm6
 
@@ -125,7 +125,7 @@ GLOB_SYMB(complex_dotprod_3dnowext):
 
 .L1_test:
        decl    %ecx
-       jge     .complex_dotprod_3dnowext_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Now accumulate the final two additions and see if original
index 1f4da3c595bb5038b3dbc69ff318534f4721330f..94905497bbe1f0bfea2492d75998cc5f4d51b634 100644 (file)
@@ -93,7 +93,7 @@ GLOB_SYMB(complex_dotprod_3dnowext):
        #
        
        .p2align 4
-.complex_dotprod_3dnowext64_loop1:     
+.Loop1:        
        pfmul   0(%rsi), %mm0
        pfadd   %mm2, %mm6
 
@@ -125,7 +125,7 @@ GLOB_SYMB(complex_dotprod_3dnowext):
 
 .L1_test:
        dec     %rax
-       jge     .complex_dotprod_3dnowext64_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Now accumulate the final two additions and see if original
index f7448486414577d1ebdc66d42f8b590a846b2080..ff5ef5d0cb56a8c1f9916091776fc4f33319e1da 100644 (file)
@@ -81,7 +81,7 @@ GLOB_SYMB(complex_dotprod_sse):
        jmp     .L1_test
 
        .p2align 4
-.complex_dotprod_sse_loop1:    
+.Loop1:        
 
        pxor    %mm0, %mm0
        punpcklwd       0(%eax), %mm0
@@ -95,7 +95,7 @@ GLOB_SYMB(complex_dotprod_sse):
        addps   %xmm0, %xmm4
 .L1_test:      
        decl    %ecx
-       jge     .complex_dotprod_sse_loop1
+       jge     .Loop1
 
        
        # set up for primary loop which is unrolled 4 times
@@ -129,7 +129,7 @@ GLOB_SYMB(complex_dotprod_sse):
        # hence enter loop at top
 
        .p2align 4
-.complex_dotprod_sse_loop2:
+.Loop2:
        mulps   (%edx), %xmm0
        addps   %xmm2, %xmm6
 
@@ -169,7 +169,7 @@ GLOB_SYMB(complex_dotprod_sse):
        addl    $0x40, %edx
        addl    $0x10, %eax
        decl    %ecx
-       jne     .complex_dotprod_sse_loop2
+       jne     .Loop2
 
        # OK, now we've done with all the multiplies, but
        # we still need to handle the unaccumulated
index 3096da20b4dba3275d4731c304df996cbd1ff119..2e945654722f70fc205ff6a519a006c336dcdc39 100644 (file)
@@ -80,7 +80,7 @@ GLOB_SYMB(complex_dotprod_sse):
        jmp     .L1_test
 
        .p2align 4
-.complex_dotprod_sse64_loop1:  
+.Loop1:        
 
        pxor    %mm0, %mm0
        punpcklwd       0(%rdi), %mm0
@@ -94,7 +94,7 @@ GLOB_SYMB(complex_dotprod_sse):
        addps   %xmm0, %xmm4
 .L1_test:      
        dec     %rax
-       jge     .complex_dotprod_sse64_loop1
+       jge     .Loop1
 
        
        # set up for primary loop which is unrolled 4 times
@@ -127,7 +127,7 @@ GLOB_SYMB(complex_dotprod_sse):
        # hence enter loop at top
 
        .p2align 4
-.complex_dotprod_sse64_loop2:
+.Loop2:
        mulps   (%rsi), %xmm0
        addps   %xmm2, %xmm6
 
@@ -167,7 +167,7 @@ GLOB_SYMB(complex_dotprod_sse):
        add     $0x40, %rsi
        add     $0x10, %rdi
        dec     %rdx
-       jne     .complex_dotprod_sse64_loop2
+       jne     .Loop2
 
        # OK, now we've done with all the multiplies, but
        # we still need to handle the unaccumulated
index 7aa11fe5661c6738ba915b8ea4f2c3efb7360d8b..8c49909c5c157937f7e1ce148a91e7d047e55e69 100644 (file)
@@ -92,7 +92,7 @@ GLOB_SYMB(fcomplex_dotprod_3dnow):
        #
        
        .p2align 4
-.fcomplex_dotprod_3dnow_loop1: 
+.Loop1:        
        pfmul   0(%edx), %mm0
        pfadd   %mm2, %mm6
 
@@ -129,7 +129,7 @@ GLOB_SYMB(fcomplex_dotprod_3dnow):
 
 .L1_test:
        decl    %ecx
-       jge     .fcomplex_dotprod_3dnow_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Now accumulate the final two additions and see if original
index c4566153b9efad36c8ec685f6a9e2e5a4abd93ac..2924d91a195c7b5f074f83242869bc8feae964e7 100644 (file)
@@ -91,7 +91,7 @@ GLOB_SYMB(fcomplex_dotprod_3dnow):
        #
        
        .p2align 4
-.fcomplex_dotprod_3dnow64_loop1:       
+.Loop1:        
        pfmul   0(%rsi), %mm0
        pfadd   %mm2, %mm6
 
@@ -128,7 +128,7 @@ GLOB_SYMB(fcomplex_dotprod_3dnow):
 
 .L1_test:
        dec     %rax
-       jge     .fcomplex_dotprod_3dnow64_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Now accumulate the final two additions and see if original
index 98563f9054e33baac1f14a831eb41aa81009e35d..e390c275cf601bcc4c37cc451eade0ae3ec18c62 100644 (file)
@@ -81,7 +81,7 @@ GLOB_SYMB(fcomplex_dotprod_sse):
        jmp     .L1_test
 
        .p2align 4
-.fcomplex_dotprod_sse_loop1:   
+.Loop1:        
 
        movlps  0(%eax), %xmm0
        shufps  $0x50, %xmm0, %xmm0     # b01010000
@@ -92,7 +92,7 @@ GLOB_SYMB(fcomplex_dotprod_sse):
        addps   %xmm0, %xmm4
 .L1_test:      
        decl    %ecx
-       jge     .fcomplex_dotprod_sse_loop1
+       jge     .Loop1
 
        
        # set up for primary loop which is unrolled 4 times
@@ -120,7 +120,7 @@ GLOB_SYMB(fcomplex_dotprod_sse):
        # hence enter loop at top
 
        .p2align 4
-.fcomplex_dotprod_sse_loop2:
+.Loop2:
        addps   %xmm2, %xmm6
        movlps  0x10(%eax), %xmm2
 
@@ -152,7 +152,7 @@ GLOB_SYMB(fcomplex_dotprod_sse):
        addl    $0x40, %edx
        addl    $0x20, %eax
        decl    %ecx
-       jne     .fcomplex_dotprod_sse_loop2
+       jne     .Loop2
 
        # OK, now we've done with all the multiplies, but
        # we still need to handle the unaccumulated
index b260bffcdc78339a692467b3726fd3879d32402f..9d985a19e8360ccf8e95af16b73d85977c58c7a5 100644 (file)
@@ -79,7 +79,7 @@ GLOB_SYMB(fcomplex_dotprod_sse):
        jmp     .L1_test
 
        .p2align 4
-.fcomplex_dotprod_sse64_loop1: 
+.Loop1:        
 
        movlps  0(%rdi), %xmm0
        shufps  $0x50, %xmm0, %xmm0     # b01010000
@@ -90,7 +90,7 @@ GLOB_SYMB(fcomplex_dotprod_sse):
        addps   %xmm0, %xmm4
 .L1_test:      
        dec     %rax
-       jge     .fcomplex_dotprod_sse64_loop1
+       jge     .Loop1
 
        
        # set up for primary loop which is unrolled 4 times
@@ -117,7 +117,7 @@ GLOB_SYMB(fcomplex_dotprod_sse):
        # hence enter loop at top
 
        .p2align 4
-.fcomplex_dotprod_sse64_loop2:
+.Loop2:
        addps   %xmm2, %xmm6
        movlps  0x10(%rdi), %xmm2
 
@@ -149,7 +149,7 @@ GLOB_SYMB(fcomplex_dotprod_sse):
        add     $0x40, %rsi
        add     $0x20, %rdi
        dec     %rdx
-       jne     .fcomplex_dotprod_sse64_loop2
+       jne     .Loop2
 
        # OK, now we've done with all the multiplies, but
        # we still need to handle the unaccumulated
index a5da9a852da96f5cf4388c4b4c2098536befda6b..9e2479cb66f08769a97fb94456ccbc9c96a858ae 100644 (file)
@@ -86,7 +86,7 @@ GLOB_SYMB(float_dotprod_3dnow):
        #
        
        .p2align 4
-.float_dotprod_3dnow_loop1:    
+.Loop1:        
        pfmul   0(%edx), %mm0
        pfadd   %mm2, %mm6
        movq    16(%eax), %mm2
@@ -107,7 +107,7 @@ GLOB_SYMB(float_dotprod_3dnow):
        addl    $32, %eax
 .L1_test:
        decl    %ecx
-       jge     .float_dotprod_3dnow_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Now accumulate the final two additions and see if original
index a19e007cc0f304f61add81f387c710fadefd4ff4..8558f564fdf20b1b8753a6a5019f689917cb86ff 100644 (file)
@@ -85,7 +85,7 @@ GLOB_SYMB(float_dotprod_3dnow):
        #
        
        .p2align 4
-.float_dotprod_3dnow64_loop1:  
+.Loop1:        
        pfmul   0(%rdi), %mm0
        pfadd   %mm2, %mm6
        movq    16(%rsi), %mm2
@@ -106,7 +106,7 @@ GLOB_SYMB(float_dotprod_3dnow):
        add     $32, %rsi
 .L1_test:
        dec     %rax
-       jge     .float_dotprod_3dnow64_loop1
+       jge     .Loop1
 
        # We've handled the bulk of multiplies up to here.
        # Now accumulate the final two additions and see if original
index a8f03b83f864de64588526149f2e91084b678059..31b0f3832eaa19f9606ebf5b598ad764e5f45304 100644 (file)
@@ -79,7 +79,7 @@ GLOB_SYMB(float_dotprod_sse):
        jmp     .L1_test
 
        .p2align 4
-.float_dotprod_sse_loop1:      
+.Loop1:        
        movaps  (%eax), %xmm0
        mulps   (%edx), %xmm0
        addl    $0x10, %edx
@@ -87,7 +87,7 @@ GLOB_SYMB(float_dotprod_sse):
        addps   %xmm0, %xmm4
 .L1_test:      
        decl    %ecx
-       jge     .float_dotprod_sse_loop1
+       jge     .Loop1
 
        
        # set up for primary loop which is unrolled 4 times
@@ -110,7 +110,7 @@ GLOB_SYMB(float_dotprod_sse):
        # hence enter loop at top
 
        .p2align 4
-.float_dotprod_sse_loop2:
+.Loop2:
        mulps   (%edx), %xmm0
        addps   %xmm2, %xmm6
        movaps  0x20(%eax), %xmm2
@@ -130,7 +130,7 @@ GLOB_SYMB(float_dotprod_sse):
        addl    $0x40, %edx
        addl    $0x40, %eax
        decl    %ecx
-       jne     .float_dotprod_sse_loop2
+       jne     .Loop2
 
        # OK, now we've done with all the multiplies, but
        # we still need to handle the unaccumulated
index 696f2cc0d100ef8fd81c1179eeaae940b2070ddf..4c5ad95cd0abecea0cf81eb2b6472b4af7789221 100644 (file)
@@ -77,7 +77,7 @@ GLOB_SYMB(float_dotprod_sse):
        jmp     .L1_test
 
        .p2align 4
-.float_dotprod_sse64_loop1:    
+.Loop1:        
        movaps  (%rsi), %xmm0
        mulps   (%rdi), %xmm0
        add     $0x10, %rdi
@@ -85,7 +85,7 @@ GLOB_SYMB(float_dotprod_sse):
        addps   %xmm0, %xmm4
 .L1_test:      
        dec     %rax
-       jge     .float_dotprod_sse64_loop1
+       jge     .Loop1
 
        
        # set up for primary loop which is unrolled 4 times
@@ -107,7 +107,7 @@ GLOB_SYMB(float_dotprod_sse):
        # hence enter loop at top
 
        .p2align 4
-.float_dotprod_sse64_loop2:
+.Loop2:
        mulps   (%rdi), %xmm0
        addps   %xmm2, %xmm6
        movaps  0x20(%rsi), %xmm2
@@ -127,7 +127,7 @@ GLOB_SYMB(float_dotprod_sse):
        add     $0x40, %rdi
        add     $0x40, %rsi
        dec     %rdx
-       jne     .float_dotprod_sse64_loop2
+       jne     .Loop2
 
        # OK, now we've done with all the multiplies, but
        # we still need to handle the unaccumulated