Lines Matching refs:a1

679   __m256d a0, a1, a2, a3, a4, a5;  in MatMult_SeqBAIJ_9_AVX2()  local
727 a1 = _mm256_loadu_pd(&v[j * 81 + 4]); in MatMult_SeqBAIJ_9_AVX2()
728 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMult_SeqBAIJ_9_AVX2()
736 a1 = _mm256_loadu_pd(&v[j * 81 + 13]); in MatMult_SeqBAIJ_9_AVX2()
737 z1 = _mm256_fmadd_pd(a1, w1, z1); in MatMult_SeqBAIJ_9_AVX2()
754 a1 = _mm256_loadu_pd(&v[j * 81 + 31]); in MatMult_SeqBAIJ_9_AVX2()
755 z1 = _mm256_fmadd_pd(a1, w3, z1); in MatMult_SeqBAIJ_9_AVX2()
772 a1 = _mm256_loadu_pd(&v[j * 81 + 49]); in MatMult_SeqBAIJ_9_AVX2()
773 z1 = _mm256_fmadd_pd(a1, w1, z1); in MatMult_SeqBAIJ_9_AVX2()
781 a1 = _mm256_loadu_pd(&v[j * 81 + 58]); in MatMult_SeqBAIJ_9_AVX2()
782 z1 = _mm256_fmadd_pd(a1, w2, z1); in MatMult_SeqBAIJ_9_AVX2()
799 a1 = _mm256_loadu_pd(&v[j * 81 + 76]); in MatMult_SeqBAIJ_9_AVX2()
800 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMult_SeqBAIJ_9_AVX2()
1333 __m256d a0, a1, a2, a3, a4, a5; in MatMult_SeqBAIJ_12_AVX2() local
1366 a1 = _mm256_loadu_pd(v + 4); in MatMult_SeqBAIJ_12_AVX2()
1367 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMult_SeqBAIJ_12_AVX2()
1384 a1 = _mm256_loadu_pd(v + 28); in MatMult_SeqBAIJ_12_AVX2()
1385 z1 = _mm256_fmadd_pd(a1, w2, z1); in MatMult_SeqBAIJ_12_AVX2()
1402 a1 = _mm256_loadu_pd(v + 52); in MatMult_SeqBAIJ_12_AVX2()
1403 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMult_SeqBAIJ_12_AVX2()
1420 a1 = _mm256_loadu_pd(v + 76); in MatMult_SeqBAIJ_12_AVX2()
1421 z1 = _mm256_fmadd_pd(a1, w2, z1); in MatMult_SeqBAIJ_12_AVX2()
1438 a1 = _mm256_loadu_pd(v + 100); in MatMult_SeqBAIJ_12_AVX2()
1439 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMult_SeqBAIJ_12_AVX2()
1456 a1 = _mm256_loadu_pd(v + 124); in MatMult_SeqBAIJ_12_AVX2()
1457 z1 = _mm256_fmadd_pd(a1, w2, z1); in MatMult_SeqBAIJ_12_AVX2()
2515 __m256d a0, a1, a2, a3, a4, a5; in MatMultAdd_SeqBAIJ_9_AVX2() local
2563 a1 = _mm256_loadu_pd(&v[j * 81 + 4]); in MatMultAdd_SeqBAIJ_9_AVX2()
2564 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2572 a1 = _mm256_loadu_pd(&v[j * 81 + 13]); in MatMultAdd_SeqBAIJ_9_AVX2()
2573 z1 = _mm256_fmadd_pd(a1, w1, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2590 a1 = _mm256_loadu_pd(&v[j * 81 + 31]); in MatMultAdd_SeqBAIJ_9_AVX2()
2591 z1 = _mm256_fmadd_pd(a1, w3, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2608 a1 = _mm256_loadu_pd(&v[j * 81 + 49]); in MatMultAdd_SeqBAIJ_9_AVX2()
2609 z1 = _mm256_fmadd_pd(a1, w1, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2617 a1 = _mm256_loadu_pd(&v[j * 81 + 58]); in MatMultAdd_SeqBAIJ_9_AVX2()
2618 z1 = _mm256_fmadd_pd(a1, w2, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2635 a1 = _mm256_loadu_pd(&v[j * 81 + 76]); in MatMultAdd_SeqBAIJ_9_AVX2()
2636 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMultAdd_SeqBAIJ_9_AVX2()