Lines Matching refs:a2

679   __m256d a0, a1, a2, a3, a4, a5;  in MatMult_SeqBAIJ_9_AVX2()  local
729 a2 = _mm256_loadu_pd(&v[j * 81 + 8]); in MatMult_SeqBAIJ_9_AVX2()
730 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMult_SeqBAIJ_9_AVX2()
738 a2 = _mm256_loadu_pd(&v[j * 81 + 17]); in MatMult_SeqBAIJ_9_AVX2()
739 z2 = _mm256_fmadd_pd(a2, w1, z2); in MatMult_SeqBAIJ_9_AVX2()
756 a2 = _mm256_loadu_pd(&v[j * 81 + 35]); in MatMult_SeqBAIJ_9_AVX2()
757 z2 = _mm256_fmadd_pd(a2, w3, z2); in MatMult_SeqBAIJ_9_AVX2()
774 a2 = _mm256_loadu_pd(&v[j * 81 + 53]); in MatMult_SeqBAIJ_9_AVX2()
775 z2 = _mm256_fmadd_pd(a2, w1, z2); in MatMult_SeqBAIJ_9_AVX2()
783 a2 = _mm256_loadu_pd(&v[j * 81 + 62]); in MatMult_SeqBAIJ_9_AVX2()
784 z2 = _mm256_fmadd_pd(a2, w2, z2); in MatMult_SeqBAIJ_9_AVX2()
801 a2 = _mm256_maskload_pd(&v[j * 81 + 80], mask1); in MatMult_SeqBAIJ_9_AVX2()
802 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMult_SeqBAIJ_9_AVX2()
1333 __m256d a0, a1, a2, a3, a4, a5; in MatMult_SeqBAIJ_12_AVX2() local
1368 a2 = _mm256_loadu_pd(v + 8); in MatMult_SeqBAIJ_12_AVX2()
1369 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMult_SeqBAIJ_12_AVX2()
1386 a2 = _mm256_loadu_pd(v + 32); in MatMult_SeqBAIJ_12_AVX2()
1387 z2 = _mm256_fmadd_pd(a2, w2, z2); in MatMult_SeqBAIJ_12_AVX2()
1404 a2 = _mm256_loadu_pd(v + 56); in MatMult_SeqBAIJ_12_AVX2()
1405 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMult_SeqBAIJ_12_AVX2()
1422 a2 = _mm256_loadu_pd(v + 80); in MatMult_SeqBAIJ_12_AVX2()
1423 z2 = _mm256_fmadd_pd(a2, w2, z2); in MatMult_SeqBAIJ_12_AVX2()
1440 a2 = _mm256_loadu_pd(v + 104); in MatMult_SeqBAIJ_12_AVX2()
1441 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMult_SeqBAIJ_12_AVX2()
1458 a2 = _mm256_loadu_pd(v + 128); in MatMult_SeqBAIJ_12_AVX2()
1459 z2 = _mm256_fmadd_pd(a2, w2, z2); in MatMult_SeqBAIJ_12_AVX2()
2515 __m256d a0, a1, a2, a3, a4, a5; in MatMultAdd_SeqBAIJ_9_AVX2() local
2565 a2 = _mm256_loadu_pd(&v[j * 81 + 8]); in MatMultAdd_SeqBAIJ_9_AVX2()
2566 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2574 a2 = _mm256_loadu_pd(&v[j * 81 + 17]); in MatMultAdd_SeqBAIJ_9_AVX2()
2575 z2 = _mm256_fmadd_pd(a2, w1, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2592 a2 = _mm256_loadu_pd(&v[j * 81 + 35]); in MatMultAdd_SeqBAIJ_9_AVX2()
2593 z2 = _mm256_fmadd_pd(a2, w3, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2610 a2 = _mm256_loadu_pd(&v[j * 81 + 53]); in MatMultAdd_SeqBAIJ_9_AVX2()
2611 z2 = _mm256_fmadd_pd(a2, w1, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2619 a2 = _mm256_loadu_pd(&v[j * 81 + 62]); in MatMultAdd_SeqBAIJ_9_AVX2()
2620 z2 = _mm256_fmadd_pd(a2, w2, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2637 a2 = _mm256_maskload_pd(&v[j * 81 + 80], mask1); in MatMultAdd_SeqBAIJ_9_AVX2()
2638 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMultAdd_SeqBAIJ_9_AVX2()