Lines Matching refs:z2
681 __m256d z0, z1, z2; in MatMult_SeqBAIJ_9_AVX2() local
720 z2 = _mm256_setzero_pd(); in MatMult_SeqBAIJ_9_AVX2()
730 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMult_SeqBAIJ_9_AVX2()
739 z2 = _mm256_fmadd_pd(a2, w1, z2); in MatMult_SeqBAIJ_9_AVX2()
748 z2 = _mm256_fmadd_pd(a5, w2, z2); in MatMult_SeqBAIJ_9_AVX2()
757 z2 = _mm256_fmadd_pd(a2, w3, z2); in MatMult_SeqBAIJ_9_AVX2()
766 z2 = _mm256_fmadd_pd(a5, w0, z2); in MatMult_SeqBAIJ_9_AVX2()
775 z2 = _mm256_fmadd_pd(a2, w1, z2); in MatMult_SeqBAIJ_9_AVX2()
784 z2 = _mm256_fmadd_pd(a2, w2, z2); in MatMult_SeqBAIJ_9_AVX2()
793 z2 = _mm256_fmadd_pd(a5, w3, z2); in MatMult_SeqBAIJ_9_AVX2()
802 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMult_SeqBAIJ_9_AVX2()
807 _mm256_maskstore_pd(&z[8], mask1, z2); in MatMult_SeqBAIJ_9_AVX2()
1335 __m256d z0, z1, z2; in MatMult_SeqBAIJ_12_AVX2() local
1355 z2 = _mm256_setzero_pd(); in MatMult_SeqBAIJ_12_AVX2()
1369 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMult_SeqBAIJ_12_AVX2()
1378 z2 = _mm256_fmadd_pd(a5, w1, z2); in MatMult_SeqBAIJ_12_AVX2()
1387 z2 = _mm256_fmadd_pd(a2, w2, z2); in MatMult_SeqBAIJ_12_AVX2()
1396 z2 = _mm256_fmadd_pd(a5, w3, z2); in MatMult_SeqBAIJ_12_AVX2()
1405 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMult_SeqBAIJ_12_AVX2()
1414 z2 = _mm256_fmadd_pd(a5, w1, z2); in MatMult_SeqBAIJ_12_AVX2()
1423 z2 = _mm256_fmadd_pd(a2, w2, z2); in MatMult_SeqBAIJ_12_AVX2()
1432 z2 = _mm256_fmadd_pd(a5, w3, z2); in MatMult_SeqBAIJ_12_AVX2()
1441 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMult_SeqBAIJ_12_AVX2()
1450 z2 = _mm256_fmadd_pd(a5, w1, z2); in MatMult_SeqBAIJ_12_AVX2()
1459 z2 = _mm256_fmadd_pd(a2, w2, z2); in MatMult_SeqBAIJ_12_AVX2()
1468 z2 = _mm256_fmadd_pd(a5, w3, z2); in MatMult_SeqBAIJ_12_AVX2()
1475 _mm256_storeu_pd(&z[8], z2); in MatMult_SeqBAIJ_12_AVX2()
2517 __m256d z0, z1, z2; in MatMultAdd_SeqBAIJ_9_AVX2() local
2556 z2 = _mm256_set1_pd(z[8]); in MatMultAdd_SeqBAIJ_9_AVX2()
2566 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2575 z2 = _mm256_fmadd_pd(a2, w1, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2584 z2 = _mm256_fmadd_pd(a5, w2, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2593 z2 = _mm256_fmadd_pd(a2, w3, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2602 z2 = _mm256_fmadd_pd(a5, w0, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2611 z2 = _mm256_fmadd_pd(a2, w1, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2620 z2 = _mm256_fmadd_pd(a2, w2, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2629 z2 = _mm256_fmadd_pd(a5, w3, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2638 z2 = _mm256_fmadd_pd(a2, w0, z2); in MatMultAdd_SeqBAIJ_9_AVX2()
2643 _mm256_maskstore_pd(&z[8], mask1, z2); in MatMultAdd_SeqBAIJ_9_AVX2()