Lines Matching refs:z1

681   __m256d z0, z1, z2;  in MatMult_SeqBAIJ_9_AVX2()  local
719 z1 = _mm256_setzero_pd(); in MatMult_SeqBAIJ_9_AVX2()
728 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMult_SeqBAIJ_9_AVX2()
737 z1 = _mm256_fmadd_pd(a1, w1, z1); in MatMult_SeqBAIJ_9_AVX2()
746 z1 = _mm256_fmadd_pd(a4, w2, z1); in MatMult_SeqBAIJ_9_AVX2()
755 z1 = _mm256_fmadd_pd(a1, w3, z1); in MatMult_SeqBAIJ_9_AVX2()
764 z1 = _mm256_fmadd_pd(a4, w0, z1); in MatMult_SeqBAIJ_9_AVX2()
773 z1 = _mm256_fmadd_pd(a1, w1, z1); in MatMult_SeqBAIJ_9_AVX2()
782 z1 = _mm256_fmadd_pd(a1, w2, z1); in MatMult_SeqBAIJ_9_AVX2()
791 z1 = _mm256_fmadd_pd(a4, w3, z1); in MatMult_SeqBAIJ_9_AVX2()
800 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMult_SeqBAIJ_9_AVX2()
806 _mm256_storeu_pd(&z[4], z1); in MatMult_SeqBAIJ_9_AVX2()
1335 __m256d z0, z1, z2; in MatMult_SeqBAIJ_12_AVX2() local
1354 z1 = _mm256_setzero_pd(); in MatMult_SeqBAIJ_12_AVX2()
1367 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMult_SeqBAIJ_12_AVX2()
1376 z1 = _mm256_fmadd_pd(a4, w1, z1); in MatMult_SeqBAIJ_12_AVX2()
1385 z1 = _mm256_fmadd_pd(a1, w2, z1); in MatMult_SeqBAIJ_12_AVX2()
1394 z1 = _mm256_fmadd_pd(a4, w3, z1); in MatMult_SeqBAIJ_12_AVX2()
1403 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMult_SeqBAIJ_12_AVX2()
1412 z1 = _mm256_fmadd_pd(a4, w1, z1); in MatMult_SeqBAIJ_12_AVX2()
1421 z1 = _mm256_fmadd_pd(a1, w2, z1); in MatMult_SeqBAIJ_12_AVX2()
1430 z1 = _mm256_fmadd_pd(a4, w3, z1); in MatMult_SeqBAIJ_12_AVX2()
1439 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMult_SeqBAIJ_12_AVX2()
1448 z1 = _mm256_fmadd_pd(a4, w1, z1); in MatMult_SeqBAIJ_12_AVX2()
1457 z1 = _mm256_fmadd_pd(a1, w2, z1); in MatMult_SeqBAIJ_12_AVX2()
1466 z1 = _mm256_fmadd_pd(a4, w3, z1); in MatMult_SeqBAIJ_12_AVX2()
1474 _mm256_storeu_pd(&z[4], z1); in MatMult_SeqBAIJ_12_AVX2()
2517 __m256d z0, z1, z2; in MatMultAdd_SeqBAIJ_9_AVX2() local
2555 z1 = _mm256_loadu_pd(&z[4]); in MatMultAdd_SeqBAIJ_9_AVX2()
2564 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2573 z1 = _mm256_fmadd_pd(a1, w1, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2582 z1 = _mm256_fmadd_pd(a4, w2, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2591 z1 = _mm256_fmadd_pd(a1, w3, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2600 z1 = _mm256_fmadd_pd(a4, w0, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2609 z1 = _mm256_fmadd_pd(a1, w1, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2618 z1 = _mm256_fmadd_pd(a1, w2, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2627 z1 = _mm256_fmadd_pd(a4, w3, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2636 z1 = _mm256_fmadd_pd(a1, w0, z1); in MatMultAdd_SeqBAIJ_9_AVX2()
2642 _mm256_storeu_pd(&z[4], z1); in MatMultAdd_SeqBAIJ_9_AVX2()