sycl-ref/kernels/sycl-ref-vector.cpp

*49ed4312SSebastian Grimberg// Copyright (c) 2017-2022, Lawrence Livermore National Security, LLC and other
*49ed4312SSebastian Grimberg// CEED contributors. All Rights Reserved. See the top-level LICENSE and NOTICE
*49ed4312SSebastian Grimberg// files for details.
*49ed4312SSebastian Grimberg//
*49ed4312SSebastian Grimberg// SPDX-License-Identifier: BSD-2-Clause
*49ed4312SSebastian Grimberg//
*49ed4312SSebastian Grimberg// This file is part of CEED:  http://github.com/ceed
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg#include <ceed/ceed.h>
*49ed4312SSebastian Grimberg#include <sycl/sycl.hpp>
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg// Kernel for set value on device
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg__global__ static void setValueK(CeedScalar *__restrict__ vec, CeedInt size, CeedScalar val) {
*49ed4312SSebastian Grimberg  int idx = threadIdx.x + blockDim.x * blockIdx.x;
*49ed4312SSebastian Grimberg  if (idx >= size) return;
*49ed4312SSebastian Grimberg  vec[idx] = val;
*49ed4312SSebastian Grimberg}
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg// Set value on device memory
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimbergextern "C" int CeedDeviceSetValue_Sycl(CeedScalar *d_array, CeedInt length, CeedScalar val) {
*49ed4312SSebastian Grimberg  const int bsize    = 512;
*49ed4312SSebastian Grimberg  const int vecsize  = length;
*49ed4312SSebastian Grimberg  int       gridsize = vecsize / bsize;
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg  if (bsize * gridsize < vecsize) gridsize += 1;
*49ed4312SSebastian Grimberg  setValueK<<<gridsize, bsize>>>(d_array, length, val);
*49ed4312SSebastian Grimberg  return 0;
*49ed4312SSebastian Grimberg}
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg// Kernel for taking reciprocal
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg__global__ static void rcpValueK(CeedScalar *__restrict__ vec, CeedInt size) {
*49ed4312SSebastian Grimberg  int idx = threadIdx.x + blockDim.x * blockIdx.x;
*49ed4312SSebastian Grimberg  if (idx >= size) return;
*49ed4312SSebastian Grimberg  if (fabs(vec[idx]) > 1E-16) vec[idx] = 1. / vec[idx];
*49ed4312SSebastian Grimberg}
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg// Take vector reciprocal in device memory
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimbergextern "C" int CeedDeviceReciprocal_Sycl(CeedScalar *d_array, CeedInt length) {
*49ed4312SSebastian Grimberg  const int bsize    = 512;
*49ed4312SSebastian Grimberg  const int vecsize  = length;
*49ed4312SSebastian Grimberg  int       gridsize = vecsize / bsize;
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg  if (bsize * gridsize < vecsize) gridsize += 1;
*49ed4312SSebastian Grimberg  rcpValueK<<<gridsize, bsize>>>(d_array, length);
*49ed4312SSebastian Grimberg  return 0;
*49ed4312SSebastian Grimberg}
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg// Kernel for scale
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg__global__ static void scaleValueK(CeedScalar *__restrict__ x, CeedScalar alpha, CeedInt size) {
*49ed4312SSebastian Grimberg  int idx = threadIdx.x + blockDim.x * blockIdx.x;
*49ed4312SSebastian Grimberg  if (idx >= size) return;
*49ed4312SSebastian Grimberg  x[idx] *= alpha;
*49ed4312SSebastian Grimberg}
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg// Compute x = alpha x on device
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimbergextern "C" int CeedDeviceScale_Sycl(CeedScalar *x_array, CeedScalar alpha, CeedInt length) {
*49ed4312SSebastian Grimberg  const int bsize    = 512;
*49ed4312SSebastian Grimberg  const int vecsize  = length;
*49ed4312SSebastian Grimberg  int       gridsize = vecsize / bsize;
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg  if (bsize * gridsize < vecsize) gridsize += 1;
*49ed4312SSebastian Grimberg  scaleValueK<<<gridsize, bsize>>>(x_array, alpha, length);
*49ed4312SSebastian Grimberg  return 0;
*49ed4312SSebastian Grimberg}
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg// Kernel for axpy
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg__global__ static void axpyValueK(CeedScalar *__restrict__ y, CeedScalar alpha, CeedScalar *__restrict__ x, CeedInt size) {
*49ed4312SSebastian Grimberg  int idx = threadIdx.x + blockDim.x * blockIdx.x;
*49ed4312SSebastian Grimberg  if (idx >= size) return;
*49ed4312SSebastian Grimberg  y[idx] += alpha * x[idx];
*49ed4312SSebastian Grimberg}
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg// Compute y = alpha x + y on device
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimbergextern "C" int CeedDeviceAXPY_Sycl(CeedScalar *y_array, CeedScalar alpha, CeedScalar *x_array, CeedInt length) {
*49ed4312SSebastian Grimberg  const int bsize    = 512;
*49ed4312SSebastian Grimberg  const int vecsize  = length;
*49ed4312SSebastian Grimberg  int       gridsize = vecsize / bsize;
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg  if (bsize * gridsize < vecsize) gridsize += 1;
*49ed4312SSebastian Grimberg  axpyValueK<<<gridsize, bsize>>>(y_array, alpha, x_array, length);
*49ed4312SSebastian Grimberg  return 0;
*49ed4312SSebastian Grimberg}
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg// Kernel for pointwise mult
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg__global__ static void pointwiseMultValueK(CeedScalar *__restrict__ w, CeedScalar *x, CeedScalar *__restrict__ y, CeedInt size) {
*49ed4312SSebastian Grimberg  int idx = threadIdx.x + blockDim.x * blockIdx.x;
*49ed4312SSebastian Grimberg  if (idx >= size) return;
*49ed4312SSebastian Grimberg  w[idx] = x[idx] * y[idx];
*49ed4312SSebastian Grimberg}
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimberg// Compute the pointwise multiplication w = x .* y on device
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------
*49ed4312SSebastian Grimbergextern "C" int CeedDevicePointwiseMult_Sycl(CeedScalar *w_array, CeedScalar *x_array, CeedScalar *y_array, CeedInt length) {
*49ed4312SSebastian Grimberg  const int bsize    = 512;
*49ed4312SSebastian Grimberg  const int vecsize  = length;
*49ed4312SSebastian Grimberg  int       gridsize = vecsize / bsize;
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg  if (bsize * gridsize < vecsize) gridsize += 1;
*49ed4312SSebastian Grimberg  pointwiseMultValueK<<<gridsize, bsize>>>(w_array, x_array, y_array, length);
*49ed4312SSebastian Grimberg  return 0;
*49ed4312SSebastian Grimberg}
*49ed4312SSebastian Grimberg
*49ed4312SSebastian Grimberg//------------------------------------------------------------------------------