1a4af0ceeSJacob Faibussowitsch static const char help[] = "Tests PetscDeviceContextFork/Join.\n\n"; 2a4af0ceeSJacob Faibussowitsch 3a4af0ceeSJacob Faibussowitsch #include <petsc/private/deviceimpl.h> 4a4af0ceeSJacob Faibussowitsch #include "petscdevicetestcommon.h" 5a4af0ceeSJacob Faibussowitsch 6a4af0ceeSJacob Faibussowitsch static PetscErrorCode TestNestedPetscDeviceContextForkJoin(PetscDeviceContext parCtx, PetscDeviceContext *sub) 7a4af0ceeSJacob Faibussowitsch { 8a4af0ceeSJacob Faibussowitsch const PetscInt nsub = 4; 9a4af0ceeSJacob Faibussowitsch PetscDeviceContext *subsub; 10a4af0ceeSJacob Faibussowitsch PetscErrorCode ierr; 11a4af0ceeSJacob Faibussowitsch 12a4af0ceeSJacob Faibussowitsch PetscFunctionBegin; 13a4af0ceeSJacob Faibussowitsch PetscValidDeviceContext(parCtx,1); 14a4af0ceeSJacob Faibussowitsch PetscValidPointer(sub,2); 15a4af0ceeSJacob Faibussowitsch ierr = AssertPetscDeviceContextsValidAndEqual(parCtx,sub[0],"Current global context does not match expected global context");CHKERRQ(ierr); 16a4af0ceeSJacob Faibussowitsch /* create some children from an active child */ 17a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextFork(sub[1],nsub,&subsub);CHKERRQ(ierr); 18a4af0ceeSJacob Faibussowitsch /* join on a sibling to the parent */ 19a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextJoin(sub[2],nsub-2,PETSC_DEVICE_CONTEXT_JOIN_SYNC,&subsub);CHKERRQ(ierr); 20a4af0ceeSJacob Faibussowitsch /* join on the grandparent */ 21a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextJoin(parCtx,nsub-2,PETSC_DEVICE_CONTEXT_JOIN_NO_SYNC,&subsub);CHKERRQ(ierr); 22a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextJoin(sub[1],nsub,PETSC_DEVICE_CONTEXT_JOIN_DESTROY,&subsub);CHKERRQ(ierr); 23a4af0ceeSJacob Faibussowitsch PetscFunctionReturn(0); 24a4af0ceeSJacob Faibussowitsch } 25a4af0ceeSJacob Faibussowitsch 26a4af0ceeSJacob Faibussowitsch /* test fork-join */ 27a4af0ceeSJacob Faibussowitsch static PetscErrorCode TestPetscDeviceContextForkJoin(PetscDeviceContext dctx) 28a4af0ceeSJacob Faibussowitsch { 29a4af0ceeSJacob Faibussowitsch PetscDeviceContext *sub; 30a4af0ceeSJacob Faibussowitsch const PetscInt n = 10; 31a4af0ceeSJacob Faibussowitsch PetscErrorCode ierr; 32a4af0ceeSJacob Faibussowitsch 33a4af0ceeSJacob Faibussowitsch PetscFunctionBegin; 34a4af0ceeSJacob Faibussowitsch PetscValidDeviceContext(dctx,1); 35a4af0ceeSJacob Faibussowitsch /* mostly for valgrind to catch errors */ 36a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextFork(dctx,n,&sub);CHKERRQ(ierr); 37a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextJoin(dctx,n,PETSC_DEVICE_CONTEXT_JOIN_DESTROY,&sub);CHKERRQ(ierr); 38a4af0ceeSJacob Faibussowitsch /* do it twice */ 39a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextFork(dctx,n,&sub);CHKERRQ(ierr); 40a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextJoin(dctx,n,PETSC_DEVICE_CONTEXT_JOIN_DESTROY,&sub);CHKERRQ(ierr); 41a4af0ceeSJacob Faibussowitsch 42a4af0ceeSJacob Faibussowitsch /* create some children */ 43a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextFork(dctx,n+1,&sub);CHKERRQ(ierr); 44a4af0ceeSJacob Faibussowitsch /* test forking within nested function */ 45a4af0ceeSJacob Faibussowitsch ierr = TestNestedPetscDeviceContextForkJoin(sub[0],sub);CHKERRQ(ierr); 46a4af0ceeSJacob Faibussowitsch /* join a subset */ 47a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextJoin(dctx,n-1,PETSC_DEVICE_CONTEXT_JOIN_NO_SYNC,&sub);CHKERRQ(ierr); 48a4af0ceeSJacob Faibussowitsch /* back to the ether from whence they came */ 49a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextJoin(dctx,n+1,PETSC_DEVICE_CONTEXT_JOIN_DESTROY,&sub);CHKERRQ(ierr); 50a4af0ceeSJacob Faibussowitsch PetscFunctionReturn(0); 51a4af0ceeSJacob Faibussowitsch } 52a4af0ceeSJacob Faibussowitsch 53a4af0ceeSJacob Faibussowitsch int main(int argc, char *argv[]) 54a4af0ceeSJacob Faibussowitsch { 55a4af0ceeSJacob Faibussowitsch PetscDeviceContext dctx; 56a4af0ceeSJacob Faibussowitsch PetscErrorCode ierr; 57a4af0ceeSJacob Faibussowitsch 58a4af0ceeSJacob Faibussowitsch ierr = PetscInitialize(&argc,&argv,NULL,help);if (ierr) return ierr; 59a4af0ceeSJacob Faibussowitsch 60a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextCreate(&dctx);CHKERRQ(ierr); 61a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextSetFromOptions(PETSC_COMM_WORLD,"local_",dctx);CHKERRQ(ierr); 62a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextSetUp(dctx);CHKERRQ(ierr); 63a4af0ceeSJacob Faibussowitsch ierr = TestPetscDeviceContextForkJoin(dctx);CHKERRQ(ierr); 64a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextDestroy(&dctx);CHKERRQ(ierr); 65a4af0ceeSJacob Faibussowitsch 66a4af0ceeSJacob Faibussowitsch ierr = PetscDeviceContextGetCurrentContext(&dctx);CHKERRQ(ierr); 67a4af0ceeSJacob Faibussowitsch ierr = TestPetscDeviceContextForkJoin(dctx);CHKERRQ(ierr); 68a4af0ceeSJacob Faibussowitsch 69a4af0ceeSJacob Faibussowitsch ierr = PetscPrintf(PETSC_COMM_WORLD,"EXIT_SUCCESS\n");CHKERRQ(ierr); 70a4af0ceeSJacob Faibussowitsch ierr = PetscFinalize(); 71a4af0ceeSJacob Faibussowitsch return ierr; 72a4af0ceeSJacob Faibussowitsch } 73a4af0ceeSJacob Faibussowitsch 74a4af0ceeSJacob Faibussowitsch /*TEST 75a4af0ceeSJacob Faibussowitsch 76a4af0ceeSJacob Faibussowitsch build: 77*cb9b7bb0SJacob Faibussowitsch requires: defined(PETSC_HAVE_CXX) 78a4af0ceeSJacob Faibussowitsch 79a4af0ceeSJacob Faibussowitsch test: 80a4af0ceeSJacob Faibussowitsch requires: !device 81a4af0ceeSJacob Faibussowitsch suffix: no_device 82a4af0ceeSJacob Faibussowitsch filter: Error: grep -E -o -e ".*No support for this operation for this object type" -e ".*PETSc is not configured with device support.*" -e "^\[0\]PETSC ERROR:.*[0-9]{1} [A-z]+\(\)" 83a4af0ceeSJacob Faibussowitsch 84a4af0ceeSJacob Faibussowitsch testset: 85a4af0ceeSJacob Faibussowitsch output_file: ./output/ExitSuccess.out 86a4af0ceeSJacob Faibussowitsch nsize: {{1 3}} 87a4af0ceeSJacob Faibussowitsch args: -local_device_context_stream_type {{global_blocking default_blocking global_nonblocking}} 88a4af0ceeSJacob Faibussowitsch test: 89a4af0ceeSJacob Faibussowitsch requires: cuda 90a4af0ceeSJacob Faibussowitsch suffix: cuda 91a4af0ceeSJacob Faibussowitsch test: 92a4af0ceeSJacob Faibussowitsch requires: hip 93a4af0ceeSJacob Faibussowitsch suffix: hip 94a4af0ceeSJacob Faibussowitsch 95a4af0ceeSJacob Faibussowitsch TEST*/ 96