xref: /petsc/src/sys/objects/device/tests/ex4.c (revision cb9b7bb0b9f68fc121f797778e409e2e056048fa)
1a4af0ceeSJacob Faibussowitsch static const char help[] = "Tests PetscDeviceContextFork/Join.\n\n";
2a4af0ceeSJacob Faibussowitsch 
3a4af0ceeSJacob Faibussowitsch #include <petsc/private/deviceimpl.h>
4a4af0ceeSJacob Faibussowitsch #include "petscdevicetestcommon.h"
5a4af0ceeSJacob Faibussowitsch 
6a4af0ceeSJacob Faibussowitsch static PetscErrorCode TestNestedPetscDeviceContextForkJoin(PetscDeviceContext parCtx, PetscDeviceContext *sub)
7a4af0ceeSJacob Faibussowitsch {
8a4af0ceeSJacob Faibussowitsch   const PetscInt      nsub = 4;
9a4af0ceeSJacob Faibussowitsch   PetscDeviceContext *subsub;
10a4af0ceeSJacob Faibussowitsch   PetscErrorCode      ierr;
11a4af0ceeSJacob Faibussowitsch 
12a4af0ceeSJacob Faibussowitsch   PetscFunctionBegin;
13a4af0ceeSJacob Faibussowitsch   PetscValidDeviceContext(parCtx,1);
14a4af0ceeSJacob Faibussowitsch   PetscValidPointer(sub,2);
15a4af0ceeSJacob Faibussowitsch   ierr = AssertPetscDeviceContextsValidAndEqual(parCtx,sub[0],"Current global context does not match expected global context");CHKERRQ(ierr);
16a4af0ceeSJacob Faibussowitsch   /* create some children from an active child */
17a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextFork(sub[1],nsub,&subsub);CHKERRQ(ierr);
18a4af0ceeSJacob Faibussowitsch   /* join on a sibling to the parent */
19a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextJoin(sub[2],nsub-2,PETSC_DEVICE_CONTEXT_JOIN_SYNC,&subsub);CHKERRQ(ierr);
20a4af0ceeSJacob Faibussowitsch   /* join on the grandparent */
21a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextJoin(parCtx,nsub-2,PETSC_DEVICE_CONTEXT_JOIN_NO_SYNC,&subsub);CHKERRQ(ierr);
22a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextJoin(sub[1],nsub,PETSC_DEVICE_CONTEXT_JOIN_DESTROY,&subsub);CHKERRQ(ierr);
23a4af0ceeSJacob Faibussowitsch   PetscFunctionReturn(0);
24a4af0ceeSJacob Faibussowitsch }
25a4af0ceeSJacob Faibussowitsch 
26a4af0ceeSJacob Faibussowitsch /* test fork-join */
27a4af0ceeSJacob Faibussowitsch static PetscErrorCode TestPetscDeviceContextForkJoin(PetscDeviceContext dctx)
28a4af0ceeSJacob Faibussowitsch {
29a4af0ceeSJacob Faibussowitsch   PetscDeviceContext *sub;
30a4af0ceeSJacob Faibussowitsch   const PetscInt      n = 10;
31a4af0ceeSJacob Faibussowitsch   PetscErrorCode      ierr;
32a4af0ceeSJacob Faibussowitsch 
33a4af0ceeSJacob Faibussowitsch   PetscFunctionBegin;
34a4af0ceeSJacob Faibussowitsch   PetscValidDeviceContext(dctx,1);
35a4af0ceeSJacob Faibussowitsch   /* mostly for valgrind to catch errors */
36a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextFork(dctx,n,&sub);CHKERRQ(ierr);
37a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextJoin(dctx,n,PETSC_DEVICE_CONTEXT_JOIN_DESTROY,&sub);CHKERRQ(ierr);
38a4af0ceeSJacob Faibussowitsch   /* do it twice */
39a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextFork(dctx,n,&sub);CHKERRQ(ierr);
40a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextJoin(dctx,n,PETSC_DEVICE_CONTEXT_JOIN_DESTROY,&sub);CHKERRQ(ierr);
41a4af0ceeSJacob Faibussowitsch 
42a4af0ceeSJacob Faibussowitsch   /* create some children */
43a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextFork(dctx,n+1,&sub);CHKERRQ(ierr);
44a4af0ceeSJacob Faibussowitsch   /* test forking within nested function */
45a4af0ceeSJacob Faibussowitsch   ierr = TestNestedPetscDeviceContextForkJoin(sub[0],sub);CHKERRQ(ierr);
46a4af0ceeSJacob Faibussowitsch   /* join a subset */
47a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextJoin(dctx,n-1,PETSC_DEVICE_CONTEXT_JOIN_NO_SYNC,&sub);CHKERRQ(ierr);
48a4af0ceeSJacob Faibussowitsch   /* back to the ether from whence they came */
49a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextJoin(dctx,n+1,PETSC_DEVICE_CONTEXT_JOIN_DESTROY,&sub);CHKERRQ(ierr);
50a4af0ceeSJacob Faibussowitsch   PetscFunctionReturn(0);
51a4af0ceeSJacob Faibussowitsch }
52a4af0ceeSJacob Faibussowitsch 
53a4af0ceeSJacob Faibussowitsch int main(int argc, char *argv[])
54a4af0ceeSJacob Faibussowitsch {
55a4af0ceeSJacob Faibussowitsch   PetscDeviceContext dctx;
56a4af0ceeSJacob Faibussowitsch   PetscErrorCode     ierr;
57a4af0ceeSJacob Faibussowitsch 
58a4af0ceeSJacob Faibussowitsch   ierr = PetscInitialize(&argc,&argv,NULL,help);if (ierr) return ierr;
59a4af0ceeSJacob Faibussowitsch 
60a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextCreate(&dctx);CHKERRQ(ierr);
61a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextSetFromOptions(PETSC_COMM_WORLD,"local_",dctx);CHKERRQ(ierr);
62a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextSetUp(dctx);CHKERRQ(ierr);
63a4af0ceeSJacob Faibussowitsch   ierr = TestPetscDeviceContextForkJoin(dctx);CHKERRQ(ierr);
64a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextDestroy(&dctx);CHKERRQ(ierr);
65a4af0ceeSJacob Faibussowitsch 
66a4af0ceeSJacob Faibussowitsch   ierr = PetscDeviceContextGetCurrentContext(&dctx);CHKERRQ(ierr);
67a4af0ceeSJacob Faibussowitsch   ierr = TestPetscDeviceContextForkJoin(dctx);CHKERRQ(ierr);
68a4af0ceeSJacob Faibussowitsch 
69a4af0ceeSJacob Faibussowitsch   ierr = PetscPrintf(PETSC_COMM_WORLD,"EXIT_SUCCESS\n");CHKERRQ(ierr);
70a4af0ceeSJacob Faibussowitsch   ierr = PetscFinalize();
71a4af0ceeSJacob Faibussowitsch   return ierr;
72a4af0ceeSJacob Faibussowitsch }
73a4af0ceeSJacob Faibussowitsch 
74a4af0ceeSJacob Faibussowitsch /*TEST
75a4af0ceeSJacob Faibussowitsch 
76a4af0ceeSJacob Faibussowitsch  build:
77*cb9b7bb0SJacob Faibussowitsch    requires: defined(PETSC_HAVE_CXX)
78a4af0ceeSJacob Faibussowitsch 
79a4af0ceeSJacob Faibussowitsch  test:
80a4af0ceeSJacob Faibussowitsch    requires: !device
81a4af0ceeSJacob Faibussowitsch    suffix: no_device
82a4af0ceeSJacob Faibussowitsch    filter: Error: grep -E -o -e ".*No support for this operation for this object type" -e ".*PETSc is not configured with device support.*" -e "^\[0\]PETSC ERROR:.*[0-9]{1} [A-z]+\(\)"
83a4af0ceeSJacob Faibussowitsch 
84a4af0ceeSJacob Faibussowitsch  testset:
85a4af0ceeSJacob Faibussowitsch    output_file: ./output/ExitSuccess.out
86a4af0ceeSJacob Faibussowitsch    nsize: {{1 3}}
87a4af0ceeSJacob Faibussowitsch    args: -local_device_context_stream_type {{global_blocking default_blocking global_nonblocking}}
88a4af0ceeSJacob Faibussowitsch    test:
89a4af0ceeSJacob Faibussowitsch      requires: cuda
90a4af0ceeSJacob Faibussowitsch      suffix: cuda
91a4af0ceeSJacob Faibussowitsch    test:
92a4af0ceeSJacob Faibussowitsch      requires: hip
93a4af0ceeSJacob Faibussowitsch      suffix: hip
94a4af0ceeSJacob Faibussowitsch 
95a4af0ceeSJacob Faibussowitsch TEST*/
96