10e6b6b59SJacob Faibussowitsch #include "petscdevice_interface_internal.hpp" /*I <petscdevice.h> I*/ 20e6b6b59SJacob Faibussowitsch 30e6b6b59SJacob Faibussowitsch #include <petsc/private/cpp/object_pool.hpp> 40e6b6b59SJacob Faibussowitsch #include <petsc/private/cpp/utility.hpp> 50e6b6b59SJacob Faibussowitsch 60e6b6b59SJacob Faibussowitsch #include <unordered_map> 70e6b6b59SJacob Faibussowitsch #include <algorithm> // std::remove_if(), std::find_if() 80e6b6b59SJacob Faibussowitsch #include <vector> 90e6b6b59SJacob Faibussowitsch #include <string> 100e6b6b59SJacob Faibussowitsch #include <sstream> // std::ostringstream 110e6b6b59SJacob Faibussowitsch 12*a966a306SPierre Jolivet #if defined(__clang__) 13*a966a306SPierre Jolivet #pragma clang diagnostic push 14*a966a306SPierre Jolivet #pragma clang diagnostic ignored "-Wgnu-zero-variadic-macro-arguments" 15*a966a306SPierre Jolivet #endif 16*a966a306SPierre Jolivet 170e6b6b59SJacob Faibussowitsch // ========================================================================================== 180e6b6b59SJacob Faibussowitsch // PetscEvent 190e6b6b59SJacob Faibussowitsch // ========================================================================================== 200e6b6b59SJacob Faibussowitsch 210e6b6b59SJacob Faibussowitsch struct PetscEventAllocator : public Petsc::AllocatorBase<PetscEvent> { 220e6b6b59SJacob Faibussowitsch PETSC_NODISCARD static PetscErrorCode create(PetscEvent *event) noexcept { 230e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 240e6b6b59SJacob Faibussowitsch PetscCall(PetscNew(event)); 250e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 260e6b6b59SJacob Faibussowitsch } 270e6b6b59SJacob Faibussowitsch 280e6b6b59SJacob Faibussowitsch PETSC_NODISCARD static PetscErrorCode destroy(PetscEvent event) noexcept { 290e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 300e6b6b59SJacob Faibussowitsch PetscCall(reset(event)); 310e6b6b59SJacob Faibussowitsch PetscCall(PetscFree(event)); 320e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 330e6b6b59SJacob Faibussowitsch } 340e6b6b59SJacob Faibussowitsch 350e6b6b59SJacob Faibussowitsch PETSC_NODISCARD static PetscErrorCode reset(PetscEvent event, bool zero = true) noexcept { 360e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 370e6b6b59SJacob Faibussowitsch if (zero) { 380e6b6b59SJacob Faibussowitsch if (auto &destroy = event->destroy) { 390e6b6b59SJacob Faibussowitsch PetscCall((*destroy)(event)); 400e6b6b59SJacob Faibussowitsch destroy = nullptr; 410e6b6b59SJacob Faibussowitsch } 420e6b6b59SJacob Faibussowitsch event->dctx_id = 0; 430e6b6b59SJacob Faibussowitsch event->dctx_state = 0; 440e6b6b59SJacob Faibussowitsch PetscAssert(!event->data, PETSC_COMM_SELF, PETSC_ERR_PLIB, "Event failed to destroy its data member: %p", event->data); 450e6b6b59SJacob Faibussowitsch } 460e6b6b59SJacob Faibussowitsch event->dtype = PETSC_DEVICE_DEFAULT(); 470e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 480e6b6b59SJacob Faibussowitsch } 490e6b6b59SJacob Faibussowitsch }; 500e6b6b59SJacob Faibussowitsch 510e6b6b59SJacob Faibussowitsch static Petsc::ObjectPool<PetscEvent, PetscEventAllocator> event_pool; 520e6b6b59SJacob Faibussowitsch 530e6b6b59SJacob Faibussowitsch static PetscErrorCode PetscDeviceContextCreateEvent_Private(PetscDeviceContext dctx, PetscEvent *event) { 540e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 550e6b6b59SJacob Faibussowitsch PetscValidDeviceContext(dctx, 1); 560e6b6b59SJacob Faibussowitsch PetscValidPointer(event, 2); 570e6b6b59SJacob Faibussowitsch PetscCall(event_pool.allocate(event)); 580e6b6b59SJacob Faibussowitsch PetscCall(PetscDeviceContextGetDeviceType(dctx, &(*event)->dtype)); 590e6b6b59SJacob Faibussowitsch PetscTryTypeMethod(dctx, createevent, *event); 600e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 610e6b6b59SJacob Faibussowitsch } 620e6b6b59SJacob Faibussowitsch 630e6b6b59SJacob Faibussowitsch static PetscErrorCode PetscEventDestroy_Private(PetscEvent *event) { 640e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 650e6b6b59SJacob Faibussowitsch PetscValidPointer(event, 1); 660e6b6b59SJacob Faibussowitsch if (*event) PetscCall(event_pool.deallocate(Petsc::util::exchange(*event, nullptr))); 670e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 680e6b6b59SJacob Faibussowitsch } 690e6b6b59SJacob Faibussowitsch 700e6b6b59SJacob Faibussowitsch static PetscErrorCode PetscDeviceContextRecordEvent_Private(PetscDeviceContext dctx, PetscEvent event) { 710e6b6b59SJacob Faibussowitsch PetscObjectId id; 720e6b6b59SJacob Faibussowitsch PetscObjectState state; 730e6b6b59SJacob Faibussowitsch 740e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 750e6b6b59SJacob Faibussowitsch PetscValidDeviceContext(dctx, 1); 760e6b6b59SJacob Faibussowitsch PetscValidPointer(event, 2); 770e6b6b59SJacob Faibussowitsch id = PetscObjectCast(dctx)->id; 780e6b6b59SJacob Faibussowitsch state = PetscObjectCast(dctx)->state; 790e6b6b59SJacob Faibussowitsch // technically state can never be less than event->dctx_state (only equal) but we include 800e6b6b59SJacob Faibussowitsch // it in the check just in case 810e6b6b59SJacob Faibussowitsch if ((id == event->dctx_id) && (state <= event->dctx_state)) PetscFunctionReturn(0); 820e6b6b59SJacob Faibussowitsch if (dctx->ops->recordevent) { 830e6b6b59SJacob Faibussowitsch // REVIEW ME: 840e6b6b59SJacob Faibussowitsch // TODO maybe move this to impls, as they can determine whether they can interoperate with 850e6b6b59SJacob Faibussowitsch // other device types more readily 860e6b6b59SJacob Faibussowitsch if (PetscDefined(USE_DEBUG) && (event->dtype != PETSC_DEVICE_HOST)) { 870e6b6b59SJacob Faibussowitsch PetscDeviceType dtype; 880e6b6b59SJacob Faibussowitsch 890e6b6b59SJacob Faibussowitsch PetscCall(PetscDeviceContextGetDeviceType(dctx, &dtype)); 900e6b6b59SJacob Faibussowitsch PetscCheck(event->dtype == dtype, PETSC_COMM_SELF, PETSC_ERR_ARG_INCOMP, "Event type %s does not match device context type %s", PetscDeviceTypes[event->dtype], PetscDeviceTypes[dtype]); 910e6b6b59SJacob Faibussowitsch } 920e6b6b59SJacob Faibussowitsch PetscUseTypeMethod(dctx, recordevent, event); 930e6b6b59SJacob Faibussowitsch } 940e6b6b59SJacob Faibussowitsch event->dctx_id = id; 950e6b6b59SJacob Faibussowitsch event->dctx_state = state; 960e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 970e6b6b59SJacob Faibussowitsch } 980e6b6b59SJacob Faibussowitsch 990e6b6b59SJacob Faibussowitsch static PetscErrorCode PetscDeviceContextWaitForEvent_Private(PetscDeviceContext dctx, PetscEvent event) { 1000e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 1010e6b6b59SJacob Faibussowitsch PetscValidDeviceContext(dctx, 1); 1020e6b6b59SJacob Faibussowitsch PetscValidPointer(event, 2); 1030e6b6b59SJacob Faibussowitsch // empty data implies you cannot wait on this event 1040e6b6b59SJacob Faibussowitsch if (!event->data) PetscFunctionReturn(0); 1050e6b6b59SJacob Faibussowitsch if (PetscDefined(USE_DEBUG)) { 1060e6b6b59SJacob Faibussowitsch const auto etype = event->dtype; 1070e6b6b59SJacob Faibussowitsch PetscDeviceType dtype; 1080e6b6b59SJacob Faibussowitsch 1090e6b6b59SJacob Faibussowitsch PetscCall(PetscDeviceContextGetDeviceType(dctx, &dtype)); 1100e6b6b59SJacob Faibussowitsch PetscCheck(etype == dtype, PETSC_COMM_SELF, PETSC_ERR_ARG_INCOMP, "Event type %s does not match device context type %s", PetscDeviceTypes[etype], PetscDeviceTypes[dtype]); 1110e6b6b59SJacob Faibussowitsch } 1120e6b6b59SJacob Faibussowitsch if (PetscObjectCast(dctx)->id == event->dctx_id) PetscFunctionReturn(0); 1130e6b6b59SJacob Faibussowitsch PetscTryTypeMethod(dctx, waitforevent, event); 1140e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 1150e6b6b59SJacob Faibussowitsch } 1160e6b6b59SJacob Faibussowitsch 1170e6b6b59SJacob Faibussowitsch // ========================================================================================== 1180e6b6b59SJacob Faibussowitsch // PetscStackFrame 1190e6b6b59SJacob Faibussowitsch // 1200e6b6b59SJacob Faibussowitsch // A helper class that (when debugging is enabled) contains the stack frame from which 1210e6b6b59SJacob Faibussowitsch // PetscDeviceContextMakrIntentFromID(). It is intended to be derived from, since this enables 1220e6b6b59SJacob Faibussowitsch // empty-base-class optimization to kick in when debugging is disabled. 1230e6b6b59SJacob Faibussowitsch // ========================================================================================== 1240e6b6b59SJacob Faibussowitsch 1250e6b6b59SJacob Faibussowitsch template <bool use_debug> 1260e6b6b59SJacob Faibussowitsch struct PetscStackFrame; 1270e6b6b59SJacob Faibussowitsch 1280e6b6b59SJacob Faibussowitsch template <> 1290e6b6b59SJacob Faibussowitsch struct PetscStackFrame</* use_debug = */ true> { 1300e6b6b59SJacob Faibussowitsch std::string file{}; 1310e6b6b59SJacob Faibussowitsch std::string function{}; 1320e6b6b59SJacob Faibussowitsch int line{}; 1330e6b6b59SJacob Faibussowitsch 1340e6b6b59SJacob Faibussowitsch PetscStackFrame() = default; 1350e6b6b59SJacob Faibussowitsch 1360e6b6b59SJacob Faibussowitsch PetscStackFrame(const char *file_, const char *func_, int line_) noexcept : file(split_on_petsc_path_(file_)), function(func_), line(line_) { } 1370e6b6b59SJacob Faibussowitsch 1380e6b6b59SJacob Faibussowitsch bool operator==(const PetscStackFrame &other) const noexcept { return line == other.line && file == other.file && function == other.function; } 1390e6b6b59SJacob Faibussowitsch 1400e6b6b59SJacob Faibussowitsch private: 1410e6b6b59SJacob Faibussowitsch static std::string split_on_petsc_path_(std::string &&in) noexcept { 1420e6b6b59SJacob Faibussowitsch auto pos = in.find("petsc/src"); 1430e6b6b59SJacob Faibussowitsch 1440e6b6b59SJacob Faibussowitsch if (pos == std::string::npos) pos = in.find("petsc/include"); 1450e6b6b59SJacob Faibussowitsch if (pos == std::string::npos) pos = 0; 1460e6b6b59SJacob Faibussowitsch return in.substr(pos); 1470e6b6b59SJacob Faibussowitsch } 1480e6b6b59SJacob Faibussowitsch 1490e6b6b59SJacob Faibussowitsch friend std::ostream &operator<<(std::ostream &os, const PetscStackFrame &frame) { 1500e6b6b59SJacob Faibussowitsch os << '(' << frame.function << "() at " << frame.file << ':' << frame.line << ')'; 1510e6b6b59SJacob Faibussowitsch return os; 1520e6b6b59SJacob Faibussowitsch } 1530e6b6b59SJacob Faibussowitsch }; 1540e6b6b59SJacob Faibussowitsch 1550e6b6b59SJacob Faibussowitsch template <> 1560e6b6b59SJacob Faibussowitsch struct PetscStackFrame</* use_debug = */ false> { 1570e6b6b59SJacob Faibussowitsch template <typename... T> 1580e6b6b59SJacob Faibussowitsch constexpr PetscStackFrame(T &&...) noexcept { } 1590e6b6b59SJacob Faibussowitsch 1600e6b6b59SJacob Faibussowitsch constexpr bool operator==(const PetscStackFrame &) const noexcept { return true; } 1610e6b6b59SJacob Faibussowitsch 1620e6b6b59SJacob Faibussowitsch friend std::ostream &operator<<(std::ostream &os, const PetscStackFrame &) noexcept { 1630e6b6b59SJacob Faibussowitsch os << "(unknown)"; 1640e6b6b59SJacob Faibussowitsch return os; 1650e6b6b59SJacob Faibussowitsch } 1660e6b6b59SJacob Faibussowitsch }; 1670e6b6b59SJacob Faibussowitsch 1680e6b6b59SJacob Faibussowitsch // ========================================================================================== 1690e6b6b59SJacob Faibussowitsch // MarkedObjectMap 1700e6b6b59SJacob Faibussowitsch // 1710e6b6b59SJacob Faibussowitsch // A mapping from a PetscObjectId to a PetscEvent and (if debugging is enabled) a 1720e6b6b59SJacob Faibussowitsch // PetscStackFrame containing the location where PetscDeviceContextMarkIntentFromID was called 1730e6b6b59SJacob Faibussowitsch // ========================================================================================== 1740e6b6b59SJacob Faibussowitsch 1750e6b6b59SJacob Faibussowitsch class MarkedObjectMap : public Petsc::RegisterFinalizeable<MarkedObjectMap> { 1760e6b6b59SJacob Faibussowitsch public: 1770e6b6b59SJacob Faibussowitsch // Note we derive from PetscStackFrame so that the empty base class optimization can kick 1780e6b6b59SJacob Faibussowitsch // in. If it were just a member it would still take up storage in optimized builds 1790e6b6b59SJacob Faibussowitsch class snapshot_type : private PetscStackFrame<PetscDefined(USE_DEBUG)> { 1800e6b6b59SJacob Faibussowitsch public: 1810e6b6b59SJacob Faibussowitsch using frame_type = PetscStackFrame<PetscDefined(USE_DEBUG)>; 1820e6b6b59SJacob Faibussowitsch 1830e6b6b59SJacob Faibussowitsch snapshot_type() = default; 1840e6b6b59SJacob Faibussowitsch snapshot_type(PetscDeviceContext, frame_type) noexcept; 1850e6b6b59SJacob Faibussowitsch 1860e6b6b59SJacob Faibussowitsch ~snapshot_type() noexcept; 1870e6b6b59SJacob Faibussowitsch 1880e6b6b59SJacob Faibussowitsch // movable 1890e6b6b59SJacob Faibussowitsch snapshot_type(snapshot_type &&) noexcept; 1900e6b6b59SJacob Faibussowitsch snapshot_type &operator=(snapshot_type &&) noexcept; 1910e6b6b59SJacob Faibussowitsch 1920e6b6b59SJacob Faibussowitsch // not copyable 1930e6b6b59SJacob Faibussowitsch snapshot_type(const snapshot_type &) noexcept = delete; 1940e6b6b59SJacob Faibussowitsch snapshot_type &operator=(const snapshot_type &) noexcept = delete; 1950e6b6b59SJacob Faibussowitsch 1960e6b6b59SJacob Faibussowitsch PETSC_NODISCARD PetscEvent event() const noexcept { return event_; } 1970e6b6b59SJacob Faibussowitsch PETSC_NODISCARD const frame_type &frame() const noexcept { return *this; } 1980e6b6b59SJacob Faibussowitsch PETSC_NODISCARD frame_type &frame() noexcept { return *this; } 1990e6b6b59SJacob Faibussowitsch PETSC_NODISCARD PetscObjectId dctx_id() const noexcept { return event()->dctx_id; } 2000e6b6b59SJacob Faibussowitsch 2010e6b6b59SJacob Faibussowitsch private: 2020e6b6b59SJacob Faibussowitsch PetscEvent event_{}; // the state of device context when this snapshot was recorded 2030e6b6b59SJacob Faibussowitsch 2040e6b6b59SJacob Faibussowitsch PETSC_NODISCARD static PetscEvent init_event_(PetscDeviceContext) noexcept; 2050e6b6b59SJacob Faibussowitsch }; 2060e6b6b59SJacob Faibussowitsch 2070e6b6b59SJacob Faibussowitsch // the "value" each key maps to 2080e6b6b59SJacob Faibussowitsch struct mapped_type { 2090e6b6b59SJacob Faibussowitsch using dependency_type = std::vector<snapshot_type>; 2100e6b6b59SJacob Faibussowitsch 2110e6b6b59SJacob Faibussowitsch PetscMemoryAccessMode mode = PETSC_MEMORY_ACCESS_READ; 2120e6b6b59SJacob Faibussowitsch snapshot_type last_write{}; 2130e6b6b59SJacob Faibussowitsch dependency_type dependencies{}; 2140e6b6b59SJacob Faibussowitsch }; 2150e6b6b59SJacob Faibussowitsch 2160e6b6b59SJacob Faibussowitsch using map_type = std::unordered_map<PetscObjectId, mapped_type>; 2170e6b6b59SJacob Faibussowitsch 2180e6b6b59SJacob Faibussowitsch map_type map; 2190e6b6b59SJacob Faibussowitsch 2200e6b6b59SJacob Faibussowitsch private: 2210e6b6b59SJacob Faibussowitsch friend class RegisterFinalizeable<MarkedObjectMap>; 2220e6b6b59SJacob Faibussowitsch 2230e6b6b59SJacob Faibussowitsch PETSC_NODISCARD PetscErrorCode finalize_() noexcept; 2240e6b6b59SJacob Faibussowitsch }; 2250e6b6b59SJacob Faibussowitsch 2260e6b6b59SJacob Faibussowitsch // ========================================================================================== 2270e6b6b59SJacob Faibussowitsch // MarkedObejctMap Private API 2280e6b6b59SJacob Faibussowitsch // ========================================================================================== 2290e6b6b59SJacob Faibussowitsch 2300e6b6b59SJacob Faibussowitsch inline PetscErrorCode MarkedObjectMap::finalize_() noexcept { 2310e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 2320e6b6b59SJacob Faibussowitsch PetscCall(PetscInfo(nullptr, "Finalizing marked object map\n")); 2330e6b6b59SJacob Faibussowitsch if (PetscDefined(USE_DEBUG)) { 2340e6b6b59SJacob Faibussowitsch std::ostringstream oss; 2350e6b6b59SJacob Faibussowitsch auto wrote_to_oss = false; 2360e6b6b59SJacob Faibussowitsch const auto end = this->map.cend(); 2370e6b6b59SJacob Faibussowitsch PetscMPIInt rank; 2380e6b6b59SJacob Faibussowitsch 2390e6b6b59SJacob Faibussowitsch PetscCallMPI(MPI_Comm_rank(PETSC_COMM_WORLD, &rank)); 2400e6b6b59SJacob Faibussowitsch for (auto it = this->map.cbegin(); it != end; ++it) { 2410e6b6b59SJacob Faibussowitsch // need a temporary since we want to prepend "object xxx has orphaned dependencies" if 2420e6b6b59SJacob Faibussowitsch // any of the dependencies have orphans. but we also need to check that in the loop, so 2430e6b6b59SJacob Faibussowitsch // use a temporary to accumulate and then build the rest from it. 2440e6b6b59SJacob Faibussowitsch std::ostringstream oss_tmp; 2450e6b6b59SJacob Faibussowitsch auto wrote_to_oss_tmp = false; 2460e6b6b59SJacob Faibussowitsch //const auto &mapped = it->second; 2470e6b6b59SJacob Faibussowitsch //const auto mode = PetscMemoryAccessModes(mapped.mode); 2480e6b6b59SJacob Faibussowitsch 2490e6b6b59SJacob Faibussowitsch // for (auto &&dep : mapped.dependencies) { 2500e6b6b59SJacob Faibussowitsch // // if (!dep.ctx->options.allow_orphans) { 2510e6b6b59SJacob Faibussowitsch // // wrote_to_oss_tmp = true; 2520e6b6b59SJacob Faibussowitsch // // oss_tmp<<" ["<<rank<<"] dctx "<<dep.ctx<<" (id "<<dep.dctx_id()<<", state "<<dep.dctx_state<<", intent "<<mode<<' '<<dep.frame()<<")\n"; 2530e6b6b59SJacob Faibussowitsch // // } 2540e6b6b59SJacob Faibussowitsch // } 2550e6b6b59SJacob Faibussowitsch // check if we wrote to it 2560e6b6b59SJacob Faibussowitsch if (wrote_to_oss_tmp) { 2570e6b6b59SJacob Faibussowitsch oss << '[' << rank << "] object " << it->first << " has orphaned dependencies:\n" << oss_tmp.str(); 2580e6b6b59SJacob Faibussowitsch wrote_to_oss = true; 2590e6b6b59SJacob Faibussowitsch } 2600e6b6b59SJacob Faibussowitsch } 2610e6b6b59SJacob Faibussowitsch if (wrote_to_oss) { 2620e6b6b59SJacob Faibussowitsch //PetscCall((*PetscErrorPrintf)("%s\n",oss.str().c_str())); 2630e6b6b59SJacob Faibussowitsch //SETERRQ(PETSC_COMM_SELF,PETSC_ERR_PLIB,"Orphaned dependencies found, see above"); 2640e6b6b59SJacob Faibussowitsch } 2650e6b6b59SJacob Faibussowitsch } 2660e6b6b59SJacob Faibussowitsch // replace with new map, since clear() does not necessarily free memory 2670e6b6b59SJacob Faibussowitsch PetscCallCXX(this->map = map_type{}); 2680e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 2690e6b6b59SJacob Faibussowitsch } 2700e6b6b59SJacob Faibussowitsch 2710e6b6b59SJacob Faibussowitsch // ========================================================================================== 2720e6b6b59SJacob Faibussowitsch // MarkedObejctMap::snapshot_type Private API 2730e6b6b59SJacob Faibussowitsch // ========================================================================================== 2740e6b6b59SJacob Faibussowitsch 2750e6b6b59SJacob Faibussowitsch inline PetscEvent MarkedObjectMap::snapshot_type::init_event_(PetscDeviceContext dctx) noexcept { 2760e6b6b59SJacob Faibussowitsch PetscEvent event = nullptr; 2770e6b6b59SJacob Faibussowitsch 2780e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 2790e6b6b59SJacob Faibussowitsch PetscCallAbort(PETSC_COMM_SELF, PetscDeviceContextCreateEvent_Private(dctx, &event)); 2800e6b6b59SJacob Faibussowitsch PetscCallAbort(PETSC_COMM_SELF, PetscDeviceContextRecordEvent_Private(dctx, event)); 2810e6b6b59SJacob Faibussowitsch PetscFunctionReturn(event); 2820e6b6b59SJacob Faibussowitsch } 2830e6b6b59SJacob Faibussowitsch 2840e6b6b59SJacob Faibussowitsch // ========================================================================================== 2850e6b6b59SJacob Faibussowitsch // MarkedObejctMap::snapshot_type Public API 2860e6b6b59SJacob Faibussowitsch // ========================================================================================== 2870e6b6b59SJacob Faibussowitsch 2880e6b6b59SJacob Faibussowitsch MarkedObjectMap::snapshot_type::snapshot_type(PetscDeviceContext dctx, frame_type frame) noexcept : frame_type(std::move(frame)), event_(init_event_(dctx)) { } 2890e6b6b59SJacob Faibussowitsch 2900e6b6b59SJacob Faibussowitsch MarkedObjectMap::snapshot_type::~snapshot_type() noexcept { 2910e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 2920e6b6b59SJacob Faibussowitsch PetscCallAbort(PETSC_COMM_SELF, PetscEventDestroy_Private(&event_)); 2930e6b6b59SJacob Faibussowitsch PetscFunctionReturnVoid(); 2940e6b6b59SJacob Faibussowitsch } 2950e6b6b59SJacob Faibussowitsch 2960e6b6b59SJacob Faibussowitsch // movable 2970e6b6b59SJacob Faibussowitsch MarkedObjectMap::snapshot_type::snapshot_type(snapshot_type &&other) noexcept : frame_type(std::move(other)), event_(Petsc::util::exchange(other.event_, nullptr)) { } 2980e6b6b59SJacob Faibussowitsch 2990e6b6b59SJacob Faibussowitsch MarkedObjectMap::snapshot_type &MarkedObjectMap::snapshot_type::operator=(snapshot_type &&other) noexcept { 3000e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 3010e6b6b59SJacob Faibussowitsch if (this != &other) { 3020e6b6b59SJacob Faibussowitsch frame_type::operator=(std::move(other)); 3030e6b6b59SJacob Faibussowitsch PetscCallAbort(PETSC_COMM_SELF, PetscEventDestroy_Private(&event_)); 3040e6b6b59SJacob Faibussowitsch event_ = Petsc::util::exchange(other.event_, nullptr); 3050e6b6b59SJacob Faibussowitsch } 3060e6b6b59SJacob Faibussowitsch PetscFunctionReturn(*this); 3070e6b6b59SJacob Faibussowitsch } 3080e6b6b59SJacob Faibussowitsch 3090e6b6b59SJacob Faibussowitsch // A mapping between PetscObjectId (i.e. some PetscObject) to the list of PetscEvent's encoding 3100e6b6b59SJacob Faibussowitsch // the last time the PetscObject was accessed 3110e6b6b59SJacob Faibussowitsch static MarkedObjectMap marked_object_map; 3120e6b6b59SJacob Faibussowitsch 3130e6b6b59SJacob Faibussowitsch // ========================================================================================== 3140e6b6b59SJacob Faibussowitsch // Utility Functions 3150e6b6b59SJacob Faibussowitsch // ========================================================================================== 3160e6b6b59SJacob Faibussowitsch 3170e6b6b59SJacob Faibussowitsch template <typename T> 3180e6b6b59SJacob Faibussowitsch static PetscErrorCode PetscDeviceContextMapIterVisitor(PetscDeviceContext dctx, T &&callback) noexcept { 3190e6b6b59SJacob Faibussowitsch const auto dctx_id = PetscObjectCast(dctx)->id; 3200e6b6b59SJacob Faibussowitsch auto &dctx_deps = CxxDataCast(dctx)->deps; 3210e6b6b59SJacob Faibussowitsch auto &object_map = marked_object_map.map; 3220e6b6b59SJacob Faibussowitsch 3230e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 3240e6b6b59SJacob Faibussowitsch for (auto &&dep : dctx_deps) { 3250e6b6b59SJacob Faibussowitsch const auto mapit = object_map.find(dep); 3260e6b6b59SJacob Faibussowitsch 3270e6b6b59SJacob Faibussowitsch // Need this check since the final PetscDeviceContext may run through this *after* the map 3280e6b6b59SJacob Faibussowitsch // has been finalized (and cleared), and hence might fail to find its dependencies. This is 3290e6b6b59SJacob Faibussowitsch // perfectly valid since the user no longer cares about dangling dependencies after PETSc 3300e6b6b59SJacob Faibussowitsch // is finalized 3310e6b6b59SJacob Faibussowitsch if (PetscLikely(mapit != object_map.end())) { 3320e6b6b59SJacob Faibussowitsch auto &deps = mapit->second.dependencies; 3330e6b6b59SJacob Faibussowitsch const auto end = deps.end(); 3340e6b6b59SJacob Faibussowitsch const auto it = std::remove_if(deps.begin(), end, [&](const MarkedObjectMap::snapshot_type &obj) { return obj.dctx_id() == dctx_id; }); 3350e6b6b59SJacob Faibussowitsch 3360e6b6b59SJacob Faibussowitsch PetscCall(callback(mapit, deps.cbegin(), static_cast<decltype(deps.cend())>(it))); 3370e6b6b59SJacob Faibussowitsch // remove ourselves 3380e6b6b59SJacob Faibussowitsch PetscCallCXX(deps.erase(it, end)); 3390e6b6b59SJacob Faibussowitsch // continue to next object, but erase this one if it has no more dependencies 3400e6b6b59SJacob Faibussowitsch if (deps.empty()) PetscCallCXX(object_map.erase(mapit)); 3410e6b6b59SJacob Faibussowitsch } 3420e6b6b59SJacob Faibussowitsch } 3430e6b6b59SJacob Faibussowitsch PetscCallCXX(dctx_deps.clear()); 3440e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 3450e6b6b59SJacob Faibussowitsch } 3460e6b6b59SJacob Faibussowitsch 3470e6b6b59SJacob Faibussowitsch PetscErrorCode PetscDeviceContextSyncClearMap_Internal(PetscDeviceContext dctx) { 3480e6b6b59SJacob Faibussowitsch using map_iterator = MarkedObjectMap::map_type::const_iterator; 3490e6b6b59SJacob Faibussowitsch using dep_iterator = MarkedObjectMap::mapped_type::dependency_type::const_iterator; 3500e6b6b59SJacob Faibussowitsch 3510e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 3520e6b6b59SJacob Faibussowitsch PetscCall(PetscDeviceContextMapIterVisitor(dctx, [&](map_iterator mapit, dep_iterator it, dep_iterator end) { 3530e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 3540e6b6b59SJacob Faibussowitsch if (PetscDefined(USE_DEBUG_AND_INFO)) { 3550e6b6b59SJacob Faibussowitsch std::ostringstream oss; 3560e6b6b59SJacob Faibussowitsch const auto mode = PetscMemoryAccessModeToString(mapit->second.mode); 3570e6b6b59SJacob Faibussowitsch 3580e6b6b59SJacob Faibussowitsch oss << "synced dctx " << PetscObjectCast(dctx)->id << ", remaining leaves for obj " << mapit->first << ": {"; 3590e6b6b59SJacob Faibussowitsch while (it != end) { 3600e6b6b59SJacob Faibussowitsch oss << "[dctx " << it->dctx_id() << ", " << mode << ' ' << it->frame() << ']'; 3610e6b6b59SJacob Faibussowitsch if (++it != end) oss << ", "; 3620e6b6b59SJacob Faibussowitsch } 3630e6b6b59SJacob Faibussowitsch oss << '}'; 3640e6b6b59SJacob Faibussowitsch PetscCall(PetscInfo(nullptr, "%s\n", oss.str().c_str())); 3650e6b6b59SJacob Faibussowitsch } 3660e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 3670e6b6b59SJacob Faibussowitsch })); 3680e6b6b59SJacob Faibussowitsch { 3690e6b6b59SJacob Faibussowitsch // the recursive sync clear map call is unbounded in case of a dependenct loop so we make a 3700e6b6b59SJacob Faibussowitsch // copy 3710e6b6b59SJacob Faibussowitsch // clang-format off 3720e6b6b59SJacob Faibussowitsch const std::vector<CxxData::upstream_type::value_type> upstream_copy( 3730e6b6b59SJacob Faibussowitsch std::make_move_iterator(CxxDataCast(dctx)->upstream.begin()), 3740e6b6b59SJacob Faibussowitsch std::make_move_iterator(CxxDataCast(dctx)->upstream.end()) 3750e6b6b59SJacob Faibussowitsch ); 3760e6b6b59SJacob Faibussowitsch // clang-format on 3770e6b6b59SJacob Faibussowitsch 3780e6b6b59SJacob Faibussowitsch // aftermath, clear our set of parents (to avoid infinite recursion) and mark ourselves as no 3790e6b6b59SJacob Faibussowitsch // longer contained (while the empty graph technically *is* always contained, it is not what 3800e6b6b59SJacob Faibussowitsch // we mean by it) 3810e6b6b59SJacob Faibussowitsch PetscCall(CxxDataCast(dctx)->clear()); 3820e6b6b59SJacob Faibussowitsch //dctx->contained = PETSC_FALSE; 3830e6b6b59SJacob Faibussowitsch for (auto &&upstrm : upstream_copy) { 3840e6b6b59SJacob Faibussowitsch // check that this parent still points to what we originally thought it was 3850e6b6b59SJacob Faibussowitsch PetscCheck(upstrm.second.id == PetscObjectCast(upstrm.first)->id, PETSC_COMM_SELF, PETSC_ERR_PLIB, "Upstream dctx %" PetscInt64_FMT " no longer exists, now has id %" PetscInt64_FMT, upstrm.second.id, PetscObjectCast(upstrm.first)->id); 3860e6b6b59SJacob Faibussowitsch PetscCall(PetscDeviceContextSyncClearMap_Internal(upstrm.first)); 3870e6b6b59SJacob Faibussowitsch } 3880e6b6b59SJacob Faibussowitsch } 3890e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 3900e6b6b59SJacob Faibussowitsch } 3910e6b6b59SJacob Faibussowitsch 3920e6b6b59SJacob Faibussowitsch PetscErrorCode PetscDeviceContextCheckNotOrphaned_Internal(PetscDeviceContext dctx) { 3930e6b6b59SJacob Faibussowitsch std::ostringstream oss; 3940e6b6b59SJacob Faibussowitsch //const auto allow = dctx->options.allow_orphans, contained = dctx->contained; 3950e6b6b59SJacob Faibussowitsch const auto allow = true, contained = true; 3960e6b6b59SJacob Faibussowitsch auto wrote_to_oss = false; 3970e6b6b59SJacob Faibussowitsch using map_iterator = MarkedObjectMap::map_type::const_iterator; 3980e6b6b59SJacob Faibussowitsch using dep_iterator = MarkedObjectMap::mapped_type::dependency_type::const_iterator; 3990e6b6b59SJacob Faibussowitsch 4000e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 4010e6b6b59SJacob Faibussowitsch PetscCall(PetscDeviceContextMapIterVisitor(dctx, [&](map_iterator mapit, dep_iterator it, dep_iterator end) { 4020e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 4030e6b6b59SJacob Faibussowitsch if (allow || contained) PetscFunctionReturn(0); 4040e6b6b59SJacob Faibussowitsch wrote_to_oss = true; 4050e6b6b59SJacob Faibussowitsch oss << "- PetscObject (id " << mapit->first << "), intent " << PetscMemoryAccessModeToString(mapit->second.mode) << ' ' << it->frame(); 4060e6b6b59SJacob Faibussowitsch if (std::distance(it, end) == 0) oss << " (orphaned)"; // we were the only dependency 4070e6b6b59SJacob Faibussowitsch oss << '\n'; 4080e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 4090e6b6b59SJacob Faibussowitsch })); 4100e6b6b59SJacob Faibussowitsch PetscCheck(!wrote_to_oss, PETSC_COMM_SELF, PETSC_ERR_ORDER, "Destroying PetscDeviceContext ('%s', id %" PetscInt64_FMT ") would leave the following dangling (possibly orphaned) dependants:\n%s\nMust synchronize before destroying it, or allow it to be destroyed with orphans", 4110e6b6b59SJacob Faibussowitsch PetscObjectCast(dctx)->name ? PetscObjectCast(dctx)->name : "unnamed", PetscObjectCast(dctx)->id, oss.str().c_str()); 4120e6b6b59SJacob Faibussowitsch PetscCall(CxxDataCast(dctx)->clear()); 4130e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 4140e6b6b59SJacob Faibussowitsch } 4150e6b6b59SJacob Faibussowitsch 4160e6b6b59SJacob Faibussowitsch template <bool use_debug> 4170e6b6b59SJacob Faibussowitsch static PetscErrorCode PetscDeviceContextMarkIntentFromID_Private(PetscDeviceContext dctx, PetscObjectId id, PetscMemoryAccessMode mode, PetscStackFrame<use_debug> frame, const char *name) { 4180e6b6b59SJacob Faibussowitsch #define DEBUG_INFO(mess, ...) PetscDebugInfo(dctx, "dctx %" PetscInt64_FMT " (%s) - obj %" PetscInt64_FMT " (%s): " mess, dctx_id, PetscObjectCast(dctx)->name ? PetscObjectCast(dctx)->name : "unnamed", id, name, ##__VA_ARGS__) 4190e6b6b59SJacob Faibussowitsch const auto dctx_id = PetscObjectCast(dctx)->id; 4200e6b6b59SJacob Faibussowitsch auto &marked = marked_object_map.map[id]; 4210e6b6b59SJacob Faibussowitsch auto &old_mode = marked.mode; 4220e6b6b59SJacob Faibussowitsch auto &object_dependencies = marked.dependencies; 4230e6b6b59SJacob Faibussowitsch 4240e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 4250e6b6b59SJacob Faibussowitsch if ((mode == PETSC_MEMORY_ACCESS_READ) && (old_mode == mode)) { 4260e6b6b59SJacob Faibussowitsch const auto end = object_dependencies.end(); 4270e6b6b59SJacob Faibussowitsch const auto it = std::find_if(object_dependencies.begin(), end, [&](const MarkedObjectMap::snapshot_type &obj) { return obj.dctx_id() == dctx_id; }); 4280e6b6b59SJacob Faibussowitsch 4290e6b6b59SJacob Faibussowitsch PetscCall(DEBUG_INFO("new mode (%s) COMPATIBLE with %s mode (%s), no need to serialize\n", PetscMemoryAccessModeToString(mode), PetscMemoryAccessModeToString(old_mode), object_dependencies.empty() ? "default" : "old")); 4300e6b6b59SJacob Faibussowitsch if (it != end) { 4310e6b6b59SJacob Faibussowitsch // we have been here before, all we must do is update our entry then we can bail 4320e6b6b59SJacob Faibussowitsch PetscCall(DEBUG_INFO("found old self as dependency, updating\n")); 4330e6b6b59SJacob Faibussowitsch PetscAssert(CxxDataCast(dctx)->deps.find(id) != CxxDataCast(dctx)->deps.end(), PETSC_COMM_SELF, PETSC_ERR_PLIB, "PetscDeviceContext %" PetscInt64_FMT " listed as dependency for object %" PetscInt64_FMT " (%s), but does not have the object in private dependency list!", dctx_id, id, name); 4340e6b6b59SJacob Faibussowitsch 4350e6b6b59SJacob Faibussowitsch it->frame() = std::move(frame); 4360e6b6b59SJacob Faibussowitsch PetscCall(PetscDeviceContextRecordEvent_Private(dctx, it->event())); 4370e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 4380e6b6b59SJacob Faibussowitsch } 4390e6b6b59SJacob Faibussowitsch 4400e6b6b59SJacob Faibussowitsch // we have not been here before, need to serialize with the last write event (if it exists) 4410e6b6b59SJacob Faibussowitsch // and add ourselves to the dependency list 4420e6b6b59SJacob Faibussowitsch if (const auto event = marked.last_write.event()) PetscCall(PetscDeviceContextWaitForEvent_Private(dctx, event)); 4430e6b6b59SJacob Faibussowitsch } else { 4440e6b6b59SJacob Faibussowitsch // we are incompatible with the previous mode 4450e6b6b59SJacob Faibussowitsch PetscCall(DEBUG_INFO("new mode (%s) NOT COMPATIBLE with %s mode (%s), serializing then clearing (%zu) %s\n", PetscMemoryAccessModeToString(mode), object_dependencies.empty() ? "default" : "old", PetscMemoryAccessModeToString(old_mode), 4460e6b6b59SJacob Faibussowitsch object_dependencies.size(), object_dependencies.size() == 1 ? "dependency" : "dependencies")); 4470e6b6b59SJacob Faibussowitsch for (const auto &dep : object_dependencies) { 4480e6b6b59SJacob Faibussowitsch if (dep.dctx_id() == dctx_id) { 4490e6b6b59SJacob Faibussowitsch PetscCall(DEBUG_INFO("found old self as dependency, skipping\n")); 4500e6b6b59SJacob Faibussowitsch continue; 4510e6b6b59SJacob Faibussowitsch } 4520e6b6b59SJacob Faibussowitsch PetscCall(PetscDeviceContextWaitForEvent_Private(dctx, dep.event())); 4530e6b6b59SJacob Faibussowitsch } 4540e6b6b59SJacob Faibussowitsch 4550e6b6b59SJacob Faibussowitsch // if the previous mode wrote, bump it to the previous write spot 4560e6b6b59SJacob Faibussowitsch if (PetscMemoryAccessWrite(old_mode)) { 4570e6b6b59SJacob Faibussowitsch PetscAssert(object_dependencies.size() == 1, PETSC_COMM_SELF, PETSC_ERR_PLIB, "Can only have a single writer as dependency!"); 4580e6b6b59SJacob Faibussowitsch PetscCall(DEBUG_INFO("moving last write dependency (intent %s)\n", PetscMemoryAccessModeToString(old_mode))); 4590e6b6b59SJacob Faibussowitsch // note the move around object_dependencies.back() not around event(), this is to enable 4600e6b6b59SJacob Faibussowitsch // the rvalue event() overload 4610e6b6b59SJacob Faibussowitsch marked.last_write = std::move(object_dependencies.back()); 4620e6b6b59SJacob Faibussowitsch } 4630e6b6b59SJacob Faibussowitsch 4640e6b6b59SJacob Faibussowitsch // clear out the old dependencies and update the mode, we are about to append ourselves 4650e6b6b59SJacob Faibussowitsch object_dependencies.clear(); 4660e6b6b59SJacob Faibussowitsch old_mode = mode; 4670e6b6b59SJacob Faibussowitsch } 4680e6b6b59SJacob Faibussowitsch // become the new leaf by appending ourselves 4690e6b6b59SJacob Faibussowitsch PetscCall(DEBUG_INFO("%s with intent %s\n", object_dependencies.empty() ? "dependency list is empty, creating new leaf" : "appending to existing leaves", PetscMemoryAccessModeToString(mode))); 4700e6b6b59SJacob Faibussowitsch PetscCallCXX(object_dependencies.emplace_back(dctx, std::move(frame))); 4710e6b6b59SJacob Faibussowitsch PetscCallCXX(CxxDataCast(dctx)->deps.emplace(id)); 4720e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 4730e6b6b59SJacob Faibussowitsch #undef DEBUG_INFO 4740e6b6b59SJacob Faibussowitsch } 4750e6b6b59SJacob Faibussowitsch 4760e6b6b59SJacob Faibussowitsch /*@C 4770e6b6b59SJacob Faibussowitsch PetscDeviceContextMarkIntentFromID - Indicate a `PetscDeviceContext`s access intent to the 4780e6b6b59SJacob Faibussowitsch auto-dependency system 4790e6b6b59SJacob Faibussowitsch 4800e6b6b59SJacob Faibussowitsch Not Collective 4810e6b6b59SJacob Faibussowitsch 4820e6b6b59SJacob Faibussowitsch Input Parameters: 4830e6b6b59SJacob Faibussowitsch + dctx - The `PetscDeviceContext` 4840e6b6b59SJacob Faibussowitsch . id - The `PetscObjectId` to mark 4850e6b6b59SJacob Faibussowitsch . mode - The desired access intent 4860e6b6b59SJacob Faibussowitsch - name - The object name (for debug purposes, ignored in optimized builds) 4870e6b6b59SJacob Faibussowitsch 4880e6b6b59SJacob Faibussowitsch Notes: 4890e6b6b59SJacob Faibussowitsch This routine formally informs the dependency system that `dctx` will access the object 4900e6b6b59SJacob Faibussowitsch represented by `id` with `mode` and adds `dctx` to `id`'s list of dependencies (termed 4910e6b6b59SJacob Faibussowitsch "leaves"). 4920e6b6b59SJacob Faibussowitsch 4930e6b6b59SJacob Faibussowitsch If the existing set of leaves have an incompatible `PetscMemoryAccessMode` to `mode`, `dctx` 4940e6b6b59SJacob Faibussowitsch will be serialized against them. 4950e6b6b59SJacob Faibussowitsch 4960e6b6b59SJacob Faibussowitsch Level: intermediate 4970e6b6b59SJacob Faibussowitsch 4980e6b6b59SJacob Faibussowitsch .seealso: `PetscDeviceContextWaitForContext()`, `PetscDeviceContextSynchronize()`, 4990e6b6b59SJacob Faibussowitsch `PetscObjectGetId()`, `PetscMemoryAccessMode` 5000e6b6b59SJacob Faibussowitsch @*/ 5010e6b6b59SJacob Faibussowitsch PetscErrorCode PetscDeviceContextMarkIntentFromID(PetscDeviceContext dctx, PetscObjectId id, PetscMemoryAccessMode mode, const char name[]) { 5020e6b6b59SJacob Faibussowitsch #if PetscDefined(USE_DEBUG) 5030e6b6b59SJacob Faibussowitsch const auto index = petscstack.currentsize > 2 ? petscstack.currentsize - 2 : 0; 5040e6b6b59SJacob Faibussowitsch const auto file = petscstack.file[index]; 5050e6b6b59SJacob Faibussowitsch const auto function = petscstack.function[index]; 5060e6b6b59SJacob Faibussowitsch const auto line = petscstack.line[index]; 5070e6b6b59SJacob Faibussowitsch #else 5080e6b6b59SJacob Faibussowitsch constexpr const char *file = nullptr; 5090e6b6b59SJacob Faibussowitsch constexpr const char *function = nullptr; 5100e6b6b59SJacob Faibussowitsch constexpr auto line = 0; 5110e6b6b59SJacob Faibussowitsch #endif 5120e6b6b59SJacob Faibussowitsch 5130e6b6b59SJacob Faibussowitsch PetscFunctionBegin; 5140e6b6b59SJacob Faibussowitsch PetscCall(PetscDeviceContextGetOptionalNullContext_Internal(&dctx)); 5150e6b6b59SJacob Faibussowitsch if (name) PetscValidCharPointer(name, 4); 5160e6b6b59SJacob Faibussowitsch PetscCall(marked_object_map.register_finalize()); 5176a4a1270SPierre Jolivet PetscCall(PetscLogEventBegin(DCONTEXT_Mark, dctx, nullptr, nullptr, nullptr)); 5180e6b6b59SJacob Faibussowitsch PetscCall(PetscDeviceContextMarkIntentFromID_Private(dctx, id, mode, MarkedObjectMap::snapshot_type::frame_type{file, function, line}, name ? name : "unknown object")); 5196a4a1270SPierre Jolivet PetscCall(PetscLogEventEnd(DCONTEXT_Mark, dctx, nullptr, nullptr, nullptr)); 5200e6b6b59SJacob Faibussowitsch PetscFunctionReturn(0); 5210e6b6b59SJacob Faibussowitsch } 522*a966a306SPierre Jolivet 523*a966a306SPierre Jolivet #if defined(__clang__) 524*a966a306SPierre Jolivet #pragma clang diagnostic pop 525*a966a306SPierre Jolivet #endif 526