fml/html/card_8hh_source.html

// This file is part of fml which is released under the Boost Software

// License, Version 1.0. See accompanying file LICENSE or copy at

// https://www.boost.org/LICENSE_1_0.txt


#ifndef FML_GPU_CARD_H

#define FML_GPU_CARD_H

#pragma once


#include <memory>

#include <stdexcept>


#include "arch/arch.hh"


namespace fml

{

  inline int get_device_count()

  {

    int ngpus;

    auto ret = fml::gpuprims::get_device_count(&ngpus);

    if (ret != GPU_SUCCESS)

    {

      std::string s = fml::gpuprims::gpu_error_string(ret);

      throw std::runtime_error(s);

    }


    return ngpus;

  }


  class card

  {

    public:

      card();

      card(const int id=0);

      card(const card &x);

      ~card();


      void set(const int id);


      void info() const;


      void* mem_alloc(const size_t len);

      void mem_set(void *ptr, const int value, const size_t len);

      void mem_free(void *ptr);

      void mem_cpu2gpu(void *dst, const void *src, const size_t len);

      void mem_gpu2cpu(void *dst, const void *src, const size_t len);

      void mem_gpu2gpu(void *dst, const void *src, const size_t len);


      void synch();

      void check();


      void set_math_mode(gpublas_mathmode_t mode);


      int get_id() {return _id;};

      int get_id() const {return _id;};

      gpublas_handle_t blas_handle() {return _blas_handle;};

      gpublas_handle_t blas_handle() const {return _blas_handle;};

      gpulapack_handle_t lapack_handle() {return _lapack_handle;};

      gpulapack_handle_t lapack_handle() const {return _lapack_handle;};

      bool valid_card() const {return (_id!=UNINITIALIZED_CARD && _id!=DESTROYED_CARD);};


    protected:

      int _id;

      gpublas_handle_t _blas_handle;

      gpulapack_handle_t _lapack_handle;


    private:

      static const int UNINITIALIZED_CARD = -1;

      static const int DESTROYED_CARD = -11;


      void init();

      void cleanup();

      gpu_error_t err;

      void check_gpu_error();

  };


  typedef std::shared_ptr<fml::card> card_sp_t;


  inline card_sp_t new_card(int id=0)

  {

    return std::make_shared<fml::card>(id);

  }

}


// -----------------------------------------------------------------------------

// public

// -----------------------------------------------------------------------------


// constructors/destructor


inline fml::card::card()

{

  _id = UNINITIALIZED_CARD;

  _blas_handle = NULL;

  _lapack_handle = NULL;

}


inline fml::card::card(const int id)

{

  _id = id;

  init();


  gpublas_status_t blas_status = fml::gpuprims::gpu_blas_init(&_blas_handle);

  if (blas_status != GPUBLAS_STATUS_SUCCESS)

    throw std::runtime_error("unable to initialize GPU BLAS");


  gpulapack_status_t lapack_status = fml::gpuprims::gpu_lapack_init(&_lapack_handle);

  if (lapack_status != GPULAPACK_STATUS_SUCCESS)

    throw std::runtime_error("unable to initialize GPU LAPACK");

}


inline fml::card::card(const card &x)

{

  _id = x.get_id();

  _blas_handle = x.blas_handle();

  _lapack_handle = x.lapack_handle();

}


inline fml::card::~card()

{

  cleanup();

}


inline void fml::card::set(const int id)

{

  if (id == _id)

    return;


  cleanup();


  _id = id;

  init();


  gpublas_status_t blas_status = fml::gpuprims::gpu_blas_init(&_blas_handle);

  if (blas_status != GPUBLAS_STATUS_SUCCESS)

    throw std::runtime_error("unable to initialize GPU BLAS");


  gpulapack_status_t lapack_status = fml::gpuprims::gpu_lapack_init(&_lapack_handle);

  if (lapack_status != GPULAPACK_STATUS_SUCCESS)

    throw std::runtime_error("unable to initialize GPU LAPACK");

}


// printers


inline void fml::card::info() const

{

  fml::nvml::init();


#ifdef FML_USE_CUDA

  int version = nvml::system::get_cuda_driver_version();

  int version_major = version / 1000;

  int version_minor = (version % 1000) / 10;


  nvmlDevice_t device = fml::nvml::device::get_handle_by_index(_id);

  std::string name = fml::nvml::device::get_name(device);

  double mem_used, mem_total;

  fml::nvml::device::get_memory_info(device, &mem_used, &mem_total);


  std::string math_mode = gpublas::get_math_mode_string(_blas_handle);


  printf("## GPU %d ", _id);

  printf("(%s) ", name.c_str());

  printf("%.0f/%.0f MB ", mem_used/1024/1024, mem_total/1024/1024);

  printf("- CUDA %d.%d ", version_major, version_minor);

  printf("(math mode: %s)", math_mode.c_str());

  printf("\n\n");

#else // FML_USE_HIP

  printf("## GPU %d ", _id);

#endif


  fml::nvml::shutdown();

}


// gpu memory management


inline void* fml::card::mem_alloc(const size_t len)

{

  init();

  void *ptr;

  err = fml::gpuprims::gpu_malloc(&ptr, len);

  check_gpu_error();

  return ptr;

}


inline void fml::card::mem_set(void *ptr, const int value, const size_t len)

{

  init();

  err = fml::gpuprims::gpu_memset(ptr, value, len);

  check_gpu_error();

}


inline void fml::card::mem_free(void *ptr)

{

  init();

  if (ptr)

  {

    err = fml::gpuprims::gpu_free(ptr);

    check_gpu_error();

  }

}


inline void fml::card::mem_cpu2gpu(void *dst, const void *src, const size_t len)

{

  init();

  err = fml::gpuprims::gpu_memcpy(dst, src, len, GPU_MEMCPY_HOST_TO_DEVICE);

  check_gpu_error();

}


inline void fml::card::mem_gpu2cpu(void *dst, const void *src, const size_t len)

{

  init();

  err = fml::gpuprims::gpu_memcpy(dst, src, len, GPU_MEMCPY_DEVICE_TO_HOST);

  check_gpu_error();

}


inline void fml::card::mem_gpu2gpu(void *dst, const void *src, const size_t len)

{

  init();

  err = fml::gpuprims::gpu_memcpy(dst, src, len, GPU_MEMCPY_DEVICE_TO_DEVICE);

  check_gpu_error();

}


inline void fml::card::synch()

{

  init();

  err = fml::gpuprims::gpu_synch();

  check_gpu_error();

}


inline void fml::card::check()

{

  err = fml::gpuprims::gpu_last_error();

  check_gpu_error();

}


inline void fml::card::set_math_mode(gpublas_mathmode_t mode)

{

  gpublas_status_t check = gpublas::set_math_mode(_blas_handle, mode);

  gpublas::err::get_cublas_error_msg(check);

}


// -----------------------------------------------------------------------------

// private

// -----------------------------------------------------------------------------


inline void fml::card::init()

{

  if (_id == UNINITIALIZED_CARD)

    throw std::runtime_error("invalid card (uninitialized)");

  else if (_id == DESTROYED_CARD)

    throw std::runtime_error("invalid card (destroyed)");


  err = fml::gpuprims::gpu_set_device(_id);

  check_gpu_error();

}


inline void fml::card::cleanup()

{

  init();


  if (_lapack_handle)

  {

    fml::gpuprims::gpu_lapack_free(_lapack_handle);

    _lapack_handle = NULL;

  }


  if (_blas_handle)

  {

    fml::gpuprims::gpu_blas_free(_blas_handle);

    _blas_handle = NULL;

  }


  err = fml::gpuprims::gpu_device_reset();


  _id = DESTROYED_CARD;

}


inline void fml::card::check_gpu_error()

{

  if (err != GPU_SUCCESS)

  {

    cleanup();


    std::string s = fml::gpuprims::gpu_error_string(err);

    throw std::runtime_error(s);

  }

}


#endif