xgboost/tests/cpp/tree/test_gpu_hist.cu


/*!
 * Copyright 2017 XGBoost contributors
 */
#include <thrust/device_vector.h>
#include <xgboost/base.h>
#include "../helpers.h"
#include "gtest/gtest.h"

#include "../../../src/data/sparse_page_source.h"
#include "../../../src/gbm/gbtree_model.h"
#include "../../../src/tree/updater_gpu_hist.cu"
#include "../../../src/common/common.h"

namespace xgboost {
namespace tree {
TEST(gpu_hist_experimental, TestSparseShard) {
  int rows = 100;
  int columns = 80;
  int max_bins = 4;
  auto dmat = CreateDMatrix(rows, columns, 0.9f);
  common::GHistIndexMatrix gmat;
  gmat.Init((*dmat).get(),max_bins);
  TrainParam p;
  p.max_depth = 6;

  dmlc::DataIter<SparsePage>* iter = (*dmat)->RowIterator();
  iter->BeforeFirst();
  CHECK(iter->Next());
  const SparsePage& batch = iter->Value();
  DeviceShard shard(0, 0, 0, rows, p);
  shard.InitRowPtrs(batch);
  shard.InitCompressedData(gmat.cut, batch);
  CHECK(!iter->Next());

  ASSERT_LT(shard.row_stride, columns);

  auto host_gidx_buffer = shard.gidx_buffer.AsVector();

  common::CompressedIterator<uint32_t> gidx(host_gidx_buffer.data(),
                                            gmat.cut.row_ptr.back() + 1);

  for (int i = 0; i < rows; i++) {
    int row_offset = 0;
    for (auto j = gmat.row_ptr[i]; j < gmat.row_ptr[i + 1]; j++) {
      ASSERT_EQ(gidx[i * shard.row_stride + row_offset], gmat.index[j]);
      row_offset++;
    }

    for (; row_offset < shard.row_stride; row_offset++) {
      ASSERT_EQ(gidx[i * shard.row_stride + row_offset], shard.null_gidx_value);
    }
  }

  delete dmat;
}

TEST(gpu_hist_experimental, TestDenseShard) {
  int rows = 100;
  int columns = 80;
  int max_bins = 4;
  auto dmat = CreateDMatrix(rows, columns, 0);
  common::GHistIndexMatrix gmat;
  gmat.Init((*dmat).get(),max_bins);
  TrainParam p;
  p.max_depth = 6;

  dmlc::DataIter<SparsePage>* iter = (*dmat)->RowIterator();
  iter->BeforeFirst();
  CHECK(iter->Next());
  const SparsePage& batch = iter->Value();

  DeviceShard shard(0, 0, 0, rows, p);
  shard.InitRowPtrs(batch);
  shard.InitCompressedData(gmat.cut, batch);
  CHECK(!iter->Next());

  ASSERT_EQ(shard.row_stride, columns);

  auto host_gidx_buffer = shard.gidx_buffer.AsVector();

  common::CompressedIterator<uint32_t> gidx(host_gidx_buffer.data(),
                                            gmat.cut.row_ptr.back() + 1);

  for (int i = 0; i < gmat.index.size(); i++) {
    ASSERT_EQ(gidx[i], gmat.index[i]);
  }

  delete dmat;
}

TEST(gpu_hist_experimental, MGPU_mock) {
  // Attempt to choose multiple GPU devices
  int ngpu;
  dh::safe_cuda(cudaGetDeviceCount(&ngpu));
  CHECK_GT(ngpu, 1);
  for (int i = 0; i < ngpu; ++i) {
    dh::safe_cuda(cudaSetDevice(i));
  }
}

}  // namespace tree
}  // namespace xgboost