Deterministic GPU histogram. (#5361)

* Use pre-rounding based method to obtain reproducible floating point summation. * GPU Hist for regression and classification are bit-by-bit reproducible. * Add doc. * Switch to thrust reduce for `node_sum_gradient`.
2020-03-04 15:13:28 +08:00
parent 9775da02d9
commit 8d06878bf9
18 changed files with 410 additions and 97 deletions
--- a/tests/cpp/tree/gpu_hist/test_histogram.cu
+++ b/tests/cpp/tree/gpu_hist/test_histogram.cu
@@ -0,0 +1,69 @@
+#include <gtest/gtest.h>
+#include "../../helpers.h"
+#include "../../../../src/tree/gpu_hist/row_partitioner.cuh"
+#include "../../../../src/tree/gpu_hist/histogram.cuh"
+
+namespace xgboost {
+namespace tree {
+
+template <typename Gradient>
+void TestDeterminsticHistogram() {
+  size_t constexpr kBins = 24, kCols = 8, kRows = 32768, kRounds = 16;
+  float constexpr kLower = -1e-2, kUpper = 1e2;
+
+  auto pp_m = CreateDMatrix(kRows, kCols, 0.5);
+  auto& matrix = **pp_m;
+  BatchParam batch_param{0, static_cast<int32_t>(kBins), 0, 0};
+
+  for (auto const& batch : matrix.GetBatches<EllpackPage>(batch_param)) {
+    auto* page = batch.Impl();
+
+    tree::RowPartitioner row_partitioner(0, kRows);
+    auto ridx = row_partitioner.GetRows(0);
+
+    dh::device_vector<Gradient> histogram(kBins * kCols);
+    auto d_histogram = dh::ToSpan(histogram);
+    auto gpair = GenerateRandomGradients(kRows, kLower, kUpper);
+    gpair.SetDevice(0);
+
+    auto rounding = CreateRoundingFactor<Gradient>(gpair.DeviceSpan());
+    BuildGradientHistogram(page->matrix, gpair.DeviceSpan(), ridx,
+                           d_histogram, rounding, true);
+
+    for (size_t i = 0; i < kRounds; ++i) {
+      dh::device_vector<Gradient> new_histogram(kBins * kCols);
+      auto d_histogram = dh::ToSpan(new_histogram);
+
+      auto rounding = CreateRoundingFactor<Gradient>(gpair.DeviceSpan());
+      BuildGradientHistogram(page->matrix, gpair.DeviceSpan(), ridx,
+                             d_histogram, rounding, true);
+
+      for (size_t j = 0; j < new_histogram.size(); ++j) {
+        ASSERT_EQ(((Gradient)new_histogram[j]).GetGrad(),
+                  ((Gradient)histogram[j]).GetGrad());
+        ASSERT_EQ(((Gradient)new_histogram[j]).GetHess(),
+                  ((Gradient)histogram[j]).GetHess());
+      }
+    }
+
+    {
+      auto gpair = GenerateRandomGradients(kRows, kLower, kUpper);
+      gpair.SetDevice(0);
+      dh::device_vector<Gradient> baseline(kBins * kCols);
+      BuildGradientHistogram(page->matrix, gpair.DeviceSpan(), ridx,
+                             dh::ToSpan(baseline), rounding, true);
+      for (size_t i = 0; i < baseline.size(); ++i) {
+        EXPECT_NEAR(((Gradient)baseline[i]).GetGrad(), ((Gradient)histogram[i]).GetGrad(),
+                    ((Gradient)baseline[i]).GetGrad() * 1e-3);
+      }
+    }
+  }
+  delete pp_m;
+}
+
+TEST(Histogram, GPUDeterminstic) {
+  TestDeterminsticHistogram<GradientPair>();
+  TestDeterminsticHistogram<GradientPairPrecise>();
+}
+}  // namespace tree
+}  // namespace xgboost