openvinotoolkit · awayzjj · Jun 29, 2024 · Jul 9, 2024 · l-bat · Jul 10, 2024
@@ -57,6 57,13 @@
 TTensor = TypeVar("TTensor")
 
 
 def get_actual_subset_size(dataset, subset_size):
  dataset_length = dataset.get_length()
  if dataset_length:
  return min(dataset_length, subset_size)
  return subset_size
 description="Statistics collection", 
 description="Statistics collection", 
 
 
 @tracked_function(NNCF_OV_CATEGORY, [CompressionStartedWithQuantizeApi(), "target_device", "preset"])
 def native_quantize_if_op_impl(
  model: ov.Model,
@@ -131,6 138,7 @@ def _extract_all_subgraphs(model: ov.Model, current_id: str) -> None:
  "preset": preset,
  "target_device": target_device.value,
  "subset_size": subset_size,
  "actual_subset_size": get_actual_subset_size(calibration_dataset, subset_size),
  "fast_bias_correction": fast_bias_correction,
  "model_type": model_type,
  "ignored_scope": ignored_scope,
@@ -179,6 187,7 @@ def native_quantize_impl(
  "preset": preset,
  "target_device": target_device.value,
  "subset_size": subset_size,
  "actual_subset_size": get_actual_subset_size(calibration_dataset, subset_size),
  "fast_bias_correction": fast_bias_correction,
  "model_type": model_type,
  "ignored_scope": ignored_scope,
@@ -318,6 327,7 @@ def native_quantize_with_accuracy_control_impl(
  "preset": preset,
  "target_device": target_device.value,
  "subset_size": subset_size,
  "actual_subset_size": get_actual_subset_size(calibration_dataset, subset_size),
  "fast_bias_correction": fast_bias_correction,
  "model_type": model_type,
  "ignored_scope": ignored_scope,

@@ -197,3 197,20 @@ def test_ignored_scope_dump(ignored_options, expected_dump, tmp_path):
  assert dumped_model.get_rt_info(rt_path) == value
  else:
  assert dumped_model.has_rt_info(rt_path) is False
 
 
 @pytest.mark.parametrize("subset_size, expected_actual_subset_size", [[1, 1], [2, 1]])
 def test_dump(subset_size, expected_actual_subset_size, tmp_path):
  model = WeightsModel().ov_model
  dataset = get_dataset_for_test(model) # dataset.get_length() == 1
  quantize_parameters = {
  "preset": QuantizationPreset.PERFORMANCE,
  "target_device": TargetDevice.CPU,
  "subset_size": subset_size,
  "fast_bias_correction": True,
  }
  quantized_model = quantize_impl(model, dataset, **quantize_parameters)
  ov.save_model(quantized_model, tmp_path / "ov_model.xml")
  core = ov.Core()
  dumped_model = core.read_model(tmp_path / "ov_model.xml")
  assert dumped_model.get_rt_info(["nncf", "quantization", "actual_subset_size"]) == str(expected_actual_subset_size)