SDV(合成数据保险库)问题:取回相同的合成数据集

Problem with SDV (synthetic data vault): Getting back identical synthetic datasets

提问人:user3786999 提问时间:10/3/2023 更新时间:10/3/2023 访问量:45

问:

我正在使用 SDV 库中的以下代码来创建一个与我的原始数据集形状相同的合成数据集。虽然每个合成数据集都与原始数据集不同,但所有合成数据集彼此相同。我本来以为合成数据生成过程中会有一些随机性,因此每个输出会略有不同。即使我设置了不同的随机种子,这种情况也会在会话中发生。我应该如何解释正在发生的事情?

    metadata.detect_from_dataframe(data=input_data)
    synthesizer = SingleTablePreset(metadata=metadata,name='FAST_ML')
    synthesizer.fit(data=input_data)
    synthetic_data = synthesizer.sample(num_rows=len(input_data))```
Python 数据生成 合成 SDV

评论


答: 暂无答案