在单热编码和标签编码之间进行选择以进行时间序列预测

Choosing Between One-Hot Encoding and Label Encoding for Time Series Forecasting

提问人:harsh patel 提问时间:10/6/2023 最后编辑:harsh patel 更新时间:10/6/2023 访问量:30

问:

我正在研究一个时间序列预测问题,比如说 10 个分类属性,我不确定是使用标签编码还是单热编码。由于类别之间没有序数关系,因此我倾向于单热编码。但是,某些变量具有 100 多个类别,可能导致 800-900 个维度。

问题:

  1. 对于像Prophet或神经网络这样的时间序列预测模型来说,这样的高维度会有问题吗?(我不这么认为,但请发表你的看法)
  2. 我是否应该考虑在单热编码后降低维数(例如,PCA 或流形)并获得 1000 个属性?

请根据您的经验提供见解和建议。

机器学习 数据科学 一热编码 特征工程 降维

评论


答: 暂无答案