提问人:harsh patel 提问时间:10/6/2023 最后编辑:harsh patel 更新时间:10/6/2023 访问量:30
在单热编码和标签编码之间进行选择以进行时间序列预测
Choosing Between One-Hot Encoding and Label Encoding for Time Series Forecasting
问:
我正在研究一个时间序列预测问题,比如说 10 个分类属性,我不确定是使用标签编码还是单热编码。由于类别之间没有序数关系,因此我倾向于单热编码。但是,某些变量具有 100 多个类别,可能导致 800-900 个维度。
问题:
- 对于像Prophet或神经网络这样的时间序列预测模型来说,这样的高维度会有问题吗?(我不这么认为,但请发表你的看法)
- 我是否应该考虑在单热编码后降低维数(例如,PCA 或流形)并获得 1000 个属性?
请根据您的经验提供见解和建议。
答: 暂无答案
评论