NLP 文本分类或任何方法要求指南 [已关闭]

NLP Text Classificaiton or any method requirement guidance [closed]

提问人:LEO_007 提问时间:11/18/2023 最后编辑:LEO_007 更新时间:11/18/2023 访问量:34

问:


想改进这个问题吗?更新问题,以便可以通过编辑这篇文章用事实和引文来回答。

5天前关闭。

我在我的一个项目中遇到了一个挑战,我将获得一个从网站上抓取的数据列表。除了数据,我还将获得一些参数,例如抓取元素的标签、抓取元素的类名和一些前面的文本。我的工作是提供最适合数据的列名。我能够从类名中提取一些相关数据,但需要保证,因为这不是一个可靠的因素。

因此,我需要一种对所提供的数据进行分类的方法或方法。我正在考虑空间及其功能,如NER等。请提供一种方法。其他技术上可行的解决方案也受到欢迎!!!!!

我尝试过的事情:- spacy 和 sklearns 分类器的默认 NER,但分类器没有显示任何好的结果,并且 spacys 默认 NER 受到很大限制。自定义 NER 需要大量数据。因此,我所需要的只是一种方法来继续前进。我也不确定我是否应该考虑文本分类。因为我的最终目标是确保提供的类别适合抓取的数据。抓取的数据可以是多种多样的:- 职位列表、房地产、产品、书名、链接或网址等。

Python NLP spacy ml

评论

1赞 SKPS 11/18/2023
欢迎来到 SO!不幸的是,你没有提到你尝试过什么,什么没有成功。您应该首先尝试解决您的问题并提出具体问题,而不是提出宽泛而模糊的问题。stackoverflow.com/help/how-to-ask
0赞 LEO_007 11/18/2023
谢谢。但我真正需要的是前进的正确方向。虽然我编辑了我的帖子
1赞 Tim Roberts 11/18/2023
StackOverflow 不适用于设计建议或涉及意见的问题。您可以尝试 datascience.stackexchange.com

答: 暂无答案