提问人:LEO_007 提问时间:11/18/2023 最后编辑:LEO_007 更新时间:11/18/2023 访问量:34
NLP 文本分类或任何方法要求指南 [已关闭]
NLP Text Classificaiton or any method requirement guidance [closed]
问:
我在我的一个项目中遇到了一个挑战,我将获得一个从网站上抓取的数据列表。除了数据,我还将获得一些参数,例如抓取元素的标签、抓取元素的类名和一些前面的文本。我的工作是提供最适合数据的列名。我能够从类名中提取一些相关数据,但需要保证,因为这不是一个可靠的因素。
因此,我需要一种对所提供的数据进行分类的方法或方法。我正在考虑空间及其功能,如NER等。请提供一种方法。其他技术上可行的解决方案也受到欢迎!!!!!
我尝试过的事情:- spacy 和 sklearns 分类器的默认 NER,但分类器没有显示任何好的结果,并且 spacys 默认 NER 受到很大限制。自定义 NER 需要大量数据。因此,我所需要的只是一种方法来继续前进。我也不确定我是否应该考虑文本分类。因为我的最终目标是确保提供的类别适合抓取的数据。抓取的数据可以是多种多样的:- 职位列表、房地产、产品、书名、链接或网址等。
答: 暂无答案
评论