如何使用 pandas 删除从网站抓取的 csv 文件中的符号

How do I delete symbols I scraped from websites in a csv file using pandas

提问人:عمر عيسى 提问时间:9/13/2023 最后编辑:عمر عيسى 更新时间:9/15/2023 访问量:33

问:

我正在尝试分析航空公司评论,这是一个仅包含评论文本的单列数据帧,不幸的是,存在一个勾号✅和特殊字符 |在每一行中显示行程是否已验证,然后 |似乎将注释和验证语句分开,我想删除验证文本和符号。

data['reviews'] = data['reviews'].str.replace('[^a-zA-Z0-9\s]+', '')

我尝试使用替换函数替换特殊字符:regex=True),

data.replace(['\d+', r'(?u)[^\w\s\?]+', '\s*$'], ['','',''], 
Python Pandas 正则表达式 数据帧

评论

1赞 Michael Butscher 9/13/2023
(1) 在问题中将代码和其他文本信息显示为格式正确的文本,而不是评论、图像或外部链接。
0赞 OCa 9/14/2023
添加标签“regex”可能会帮助正则表达式专家真正看到您的问题?
0赞 OCa 9/14/2023
meta.stackoverflow.com/questions/285551/......
0赞 عمر عيسى 9/15/2023
谢谢,我刚刚用正确的格式编辑了这个问题
0赞 The fourth bird 9/15/2023
@عمرعيسى 这些数据是什么样的?您能否为问题添加一些示例数据和预期结果?

答: 暂无答案