python-2.7 问答列表

在 python 中使用 selenium chrome webdriver 拉取 twitter 关注者数据?无法加载所有关注者

作者:Ashish Verma 提问时间:4/2/2017

我正在尝试使用 Selenium chrome webdriver 和 BeautifulSoup 为拥有 80K 关注者的帐户提取 twitter 关注者数据。 我的脚本中面临两个问题: 1)在加...

使用 BeautifulSoup 将数据从 dataframe 中抓取到 dataframe 中

作者:ezeagwulae 提问时间:12/8/2017

我正在做一个项目,将加州彩票中的数据抓取并解析成一个dataframe 这是我到目前为止的代码,它没有产生错误,也没有输出: import requests from bs4 import Bea...

计算 Python 字典的特定键中的值数

作者:noydb 提问时间:6/30/2018

有人可以向我解释这一点,和/或指导我以正确的/pythonic 方式做到这一点吗? 蟒蛇 2.7。 最终,我正在尝试遍历字典 countsD: countsD = {"aa": None, "b...

如何在 Python2 中离线验证 xHtml1.1 文档

作者:Sebo.PL 提问时间:7/9/2018

我需要设置一个测试方法来验证作为 Python 字符串提供的标记是否有效 xHtml1.1。 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "h...

带有正则表达式的自定义 HTMLParser 未正确返回

作者:BenMyr 提问时间:9/19/2018

我正在开发一个程序,该程序根据不同的正则表达式从 HTML 文件中抓取一些信息。我遇到了以下代码的错误 我的 HTMLParser 子类: class MyHtmlParser(HTMLParse...

如何在文本文件中将输出复制到 BS4 中的终端

作者:topplethepat 提问时间:12/8/2018

我是第一次使用 bs4。如果我使用这个基本代码: from bs4 import BeautifulSoup with open ('test.txt','r') as f: soup = Bea...

如何从多个html中解析电话号码?

作者:2manov 提问时间:2/5/2019

我不知道如何解析来自多个 html 的电话号码,因为它们在 span 类中具有不同的名称。我只有一个想法,那就是解析完整的html文本并使用正则表达式获取电话号码,但是我有大约1000个html,我认...

无法解析登录门户后面的受保护页面 - requests 模块 Python

作者:Nikhil Hegde 提问时间:3/22/2019

我正在尝试解析此 url: http://134.209.71.24/ui/attacks/ 中的数据,但我无法解析,因为 http://134.209.71.24/ui/login/?next=%2...

如何测试编码类型Python 2.7?

作者:noydb 提问时间:4/18/2019

我正在尝试解决我遇到的有关外来字符(任何和所有字母)的问题。我的脚本(2.7 python)以 unicode json 的形式接收字符(英文字母和其他外来字符的混合),并将其发送到数据库插入函数,以...

Python 正则表达式将 100 &lt;数字替换为“100 BLOCK”,否则将最后两位数字替换为“00 BLOCK”

作者:sushi 提问时间:6/25/2019

我正在使用 Python 2.7.13 来清理一些数据。 我有一个数字列表,如果字符串以数字开头。如果起始数字小于 100,我需要将其替换为 .如果数字更大,我需要将最后两位数字替换为 .'100 ...


共144条 当前第8页