从抓取的数据创建数据帧时如何避免重复行？-解网

问：

这只是提取美元报价和变化的简单代码。导出到 excel 时，我得到了一个具有相同值的附加行。

如何消除此双 excel 条目？

import requests
from bs4 import BeautifulSoup
import pandas as pd

url = 'https://www.cnbc.com/quotes/.DXY'

response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

valores = soup.find('div', class_='QuoteStrip-lastPriceStripContainer')

cotacao = valores.find('span')

variacoes = soup.find('span', class_='QuoteStrip-changeDown')

variacao = variacoes.find('span')

print(cotacao.text)
print(variacao.text)

cotacao_dolar = []

for row in soup:
    dic = {}

    dic['Cambio'] = cotacao.text
    dic['Variacao'] = variacao.text

    cotacao_dolar.append(dic)

df = pd.DataFrame(cotacao_dolar)

df.to_csv(r'C:\teste\cotacao_dolar.csv')

结果：

enter image description here

试图删除重复项，但我想直接从 python 代码中删除该行。

Python Pandas DataFrame 网页抓取 Beautifulsoup

import requests 
from bs4 import BeautifulSoup 
import pandas as pd

url = 'https://www.cnbc.com/quotes/.DXY'

response = requests.get(url) 
soup = BeautifulSoup(response.text, 'html.parser')

data = {e.get('class')[0]:e.text.split(' ')[0] for e in soup.select('.QuoteStrip-lastPriceStripContainer span[class]')}

pd.DataFrame([data])

上一个：BeautifulSoup4 返回一个空列表

下一个：Python 代码在 Linux 上解析 XML，但在 Mac 上不解析 XML

从抓取的数据创建数据帧时如何避免重复行？

How to avoid duplicate rows while creating dataframe from scraped data?

评论