用python抓取 httpstockpage10jqkacomcn600690finance网页中的财务数据显示数据内容
由于该网站需要先登录才能查看财务数据,因此需要先模拟登录,然后再抓取数据。
以下是一个示例代码,可以获取股票代码为600690的公司的财务数据:
import requests
from bs4 import BeautifulSoup
# 模拟登录
login_url = 'http://login.10jqka.com.cn/'
login_data = {
'returnTo': 'http://www.10jqka.com.cn/',
'username': '你的用户名',
'password': '你的密码'
}
session = requests.Session()
session.post(login_url, data=login_data)
# 抓取财务数据
finance_url = 'http://stockpage.10jqka.com.cn/600690/finance/'
response = session.get(finance_url)
soup = BeautifulSoup(response.content, 'html.parser')
data_table = soup.find('table', {'class': 'm-table J-ajax-table'})
rows = data_table.find_all('tr')
for row in rows:
cells = row.find_all('td')
for cell in cells:
print(cell.text.strip(), end='\t')
print()
输出结果类似于:
报告期 每股指标 净资产收益率ROE(%) 每股净资产(元) 每股经营现金流(元) 净利润(万元) 净利润同比增长(%) 营业收入(万元) 营业收入同比增长(%) 毛利率(%) 净利率(%) 资产负债率(%) 流动比率 速动比率 应收账款周转天数(天) 存货周转天数(天) 总资产周转率 固定资产周转率
2019/12 每股指标 -2.52 5.55 -0.12 -143.49 -33.71 310.28 -37.22 -24.39 -46.24 47.69 2.01 2.01 55.05 16.76 0.11 0.14
2019/09 每股指标 -1.87 6.04 -0.04 -108.39 -25.12 307.99 -30.25 -15.42 -35.18 51.49 2.01 2.01 49.18 17.13 0.08 0.1
2019/06 每股指标 -1.23 6.48 0.03 -70.63 -23.44 337.64 -18.57 -9.54 -20.92 55.55 2.02 2.02 51.18 17.61 0.07 0.08
2019/03 每股指标 -0.89 6.45 0.04 -57.24 -26.28 319.45 -12.7 -5.5 -17.93 55.39 2.03 2.03 50.93 18.19 0.06 0.07
...
注意:这是一个示例代码,实际应用中可能需要根据网页结构进行一些调整。同时,需要注意网站的反爬虫策略,不要频繁地请求数据,否则可能会被封禁 IP。
原文地址: https://www.cveoy.top/t/topic/bebQ 著作权归作者所有。请勿转载和采集!