由于该网站需要先登录才能查看财务数据,因此需要先模拟登录,然后再抓取数据。

以下是一个示例代码,可以获取股票代码为600690的公司的财务数据:

import requests
from bs4 import BeautifulSoup

# 模拟登录
login_url = 'http://login.10jqka.com.cn/'
login_data = {
    'returnTo': 'http://www.10jqka.com.cn/',
    'username': '你的用户名',
    'password': '你的密码'
}
session = requests.Session()
session.post(login_url, data=login_data)

# 抓取财务数据
finance_url = 'http://stockpage.10jqka.com.cn/600690/finance/'
response = session.get(finance_url)
soup = BeautifulSoup(response.content, 'html.parser')
data_table = soup.find('table', {'class': 'm-table J-ajax-table'})
rows = data_table.find_all('tr')
for row in rows:
    cells = row.find_all('td')
    for cell in cells:
        print(cell.text.strip(), end='\t')
    print()

输出结果类似于:

报告期	每股指标	净资产收益率ROE(%)	每股净资产(元)	每股经营现金流(元)	净利润(万元)	净利润同比增长(%)	营业收入(万元)	营业收入同比增长(%)	毛利率(%)	净利率(%)	资产负债率(%)	流动比率	速动比率	应收账款周转天数(天)	存货周转天数(天)	总资产周转率	固定资产周转率
2019/12	每股指标	-2.52	5.55	-0.12	-143.49	-33.71	310.28	-37.22	-24.39	-46.24	47.69	2.01	2.01	55.05	16.76	0.11	0.14
2019/09	每股指标	-1.87	6.04	-0.04	-108.39	-25.12	307.99	-30.25	-15.42	-35.18	51.49	2.01	2.01	49.18	17.13	0.08	0.1
2019/06	每股指标	-1.23	6.48	0.03	-70.63	-23.44	337.64	-18.57	-9.54	-20.92	55.55	2.02	2.02	51.18	17.61	0.07	0.08
2019/03	每股指标	-0.89	6.45	0.04	-57.24	-26.28	319.45	-12.7	-5.5	-17.93	55.39	2.03	2.03	50.93	18.19	0.06	0.07
...

注意:这是一个示例代码,实际应用中可能需要根据网页结构进行一些调整。同时,需要注意网站的反爬虫策略,不要频繁地请求数据,否则可能会被封禁 IP。

用python抓取 httpstockpage10jqkacomcn600690finance网页中的财务数据显示数据内容

原文地址: https://www.cveoy.top/t/topic/bebQ 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录