首页技术总结正文内容

python新浪股票接口 2019_用python爬虫进行新浪腾讯股票数据采集

技术总结

更新时间：2024-12-22 22:02:31 3

admin 管理员组

文章数量: 887018

今天带给大家的是从新浪和腾讯爬取股票数据，主要是因为新浪和腾讯的股票数据存储在js中，不需要再重新解析网页源码方便很多。

今天我们要实现的股票爬取设计内容丰富，包括：

1、一个股票数据(沪深)爬虫和选股策略测试框架，数据基于腾讯L和新浪财经。

2、爬取所有沪深两市股票的行情数据，可选择时分线、日k线、周K线、月K线、股票最新行情。

3、根据指定的选股策略和指定的日期进行选股测试。

4、计算选股测试实际结果(包括与沪深300指数比较)。

5、保存数据到JSON文件、CSV文件。

6、支持使用表达式定义选股策略。

7、支持多线程处理。

使用环境python3.6

option.py

首先是参数定义部分option.py，这一部分用于控制代码的运行，主要包括，是否下载数据，是否进行测试，文件保存格式，文件的字符编码、测试的时间范围、抓起的时间起点、抓取的时间终点、股票数据保存路径、线程数目、选股策略文件路径(UTF8编码)、选股策略的数据库名称(不用数据库可以不用关心)、策略表达式(也可以将策略表达式放在文件中)

#coding:utf-8

#爬虫参数配置

import argparse

import datetime

#获取偏移指定天数的时间表达式

def get_date_str(offset):

if(offset is None):

offset = 0

date_str = (datetime.datetime.today() + datetime.timedelta(days=offset)).strftime("%Y%m%d")

return date_str

_default = dict(

reload_data = 'Y', # --reload {Y,N} 是否重新抓取股票数据，默认值：Y

gen_portfolio = 'Y', # --portfolio {Y,N} 是否生成选股测试结果，默认值：N

output_type = 'json', # --output {json,csv,all} 输出文件格式，默认值：json

charset = 'utf-8', # --charset {utf-8,gbk} 输出文件编码，默认值：utf-8

test_date_range = 60, # --testrange NUM 测试日期范围天数，默认值：50

start_date = get_date_str(-90), # --startdate yyyy-MM-dd 抓取数据的开始日期，默认值：当前系统日期-100天(例如2015-01-01)

end_date = get_date_str(None), # --enddate yyyy-MM-dd 抓取数据的结束日期，默认值：当前系统日期

target_date = get_date_str(None), # --targetdate yyyy-MM-dd 测试选股策略的目标日期，默认值：当前系统日期

store_path = 'stockholm_export', # --storepath PATH 输出文件路径，默认值：stockholm_export

thread = 10, # --thread NUM 线程数，默认值：10

testfile_path = './portfolio_test.txt',# --testfile PATH 选股策略文件路径，默认值：./portfolio_test.txt

db_name = 'stockholm', #选股策略数据库名称

methods = '' #选股策略表达式

)

parser = argparse.ArgumentParser(description='A stock crawler and portfolio testing framework.')

parser.add_argument('--reload', type=str, default=_default['reload_data'], dest='reload_data', help='Reload the stock data or not (Y/N), Default: %s' % _default['reload_data'])

parser.add_argument('--portfolio', type=str, default=_default['gen_portfolio'], dest='gen_portfolio', help='Generate the portfolio or not (Y/N), Default: %s' % _default['gen_portfolio'])

parser.add_argument('--output', type=str, default=_default['output_type'], dest='output_type', help='Data output type (json/csv/all), Default: %s' % _default['output_type'])

parser.add_argument('--charset', type=str, default=_default['charset'], dest='charset', help='Data output charset (utf-8/gbk), Default: %s' % _default['charset'])

parser.add_argument('--testrange', type=int, default=_default['test_date_range'], dest='test_date_range', help='Test date range(days): %s' % _default['test_date_range'])

parser.add_argument('--startdate', type=str, default=_default['start_date'], dest='start_date', help='Data loading start date, Default: %s' % _default['start_date'])

parser.add_argument('--enddate', type=str, default=_default['end_date'], dest='end_date', help='Data loading end date, Default: %s' % _default['end_date'])

parser.add_argument('--targetdate', type=str, default=_default['target_date'], dest='target_date', help='Portfolio generating target date, Default: %s' % _default['target_date'])

parser.add_argument('--storepath', type=str, default=_default['store_path'], dest='store_path', help='Data file store path, Default: %s' % _default['store_path'])

parser.add_argument('--thread', type=int, default=_default['thread'], dest='thread', help='Thread number, Default: %s' % _default['thread'])

parser.add_argument('--testfile', type=str, default=_default['testfile_path'], dest='testfile_path', help='Portfolio test file path, Default: %s' % _default['testfile_path'])

parser.add_argument('--dbname', type=str, default=_default['db_name'], dest='db_name', help='MongoDB DB name, Default: %s' % _default['db_name'])

parser.add_argument('--methods', type=str, default=_default['methods'], dest='methods', help='Target methods for back testing, Default: %s' % _default['methods'])

def main():

args = parser.parse_args()

print(args)

if __name__ == '__main__':

main()

股票数据爬取、测试，存储、读取等全部主要功能程序stockholm.py

#coding:utf-8

import requests

import json

import datetime

import timeit

import time

import io

import os

import csv

import re

from pymongo import MongoClient

from multiprocessing.dummy import Pool as ThreadPool

from functools import partial

class Stockholm(object):

def __init__(self, args):

## --reload {Y,N} 是否重新抓取股票数据，默认值：Y

self.reload_data = args.reload_data

## --portfolio {Y,N} 是否生成选股测试结果，默认值：N

self.gen_portfolio = args.gen_portfolio

## --output {json,csv,all} 输出文件格式，默认值：json

self.output_type = args.output_type

## --charset {utf-8,gbk} 输出文件编码，默认值：utf-8

self.charset = args.charset

## --testrange NUM 测试日期范围天数，默认值：50

self.test_date_range = args.test_date_range

## --startdate yyyy-MM-dd 抓取数据的开始日期，默认值：当前系统日期-100天(例如2015-01-01)

self.start_date = args.start_date

## --enddate yyyy-MM-dd 抓取数据的结束日期，默认值：当前系统日期

self.end_date = args.end_date

## --targetdate yyyy-MM-dd 测试选股策略的目标日期，默认值：当前系统日期

self.target_date = args.target_date

## --thread NUM 线程数，默认值：10

self.thread = args.thread

## --storepath PATH 输出文件路径，默认值࿱

本文标签：新浪股票爬虫腾讯数据采集

版权声明：本文标题：python新浪股票接口 2019_用python爬虫进行新浪腾讯股票数据采集内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1726782024h1027835.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

python新浪股票接口 2019_用python爬虫进行新浪腾讯股票数据采集

更多相关文章

腾讯云服务器如何安装宝塔面板（Linuxwindows系统）

【腾讯云 TDSQL-C Serverless 产品体验】大数据时代最值得信赖的数据库TDSQL

js逆向-腾讯滑块collect参数

爬虫偶遇网站无法F12怎么办？

linux_egg.js部署到云服务器(腾讯云CentOS7)2021.12

小白用chatgpt编写python 爬虫程序代码 抓取网页数据(js动态生成网页元素)

读书笔记 摘自：《人工智能：国家人工智能战略行动抓手》的笔记（作者: 腾讯研究院 中国信息通信研究院互联网法律研究中心 腾讯AI Lab 腾讯开放平台）

浏览器UA内核、Windows各版本内核、搜索引擎爬虫UA 归类

大咖说：如何借助腾讯云简单、高效移动开发

java使用webMagic爬虫

用腾讯地图实现地点搜索

Python新闻网站项目-2.Scrapy爬虫的配置和数据抓取

ubuntu20.04通过SSH指令连接腾讯云服务器

【人工智能开发框架】实验1、注册腾讯API，调用某个接口，完成一个人工智能应用

【2024年8月最新整理的股票数据接口合集】新浪股票、麦蕊智数、腾讯股票、雪球等等各大网站API接口大全

分享一篇关于腾讯会议的PRD文档

腾讯 爱奇艺服务器（网址）无法访问（打不开，没有网络）

以腾讯云为例，使用宝塔搭建一个骚气的导航网站

QT POST方法：以使用腾讯云发送短信为例

【云服务器软件部署】腾讯云服务器Linux快速部署JDK、Tomcat、MySQL、Redis、Nginx、Zookeeper等（速成版）

发表评论

推荐文章

学计算机买宏基好吗,宏基笔记本电脑怎么样 宏基电脑有哪些技术优势

Tableau自学四部曲_Part1：Tableau介绍与安装

msf12-020蓝屏Windows7和XP系统

Windows下搭建Pytorch环境（超详细）

【OpenAI】震惊！ChatGPT Pro月费200美元，硬核用户的福音还是高价陷阱？

热门文章

Win7能安装ps2020吗？Windows7安装哪个版本的ps

虚拟机安装过程记录

微软错误代码

如何在线一键重装win7,在线一键重装Win7方法教程

LeetCode200:岛屿数量

k8s常用资源模板

win10win7怎么打开debug

Windows10企业版下载指南及推荐版本详解

微软官网下载纯净系统并安装

新买的笔记本自带windows系统吗

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

苹果电脑windows系统换苹果系统

Win11系统崩溃错误修复指南：三种实用方法详解

如何封装一个自己的win7系统并安装到电脑做成双系统

小白用chatgpt编写python 爬虫程序代码抓取网页数据(js动态生成网页元素)

读书笔记摘自：《人工智能：国家人工智能战略行动抓手》的笔记（作者: 腾讯研究院中国信息通信研究院互联网法律研究中心腾讯AI Lab 腾讯开放平台）

腾讯爱奇艺服务器（网址）无法访问（打不开，没有网络）

学计算机买宏基好吗,宏基笔记本电脑怎么样宏基电脑有哪些技术优势