开云体育咱们将真切探讨窥探一个不仅能算计股票价钱-开云官网切尔西赞助商(2024已更新(最新/官方/入口)

发布日期:2026-02-12 11:30    点击次数:97

开云体育咱们将真切探讨窥探一个不仅能算计股票价钱-开云官网切尔西赞助商(2024已更新(最新/官方/入口)

创作不易,便捷的话点点关心,谢谢

著作终结有最新热度的著作,感酷爱的不错去望望。

本文是经过严格查阅接洽巨擘文献和贵寓,变成的专科的可靠的内容。全文数据皆有据可依,可回溯。额外声名:数据和贵寓已获取授权。本文内容,不波及任何偏颇不雅点,用中立魄力客不雅事实描摹事情本人

著作有点长(2222字阅读时长:8分),盼望您能相持看完,并有所得益。

免责声明:股票价钱算计推行上是不笃定的,本教程仅供教练目的使用。这里策划的模子和行径不应被证据为财务淡薄或依赖于推行走动方案。天然时刻交融Transformer(TFT)模子提供了置信区间,有助于评估风险,但莫得模子能统统探究到金融市集的不成算计性。在作念出投资方案之前,请长久进行透彻的研究,并商量金融专科东谈主士。

接待来到这个系列,了解如何使用时刻交融Transformer(TFT)构建一个可证据的模子,用于高频股票价钱算计。在这个系列中,咱们将真切探讨窥探一个不仅能算计股票价钱,况且能提供置信区间,使其成为风险评估的认真器具的模子的枢纽。从数据采集和预处理到模子窥探、评估和证据,每篇著作皆将指点您完成经过中的重要阶段。

在第一部分中,咱们将从基础入手:采集正确的数据并推行探索性数据分析(EDA),以了解高频股票数据中的趋势、模式和潜在罗网。

布景和动机

股票市集是一个动态且频繁不成算计的环境。收效的日内走动者依赖的不单是是算计,还有高陈述与风险的走动。即使走动者惟有50%的时刻正确算计股票的标的,如若每次走动的平均陈述进步平均风险,他们仍然不错盈利。自动化走动算法匡助走动者从走动中去除情谊,使他们梗概专注于本领方针和系统性方案。

使用咱们的时刻交融Transformer模子,目的不是竣事竣工的算计准确度(在金融市集上是不成能的豪举),而是开导一个不错识别高概率变动的模子,同期评估与每个算计接洽的风险。通过专注于精准度并使用置信区间,该模子不错四肢作念出更贤慧走动方案的认真器具。

数据采集和准备

在这个形状中,我采集了平均逐日走动量进步100万股的股票的1分钟日内数据。这个数据集涵盖了从2024年1月1日到2024年7月11日的6个月,悉数进步1500只股票。关于每只股票,我采集了尺度的OHLCV(开盘、最高、最低、收盘、成交量)数据,捕捉了扫数这个词走动日的每个价钱变动。为了简化数据处理经过,我将这些数据保存在一个单一的.parquet文献中,以便有用造访和分析。

数据加载和运行计帐

在Jupyter Notebook中,我入手导入数据操作、可视化和建模所需的基本库。以下是一些使用中的库的示例:

import pandas as pdimport yfinance as yfimport matplotlib.pyplot as pltimport numpy as npimport seaborn as snsfrom datetime import datetime

然后加载数据集并将日历诞生为基于时刻的分析的索引:

df = pd.read_parquet("data.parquet")df.set_index("datetime", inplace=True)df.sample(10) # 打印数据衔接的10个马上行

输出:

为明晰解我要处理的数据量,我使用 df.info() 来获取这些信息:

# 这个数据框十分大,包含进步6600万行,使用进步4.5 GB的内存。

为了使其更易于管束,并过滤掉流动性欠安的股票,我使用“股票平均口头成交量”,这是通过将日均成交量乘以平均价钱来计较的。我只保留平均口头成交量最高的前100只股票。

def resample_to_daily(group): resampled_group = group.resample('D').agg({'open':'first','high':'max','low':'min','close':'last','volume':'sum'}).dropna()return resampled_group# 期骗重采样函数到每个组df_daily = df.groupby('symbol').apply(resample_to_daily).reset_index()df_daily["stock_median_volume"]= df_daily.groupby("symbol")["volume"].transform("median").astype(int)df_daily["stock_average_price"]= df_daily.groupby("symbol")["close"].transform("mean")df_daily["stock_average_nominal_volume"]= df_daily["stock_median_volume"]* df_daily["stock_average_price"]top_100_symbols = df_daily.groupby("symbol")['stock_average_nominal_volume'].median().nlargest(100).index# 过滤数据框以保留口头成交量最高的前100只股票df_daily = df_daily[df_daily['symbol'].isin(list(top_100_symbols))]df = df[df['symbol'].isin(list(top_100_symbols))]print(f"Number of total one minute bars after resampling: {df.shape[0]}")print(f"Symbols: {df_daily.symbol.unique()}")

输出:

重采样后总的1分钟K线数目:165367标记:['AAL' 'AAPL' 'ABBV' 'ABNB' 'ABT' 'ADBE' 'AM' 'AMD' 'AMZN' 'ANET' 'AVGO' ...]

EDA和特征工程 鄙人一步中,我进行探索性数据分析(EDA),以了解咱们过滤后的数据集的重要特征,并入手特征工程以索要接洽方针。通过可视化趋势、价钱分裂和成交量变化,我旨在揭示可能指点咱们算计模子的模式和知悉。

这就限度了第一部分。在接下来的部分中,咱们将更真切地探讨特征工程,并入手准备咱们的数据集以进行模子窥探。

如若您对构建用于股票算计的机器学习模子感到振奋,请关心我,以获取本系列的最新更新!每篇著作将带您了解一个新的阶段,从数据准备到模子评估和战略回测,提供为金融怜爱者和有抱负的量化分析师量身定制的实践代码和知起劲!

点个“在看”不失联

最新热点著作推选:

外洋Rust程序员共享:Rust与C++的竣工招引

外洋C++程序员共享:2024/2025年C++是否还值得学习?

异邦东谈主眼中的贾扬清:从清华到阿里,再创业LeptonAI

白宫关心下,C++的内存安全异日走向何方?

外洋Python程序员共享:如何用Python构建一个多代理AI期骗

土产货部署六款大模子:保护诡秘、任意本钱,特定环境首选

外洋CUDA程序员共享:2024年GPU编程CUDA C++(从环境装置到进阶技能)

我卸载了VSCode,我的分娩力大幅升迁

外洋Python程序员共享:2024年NumPy高性能计较库(高等技能)

异邦东谈主眼中的程明明:从“电脑小白”到CV限度领军者

异邦东谈主眼中的周志华:东谈主工智能奖获取者、东谈主工智能学院院长

外洋C++程序员共享:C++多线程实战掌持图像处理高等技能

异邦东谈主眼中的卢湖川:从大连理工到环球舞台,他的科研后果漂泊天下!

异邦东谈主眼中的张祥雨:交大90后男神博士,3年看1800篇论文,还入选福布斯精英榜

参考文献:《图片起首采集》开云体育



相关资讯



Powered by 开云官网切尔西赞助商(2024已更新(最新/官方/入口) @2013-2022 RSS地图 HTML地图