深度学习实战：使用 TensorFlow 和 LSTM 构建精准的股票价格预测模型

2026-02-05 22:25:33 0条评论 3次阅读 0人点赞

在金融科技飞速发展的今天，股票价格预测 一直是数据科学领域中最具吸引力同时也最棘手的挑战之一。这不仅关乎个人投资策略的制定，更是高频算法交易和风险管理的核心。你可能会问：机器真的能学会看懂 K 线图吗？答案是肯定的，但前提是我们必须使用正确的工具来处理时间序列数据的特性。

在这篇文章中，我们将深入探索如何利用 TensorFlow 构建一个基于 长短期记忆网络 (LSTM) 的预测模型。LSTM 是一种特殊的递归神经网络 (RNN)，它巧妙地解决了传统神经网络在处理长序列数据时的“遗忘”问题，非常适合捕捉股票价格中的长期趋势和短期波动。

我们将带你完成从数据清洗到模型训练的全过程。你不仅能学到如何处理金融时间序列数据，还将掌握数据预处理、特征工程以及模型调优的实战技巧。

1 1. 准备工作：导入必要的工具库
2 2. 数据加载与初步探索
3 3. 探索性数据分析 (EDA)
4 4. 数据预处理与特征工程
5 5. 构建 LSTM 模型
6 6. 模型编译与训练
7 7. 模型评估与预测
8 总结与下一步

1. 准备工作：导入必要的工具库

在开始之前，我们需要构建一个强大的 Python 环境。我们将使用 Pandas 进行数据操作，NumPy 处理数值计算，Matplotlib 和 Seaborn 进行可视化，当然还有核心的 TensorFlow 和 Keras 来搭建深度学习模型。

除此之外，我们还引入了 warnings 模块来屏蔽一些不影响运行的警告信息，保持输出界面的整洁。这是专业开发中常用的一个小技巧。

# 导入数据处理与可视化库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import os
from datetime import datetime

# 导入深度学习框架 TensorFlow
import tensorflow as tf
from tensorflow import keras

# 配置选项：忽略警告信息，保持输出整洁
import warnings
warnings.filterwarnings("ignore")

# 设置 Matplotlib 中文显示支持（可选，视你的环境而定）
plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘]  # 用来正常显示中文标签
plt.rcParams[‘axes.unicode_minus‘] = False  # 用来正常显示负号

2. 数据加载与初步探索

模型的好坏很大程度上取决于数据的质量。对于金融数据而言，时间戳的正确性至关重要。

我们加载了一个包含过去 5 年多只股票历史价格的数据集。为了确保代码的健壮性，我们在读取 CSV 文件时使用了 on_bad_lines=‘skip‘ 参数。这是一个非常实用的最佳实践，它能防止因为文件中某一行的小错误（如缺失字段）导致整个程序崩溃。

# 加载数据集
# delimiter=‘,‘ 指定分隔符为逗号
# on_bad_lines=‘skip‘ 跳过格式错误的行，增强代码鲁棒性
data = pd.read_csv(‘all_stocks_5yr.csv‘, delimiter=‘,‘, on_bad_lines=‘skip‘)

# 查看数据维度（行数，列数）
print(f"数据集的形状: {data.shape}")

# 随机抽取 7 行数据进行预览，了解数据的基本面貌
print("
数据预览:")
print(data.sample(7))

2.1 数据类型转换：关键的一步

在处理真实世界的数据时，你经常会发现日期列默认被加载为 INLINECODE6ae219fb（字符串）类型。对于时间序列分析，我们必须将其转换为 Pandas 的 INLINECODE4d0d6511 对象。这一步看似简单，但如果没有做好，后续的时间序列绘图和特征提取（例如提取“星期几”或“月份”）都将无法进行。

# 检查数据类型信息
print("
转换前的数据类型信息:")
data.info()

# 将 ‘date‘ 列转换为 datetime 类型
# 这是时间序列分析中最基础也是最重要的一步
data[‘date‘] = pd.to_datetime(data[‘date‘])

# 再次检查，确认 ‘date‘ 列已变为 datetime64[ns]
print("
转换后的数据类型信息:")
data.info()

通过 data.info()，我们可以清晰地看到每一列的数据类型以及是否存在缺失值。在金融项目中，养成在转换后立即检查类型的习惯能帮你节省大量的调试时间。

3. 探索性数据分析 (EDA)

盲目地搭建模型是初学者常犯的错误。在动手之前，让我们先让数据说话。通过可视化，我们可以直观地发现数据中的模式、异常值或周期性。

为了便于演示，我们筛选了几家知名的科技公司：Apple (AAPL)、Google (GOOGL)、Facebook/Meta (FB)、AMD 等。我们将对比它们的开盘价 和收盘价。

3.1 可视化开盘与收盘价格

下面的代码展示了如何在一个画布上绘制多个子图。请注意 plt.tight_layout() 的使用，它能自动调整子图参数，防止标题和坐标轴重叠，这是进行多图对比时的必备技巧。

# 定义我们要分析的公司股票代码列表
tech_companies = [‘AAPL‘, ‘AMD‘, ‘FB‘, ‘GOOGL‘, ‘AMZN‘, ‘NVDA‘, ‘EBAY‘, ‘CSCO‘, ‘IBM‘]

# 创建一个 15x8 英寸的大画布
plt.figure(figsize=(15, 8))

# 使用 enumerate 遍历公司列表，index 用于控制子图位置
for index, company in enumerate(tech_companies, 1):
    # 筛选出当前公司的数据
    company_data = data[data[‘Name‘] == company]
    
    # 创建 3x3 的网格子图，index 确定当前绘制位置
    plt.subplot(3, 3, index)
    
    # 绘制收盘价 (红色，带 + 标记)
    plt.plot(company_data[‘date‘], company_data[‘close‘], color="red", label="Close Price", marker="+")
    
    # 绘制开盘价 (绿色，带 ^ 标记)
    plt.plot(company_data[‘date‘], company_data[‘open‘], color="green", label="Open Price", marker="^")
    
    plt.title(f"{company} Price Trend")
    plt.legend()  # 显示图例
    plt.grid(True)  # 添加网格，便于读数
    plt.tight_layout()  # 自动调整布局，避免重叠

plt.show()

分析见解： 通过观察这些图表，我们可以看到不同股票的波动性差异巨大。例如，科技股在 2018-2020 年间可能有显著的增长趋势。这种趋势分析有助于我们判断数据是否适合用 LSTM 进行预测，因为 LSTM 擅长捕捉这种连续的变化趋势。

3.2 分析交易成交量

价格固然重要，但成交量 往往是价格变动的前兆。成交量暴涨通常意味着市场情绪的剧烈波动。让我们来看看这些公司的成交量分布。

plt.figure(figsize=(15, 8))

for index, company in enumerate(tech_companies, 1):
    company_data = data[data[‘Name‘] == company]
    
    plt.subplot(3, 3, index)
    
    # 绘制成交量（紫色，带 * 标记）
    plt.plot(company_data[‘date‘], company_data[‘volume‘], color=‘purple‘, marker=‘*‘)
    
    plt.title(f"{company} Trading Volume")
    plt.tight_layout()

plt.show()

你会注意到，成交量图通常呈现出“尖峰”状，这对应着特定的财报发布日或重大新闻事件。在构建高级模型时，我们可以将这些成交量峰值作为特征输入，以提高预测精度。

4. 数据预处理与特征工程

在将数据喂给 LSTM 之前，我们必须对其进行严格的预处理。原始数据通常包含非数值列，且数值范围差异巨大（例如价格可能是 1000，而成交量可能是 10000000）。

4.1 数据清洗

首先，我们需要处理数据中的空值。在金融数据中，简单的删除空值 (dropna) 通常是首选，除非你有特定的填充策略（例如用前一个交易日的价格填充）。

# 检查缺失值
print("缺失值统计:")
print(data.isnull().sum())

# 删除包含缺失值的行
data.dropna(inplace=True)

# 再次检查确认清理完成
print(f"清理后的数据形状: {data.shape}")

4.2 数据分割与选择

为了演示，让我们专注于预测 Apple (AAPL) 的收盘价。我们需要提取出 ‘date‘ 和 ‘close‘ 列。

# 筛选 Apple 的数据
df_apple = data[data[‘Name‘] == ‘AAPL‘]

# 我们只关心日期和收盘价
df_apple = df_apple[[‘date‘, ‘close‘]]

# 设置日期为索引（这在时间序列分析中是标准做法）
df_apple.set_index(‘date‘, inplace=True)

# 查看处理后的数据头部
print(df_apple.head())

4.3 数据归一化

这是新手最容易忽略的一步。 神经网络对输入数据的尺度非常敏感。如果我们不将数据缩放到 0 到 1 之间（或者 -1 到 1），模型的收敛速度会极慢，甚至无法收敛。我们将使用 MinMaxScaler。

from sklearn.preprocessing import MinMaxScaler

# 初始化缩放器，将数据映射到 [0, 1] 区间
scaler = MinMaxScaler(feature_range=(0, 1))

# 对收盘价进行拟合和转换
df_apple_scaled = scaler.fit_transform(df_apple)

# 查看归一化后的数据
print("归一化后的前 5 个数据点:")
print(df_apple_scaled[:5])

4.4 构建时间序列数据集

LSTM 需要的是“序列”而不是单个的数据点。我们需要定义一个滑动窗口：

X (特征): 过去 60 天的收盘价。
y (标签): 第 61 天的收盘价。

这种“用过去预测未来”的逻辑是时间序列预测的核心。

# 定义时间步长，即我们用多少天的历史数据来预测下一天
TIME_STEPS = 60

# 准备 X 和 y 列表
X = []
y = []

# 遍历数据，构建滑动窗口
# 注意范围从 TIME_STEPS 开始，因为我们需要前面的数据作为特征
for i in range(TIME_STEPS, len(df_apple_scaled)):
    # X 包含从 i-TIME_STEPS 到 i-1 的数据，共 TIME_STEPS 个
    X.append(df_apple_scaled[i-TIME_STEPS:i, 0])
    # y 包含第 i 天的数据
    y.append(df_apple_scaled[i, 0])

# 转换为 NumPy 数组以提高计算效率
X, y = np.array(X), np.array(y)

print(f"X 的形状: {X.shape}")  # 应该是 (样本数, 60)
print(f"y 的形状: {y.shape}")  # 应该是 (样本数,)

4.5 重塑数据维度

Keras 的 LSTM 层期望输入数据的格式为：INLINECODE3bf51f9b。目前我们的 X 是 INLINECODE121629cb。因为我们只有“收盘价”这 1 个特征，所以我们需要将其重塑为 (样本数, 60, 1)。

# 增加一个维度，使其符合 LSTM 输入格式 [samples, time steps, features]
X = np.reshape(X, (X.shape[0], X.shape[1], 1))

print(f"重塑后 X 的形状: {X.shape}")

5. 构建 LSTM 模型

现在到了最激动人心的部分：搭建神经网络。我们将设计一个包含多个 LSTM 层和 Dropout 层的模型。

LSTM 层: 用于提取时间序列中的特征。我们通常设置 return_sequences=True，以便将序列传递给下一个 LSTM 层。
Dropout 层: 这是一个防止模型过拟合的正则化技术。它在训练过程中随机“丢弃”一部分神经元，迫使模型学习更鲁棒的特征，而不是死记硬背训练数据。这在金融数据建模中至关重要，因为金融噪声很大。

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, LSTM, Dropout

# 初始化顺序模型
model = Sequential()

# 添加第一个 LSTM 层
# units=50: 该层有 50 个神经元
# return_sequences=True: 输出完整的序列以传递给下一层 LSTM
# input_shape: 指定输入形状 (时间步长, 特征数)
model.add(LSTM(units=50, return_sequences=True, input_shape=(X.shape[1], 1)))

# 添加第一个 Dropout 层，丢弃 20% 的神经元
model.add(Dropout(0.2))

# 添加第二个 LSTM 层
# return_sequences=True，因为后面还有 LSTM 层
model.add(LSTM(units=50, return_sequences=True))
model.add(Dropout(0.2))

# 添加第三个 LSTM 层
# return_sequences=False，因为这是最后一个 LSTM 层，后面接全连接层
model.add(LSTM(units=50))
model.add(Dropout(0.2))

# 添加输出层
# units=1: 因为我们只需要预测一个值（下一天的收盘价）
model.add(Dense(units=1))

# 打印模型结构摘要，检查每一层的输出形状
model.summary()

6. 模型编译与训练

接下来，我们需要编译模型。我们使用 Adam 优化器，因为它通常比标准的 SGD 收敛得更快。损失函数我们选择 均方误差 (MSE)，这是回归问题的标准度量。

# 编译模型
# optimizer: ‘adam‘ 是自适应学习率优化器，性能表现优异
# loss: ‘mean_squared_error‘ 适用于回归问题
model.compile(optimizer=‘adam‘, loss=‘mean_squared_error‘)

# 开始训练
# epochs=25: 遍历整个数据集 25 次
# batch_size=32: 每次梯度更新使用 32 个样本
print("开始训练模型...")
history = model.fit(X, y, epochs=25, batch_size=32)

训练监控： 在训练过程中，你应该会看到 Loss 值逐渐下降。如果 Loss 震荡剧烈不下降，可能是因为学习率过大或数据噪声太多。这种情况下，尝试降低学习率或增加 Dropout 比例是有效的解决方案。

7. 模型评估与预测

训练完成后，我们需要在测试集上验证模型的表现。虽然在这个简化的演示中我们使用了所有数据训练，但在实际项目中，你一定要将数据切分为训练集和测试集（通常前 80% 训练，后 20% 测试），以防止“未来数据泄露”。

让我们模拟一个预测过程：假设我们要根据最近的数据预测下一个时间点。

# 假设我们要用数据的最后 60 天来预测紧接着的一天
test_inputs = df_apple_scaled[len(df_apple_scaled) - TIME_STEPS:]

# 我们需要将其重塑为 (1, 60, 1) 以符合模型输入要求
test_inputs = test_inputs.reshape(1, TIME_STEPS, 1)

# 进行预测
predicted_price_scaled = model.predict(test_inputs)

# 重要：我们需要将预测结果反归一化，才能得到真实的股票价格
predicted_price = scaler.inverse_transform(predicted_price_scaled)

print(f"模型预测的下一天价格: {predicted_price[0][0]:.2f}")

# 打印最后一天的真实价格作为对比
real_price = df_apple[‘close‘].iloc[-1]
print(f"最后一天的真实价格: {real_price:.2f}")

总结与下一步

在这篇文章中，我们完成了一次完整的深度学习实战：从理解 LSTM 的原理，到使用 Pandas 清洗和转换时间序列数据，再到构建和训练神经网络。我们不仅写出了代码，更重要的是理解了背后的为什么：

为什么用 LSTM？ 因为它能记住长期的历史趋势。
为什么要归一化？ 为了让模型训练更高效、更稳定。
为什么要 Dropout？ 为了防止模型在复杂的金融数据中过拟合。

给读者的建议：

股票市场是复杂的混沌系统，仅仅依靠简单的收盘价历史数据是无法实现稳定盈利的。你可以尝试将以下内容加入你的模型中，以进一步提升性能：

多变量特征: 加入成交量、移动平均线 (MA)、相对强弱指数 (RSI) 等技术指标。
情感分析: 结合新闻标题或社交媒体的情绪进行预测。
调整超参数: 尝试不同的时间窗口（如 30 天或 100 天）或 LSTM 层的数量。

希望这篇文章能为你打开金融量化的大门。现在，你可以试着运行这些代码，观察结果，并尝试优化它！

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客