本文共 1338 字,大约阅读时间需要 4 分钟。
MNIST是一个经典的图像分类数据集,包含60000张28x28的灰度图像,每张图像对应一个类别(0-9)。以下将介绍如何使用TensorFlow搭建并训练一个简单的分类模型。
首先,我们需要导入MNIST数据集。TensorFlow提供了一个可以直接使用的MNIST数据集,可以通过以下代码加载数据集:
mnist = tf.keras.datasets.mnist(x_train, y_train), (x_test, y_test) = mnist.load_data()
接下来,我们对训练集和测试集进行归一化处理:
x_train, x_test = x_train / 255.0, x_test / 255.0
使用TensorFlow的高级API,我们可以快速搭建一个分类模型。以下是一个简单的卷积神经网络结构:
model = tf.keras.models.Sequential([ tf.keras.layers.Flatten(input_shape=(28, 28)), tf.keras.layers.Dense(128, activation='relu'), tf.keras.layers.Dropout(0.2), tf.keras.layers.Dense(10, activation='softmax')])
Flatten 层:将28x28的图像展平成一维向量。Dense(128, activation='relu'):添加一个全连接层,128个神经元,使用ReLU激活函数。Dropout(0.2):在训练过程中随机屏蔽20%的神经元,以防止过拟合。Dense(10, activation='softmax'):最终分类层,输出10个概率值,代表数字0-9。接下来,我们配置模型的训练参数:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
Adam:选择自适应优化器,能够较好地处理不同层的学习速率。loss='sparse_categorical_crossentropy':使用分类交叉熵损失函数,适合多分类问题。metrics=['accuracy']:监控准确率,训练过程中实时显示损失和准确率。然后,使用模型拟合训练集:
model.fit(x_train, y_train, epochs=5)
训练过程会进行5个完整的迭代,逐步逼近最优解。
最后,我们可以通过测试集来评估模型性能:
model.evaluate(x_test, y_test, verbose=2)
verbose=2:每隔2轮输出一轮的损失和准确率,减少冗余信息。通过以上步骤,我们已经成功训练并部署了一个能够识别手写数字的分类模型。
转载地址:http://lrbc.baihongyu.com/