欠拟合
- 数据过于复杂,但是神经网络模型过于简单
- 无论训练多久,训练损失始终降不下去
过拟合
- 模型过于复杂,把训练集噪声数据都拟合进去
- 过拟合损失曲线,红色代表验证集,蓝色代表训练集
实操模拟 欠拟合&过拟合
- 加载带有噪音的二分类数据集(训练集与验证集)
- 使用不同神经网络演示 过拟合&欠拟合
- 过拟合应对法:早停法、权重衰减、丢弃法
加载带有噪音的二分类数据集(训练集与验证集)
脚本原理
生成正态分布(高斯分布)的样本数据1
2
3
4
5
6
7
8
9
10
11function normalRandom(mean = 0, variance = 1) {
let v1, v2, s;
do {
v1 = 2 * Math.random() - 1;
v2 = 2 * Math.random() - 1;
s = v1 * v1 + v2 * v2;
} while (s > 1);
let result = Math.sqrt(-2 * Math.log(s) / s) * v1;
return mean + Math.sqrt(variance) * result;
}
正态分布两边低的数据看作噪音数据,中间高的数据视为正常数据
通过调整方差 调整噪音量
用脚本生成带有噪音的二分类数据集
1 | import * as tf from '@tensorflow/tfjs'; |
可视化数据集
1 |
|
使用不同神经网络演示 过拟合
1 | const data = getData(200, 2); |
过拟合应对法:早停法
在训练出现过拟合时及时手动停止训练
过拟合应对法:权重衰减法(设置L2正则化
将过于复杂的模型权重降低1
2
3
4
5
6model.add(tf.layers.dense({
units: 10,
inputShape: [2], //长度为2的一维数组
activation: "tanh",
kernelRegularizer: tf.regularizers.l2({ l2: 1 }) //设置权重衰减
}));
过拟合应对法:丢弃法
在隐藏层和输出层之间添加一个丢弃层1
2//添加丢弃层,降低训练集复杂度
model.add(tf.layers.dropout({ rate: 0.9 }));