DL2022: Борьба с переобучением в нейронных сетях (часть 1)
Курс “Глубокое обучение (Deep Learning)“
страница курса:
автор курса: Александр Дьяконов ()
В этой лекции...
Борьба с переобучением в нейронных сетях.
Нормировки (Normalization of Data).
Инициализация весов (Xavier initialization).
Верификация – ранний останов (Early Stopping).
Мини-батчи (mini-batches) / Batch-обучение.
Продвинутая оптимизация (стохастический градиент с моментом (momentum), метод Нестерова, Adagrad, RMSprop, Adam, AdaDelta).
Зашумление.
Регуляризация Weight Decay. Max-norm-регуляризация. Оптимизаторы.
Dropout. Inverted Dropout. DropConnect.
Обрезка градиентов (Gradient clipping).