Тактический инструктаж: правила, установленные Директором
ИИ может научиться вскрывать коды, но он не может сам выбрать режим своего обучения. До начала миссии Директор должен определить правила игры.
Сценарий
Представьте, что вы — Директор разведки. Вы только что поручили своему лучшему агенту (Модели) проникнуть на секретный объект. Агент опытен, но перед выходом ему нужен «Тактический инструктаж».
Этот документ не содержит самих секретных кодов — он содержит СТРАТЕГИЮ миссии. Вы решаете: «Сколько фрагментов улик анализировать за раз (Batch Size)», «Сколько раз повторить симуляцию миссии (Epochs)» и «Насколько смело следовать интуиции (Learning Rate)».
Эти решения — ГИПЕРПАРАМЕТРЫ. Это правила игры, установленные вами, Директором, еще до того, как начнется само «Обучение». Если вы прикажете агенту анализировать слишком много улик за раз, он может перегрузиться и упустить детали. Если вы заставите его провести на задании слишком много дней, он может начать искать скрытый смысл там, где его нет (Переобучение).
Реальность
В глубоком обучении Гиперпараметры — это настройки, которые управляют самим процессом обучения.
В отличие от «Параметров» (настроек на ручках, которые ИИ подбирает сам), Гиперпараметры задаются человеком. Самый критичный из них — Скорость обучения (Learning Rate). Это как размер шагов нашего шпиона на темном горном склоне. Слишком большие шаги — и он может перепрыгнуть секретную базу. Слишком маленькие — и у него закончится кислород прежде, чем он доберется до долины.
Почему это важно
Поиск правильных гиперпараметров часто оказывается самой сложной частью создания ИИ. Это называется «Тюнинг гиперпараметров». По сути, это Директор, который пробует разные варианты инструктажа, чтобы увидеть, какой из них сделает агента максимально успешным. Небольшое изменение «Скорости обучения» или «Размера батча» может стать разницей между моделью, которая решит проблему мирового голода, и моделью, которая будет считать каждое фото котом.
Главное
Гиперпараметры — это правила, которые Директор устанавливает до миссии; Параметры — это секреты, которые Агент находит во время миссии.
Специалисты называют это: Hyperparameters (Гиперпараметры / Скорость обучения, Размер батча, Эпохи) Гиперпараметры — это настройки конфигурации, используемые для управления поведением алгоритма машинного обучения. Они задаются разработчиком вручную перед началом обучения и не выводятся из данных.
💬 Если бы вы были Директором, кого бы вы выбрали: агента, который делает «Смелые прыжки», или того, кто идет «Крошечными, осторожными шагами»?
Часть 8 (Гиперпараметры) из 25 | #DeepLearningДляЛюдей