Постановка задачи: не стройте варп-двигатель для похода за хлебом
Наш главный инженер только что потратил шесть месяцев и четыре миллиона кредитов на создание Квантово-Тахионного Варп-двигателя. Он искривляет пространство и время, выглядит невероятно круто и требует для работы энергию небольшой звезды.
В чем проблема? Клиент просто хотел, чтобы дрон доставил пиццу на соседнюю лунную базу. Мы построили гипердвигатель для похода за продуктами.
Сценарий
В разработке ИИ это происходит каждый день. Фаундеры слышат об очередной «Генеративной мультимодальной нейросети» и сразу же пытаются запихнуть её в свой продукт. Они начинают строить модель еще до того, как узнают, что за груз нужно доставить.
В жизненном цикле глубокого обучения (Deep Learning), прежде чем собрать хотя бы байт данных или написать строчку кода, вы должны СФОРМУЛИРОВАТЬ ЗАДАЧУ.
Реальность
ИИ — это инструмент, а не стратегия. Вы должны определить, что именно должна делать машина, простым и скучным языком.
- Нам нужно, чтобы корабль классифицировал груз? (Этот ящик токсичен или безопасен?)
- Нам нужно, чтобы корабль предсказывал время прибытия? (Регрессионный анализ.)
- Нам нужно, чтобы корабль генерировал новый маршрут? (Генеративный ИИ.)
Если задача — «отделить красные ящики от синих», вам не нужна нейросеть на несколько миллиардов параметров. Возможно, вам хватит простенького алгоритма (или датчика цвета).
Почему это важно
Четкая постановка задачи определяет, какие именно данные вам нужно собирать. Если вы не знаете пункт назначения, вы не можете проложить маршрут (карту). Если вы начнете собирать данные и строить модели без точной формулировки проблемы, в итоге вы получите гениальный ИИ, который решает проблему, которой ни у кого на самом деле нет.
Главное
Влюбляйтесь в маршрут доставки, а не в космический корабль. Никогда не стройте сложную ИИ-модель, если с задачей справится простое условие «если/то».
Специалисты называют это: Problem Formulation (Постановка задачи) Постановка задачи — это процесс перевода высокоуровневой бизнес-цели в конкретную, измеримую и решаемую задачу машинного обучения (например, классификацию, регрессию, кластеризацию).
💬 Видели ли вы когда-нибудь команду, которая месяцами пилила «квантовый ИИ» там, где идеально сработал бы простой запрос к базе данных?
Часть 4 (Постановка задачи) из 20 | #DLLifecycleДляЛюдей #ai_edu Based on CS230 Stanford lectures