Последние темы автора:
- [Касталия] Григорий Зайцев ― И-Цзин. Лекция 1 (2025)
- [Эван-Мультипликатор] Канал Друзья по переписке (15.09.2025 - 14.10.2025)
- [Катерина Суратова] [Психоаналитический киноклуб] Разбор фильма Материалистка (2025)
- [ВШКА] Длительное обучение астрологии 2023-2026 (7 ступень)
- [Алена Ковальчук] Помощь в восстановлении эндокринной и гормональной системы (2025)
- #1
Голосов: 0
[maven] Как оценивать ИИ-системы: курс для инженеров и PM-ов
Научитесь проверенным методикам быстрого улучшения AI-приложений. Стройте системы искусственного интеллекта, которые работают лучше конкурентов - вне зависимости от конкретного сценария использования.
Если при работе с AI у вас возникают вопросы вроде:
Это практический курс для инженеров и технических продакт-менеджеров. Идеален для тех, кто умеет программировать или «любит кодинг на ощущениях».
Чего ожидать
Вас ждёт интенсивная практика: упражнения, работа с кодом и данными. Мы встречаемся дважды в неделю в течение четырёх недель + выделяем щедрые office hours. Все занятия записываются и будут доступны в асинхронном формате.
Описание курса:
Научитесь проверенным методикам быстрого улучшения AI-приложений. Стройте системы искусственного интеллекта, которые работают лучше конкурентов - вне зависимости от конкретного сценария использования.
Если при работе с AI у вас возникают вопросы вроде:
- Как тестировать приложения, где результаты вероятностные и требуют субъективной оценки?
- Если я меняю промпт, как убедиться, что ничего другого не сломал?
- На что направить инженерные усилия? Нужно ли тестировать всё?
- Что делать, если нет данных или пользователей - с чего начать?
- Какие метрики отслеживать? Какие инструменты использовать? Какие модели выбрать?
- Можно ли автоматизировать тестирование и оценку? И если да - как этому доверять?
Это практический курс для инженеров и технических продакт-менеджеров. Идеален для тех, кто умеет программировать или «любит кодинг на ощущениях».
Чего ожидать
Вас ждёт интенсивная практика: упражнения, работа с кодом и данными. Мы встречаемся дважды в неделю в течение четырёх недель + выделяем щедрые office hours. Все занятия записываются и будут доступны в асинхронном формате.
Содержание курса
- Основы и жизненный цикл оценки LLM-приложений
- Систематический анализ ошибок
- Построение эффективных метрик и пайплайнов автоматизированной оценки
- Коллаборативные практики и согласование критериев оценки
- Стратегии тестирования для разных архитектур (RAG, пайплайны, мультимодальные системы и др.)
- Мониторинг в продакшене и непрерывная оценка качества
- Организация эффективного процесса human-in-the-loop ревью
- Оптимизация затрат и маршрутизация запросов
- Освоите лучшие инструменты для поиска, диагностики и приоритизации ошибок в AI.
- Узнаете, как использовать синтетические данные до появления пользователей и как максимально эффективно задействовать реальные данные.
- Построите «data flywheel», который гарантирует улучшение вашего AI со временем.
- Научитесь автоматизировать часть процессов оценки и доверять им.
- Сможете настроить AI под ваши предпочтения и требования.
- Избежите распространённых ошибок, накопленных на опыте более 35 AI-проектов.
- Получите практику через end-to-end упражнения, код и разбор реальных кейсов.
