Нет кода, нет проблем — мы пытаемся победить ИИ в его же игре с помощью новых инструментов.
За последний год технологии машинного обучения и искусственного интеллекта добились значительных успехов. Специализированные алгоритмы, в том числе DALL-E от OpenAI, продемонстрировали способность генерировать изображения на основе текстовых подсказок с возрастающей точностью. Системы обработки естественного языка (NLP) стали ближе к человеческому письму и тексту. А некоторые люди даже думают, что ИИ обрел разум. (Осторожно, спойлеры: Это не.)
А также как недавно отметил здесь Мэтт Форд из Ars, искусственный интеллект может быть искусственным, но это не «интеллект» — и уж точно не магия. То, что мы называем «ИИ», зависит от построения моделей на основе данных с использованием статистических подходов, разработанных людьми из плоти и крови, и может провалиться так же эффектно, как и преуспеть. Постройте модель на основе неверных данных, и вы получите неверные прогнозы и неверные результаты — просто спросите у разработчиков Тайский Twitter-бот от Microsoft об этом.
Для гораздо менее впечатляющего провала просто посмотрите наши последние страницы. Читатели, которые были с нами некоторое время или хотя бы с лета 2021 года, помнят то время. мы пытались использовать машинное обучение сделать некоторый анализ — и не совсем удалось. («Оказывается, «управление данными» — это не просто шутка или модное слово, — сказал Дэнни Смит, старший менеджер по продуктам Amazon Web Services, когда мы обратились к нему за советом. — «Управление данными» — это реальность для машин». обучения или проектов по науке о данных!») Но мы многому научились, и самый большой урок заключался в том, что машинное обучение достигает успеха только тогда, когда вы задаете правильные вопросы о правильных данных с помощью правильного инструмента.
Эти инструменты эволюционировали. Растущий класс инструментов машинного обучения «без кода» и «с низким кодом» делает ряд задач машинного обучения все более доступными, используя возможности аналитики машинного обучения, которые когда-то были единственным источником данных ученых и программистов, и делая их доступными. бизнес-аналитикам и другим конечным пользователям, не занимающимся программированием.
В то время как работа над DALL-E удивительна и окажет значительное влияние на создание мемов, дипфейков и других изображений, которые когда-то были прерогативой людей-художников (используя подсказки типа «[insert celebrity name] в стиле Эдварда Мунка Крик“), простая в использовании аналитика машинного обучения, включающая виды данных, которые предприятия и частные лица создают и с которыми работают каждый день, может быть столь же разрушительной (в самом нейтральном смысле этого слова).
Поставщики машинного обучения рекламируют свои продукты как «простую кнопку» для поиска взаимосвязей в данных, которые могут быть неочевидными, выявления корреляции между точками данных и общими результатами и указания людям решений, которые традиционный бизнес-анализ занял бы у людей дни, месяцы или лет, чтобы раскрыть с помощью традиционного статистического или количественного анализа.
Мы вознамерились выполнить Джон Генри в стиле тест: чтобы выяснить, могут ли некоторые из этих инструментов, не требующих кода, превзойти подход, основанный на коде, или, по крайней мере, предоставить результаты, которые были бы достаточно точными, чтобы принимать решения с меньшими затратами, чем оплачиваемые часы специалиста по данным. Но прежде чем мы смогли это сделать, нам нужны были правильные данные и правильный вопрос.