Игровой искусственный интеллект DeepMind только что побил 50-летний рекорд в компьютерных науках


«Это действительно потрясающий результат», — говорит Франсуа Ле Галль, математик из Университета Нагоя в Японии, который не участвовал в работе. «Матричное умножение используется повсеместно в технике», — говорит он. «Все, что вы хотите решить численно, вы обычно используете матрицы».

Несмотря на повсеместное распространение расчета, он до сих пор недостаточно изучен. Матрица — это просто сетка чисел, представляющая все, что вы хотите. Умножение двух матриц вместе обычно включает умножение строк одной на столбцы другой. Базовая техника решения задачи преподается в средней школе. «Это похоже на азбуку вычислений, — говорит Пушмит Кохли, руководитель группы искусственного интеллекта DeepMind для науки.

Но все усложняется, когда вы пытаетесь найти более быстрый метод. «Никто не знает лучшего алгоритма для ее решения», — говорит Ле Галл. «Это одна из самых больших открытых проблем в информатике».

Это связано с тем, что существует больше способов перемножения двух матриц, чем атомов во Вселенной (10 в степени 33 для некоторых случаев, которые рассматривали исследователи). «Количество возможных действий почти бесконечно», — говорит Томас Хьюберт, инженер DeepMind.

Хитрость заключалась в том, чтобы превратить задачу в своего рода трехмерную настольную игру под названием TensorGame. Доска представляет собой задачу на умножение, которую нужно решить, и каждый ход представляет собой следующий шаг в решении этой задачи. Таким образом, серия ходов, сделанных в игре, представляет собой алгоритм.

Исследователи обучили новую версию AlphaZero, названную AlphaTensor, играть в эту игру. Вместо того, чтобы изучать лучшие последовательности ходов в го или шахматах, AlphaTensor изучил наилучшие последовательности шагов при умножении матриц. Его награждали за победу в игре за минимальное количество ходов.

«Мы превратили это в игру, наш любимый вид фреймворка», — говорит Хьюберт, один из ведущих исследователей AlphaZero.