Если звучит слишком абстрактно, классический пример поможет понять: если взять математическое представление слова «король», вычесть из него представление слова «мужчина» и добавить представление слова «женщина», мы окажемся в многомерной области, соответствующей слову «королева». С практической точки зрения, хранение информации в виде математических представлений в латентном пространстве позволяет быстрее и с меньшими вычислительными затратами измерять расстояния между ними и оценивать вероятность того, что должно быть сгенерировано. Вот короткое видео, которое объясняет латентное пространство на другой аналогии: Хотя приведённые примеры касаются хранения текста, ту же идею можно применить ко многим другим типам данных. И здесь мы переходим к исследованию Apple. В новой работе Apple под названием «LiTo: токенизация поверхностного светового поля» исследователи «предлагают 3D-латентное представление, которое совместно моделирует геометрию объекта и зависящий от ракурса внешний вид». Другими словами, они разработали способ представления в латентном пространстве не только того, как воссоздать трёхмерный объект, но и того, как должно выглядеть взаимодействие света с его поверхностью при разных углах обзора. Как они сами объясняют.