Через текстуру 256x4, например и кодировать матрицы в цвета. Тогда все матрицы передавались бы одним сэмплером. Но во-первых, не факт что данные не смазывались бы драйвером, во-вторых выборка из текстуры тоже затратная операция, не уверен, что был бы приемлемый по скорости результат, в третьих...