R:Оптимизация/Предварительное выделение памяти

Материал «R:Оптимизация/Предварительное выделение памяти», созданный автором Артём Клевцов, публикуется на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.

Вы можете свободно:

делиться произведением – копировать, распространять и передавать данное произведение.
создавать производные – переделывать данное произведение.

При соблюдении следующих условий:

указание авторства - Вы должны указывать авторство (источник) данного произведения в виде, установленном автором или лицензиаром (но ни в коем случае не таким образом, который наводит на мысль, что автор поддерживает вас или ваше использование данного произведения).

CC-BY-4.0 Creative Commons Attribution 4.0 true true

Перед использованием функций из пакетов их необходимо предварительно установить и загрузить:

КодR

<syntaxhighlight lang="r">> install.packages(pkgs = "pkgname") > library(package = "pkgname")</syntaxhighlight>

Частой задачей, решаемой с помощью циклов, является выполнение расчётов и занесение результатов в переменную. Таким образом, результирующая переменная будет заполняться данными по мере работы цикла. Предварительное выделение памяти (preallocate) позволяет ускорить работу циклов, работающих с постепенной заполняемыми данными. Суть данного метода заключается в том, чтобы заранее выделить место в оперативной памяти, в которую будут записываться данные во время работы цикла. Выделение памяти осуществляется путём указания типа и размера переменной. Если этого не сделать, то при каждой новой итерации необходимо выделять новое место в памяти и производить туда запись.

Обратите внимание, что переменные, участвующие в цикле, должны быть объявлены до того, как будут использоваться.

КодR

<syntaxhighlight lang="r">> noaaloc <- function(n) { + x <- NULL # объявляем пустую переменную + for (i in seq_len(n)) + x[i] <- i * i + x + } > > alloc <- function(n) { + x <- integer(n) # объявляем переменную нужного типа и размера + for (i in seq_len(n)) + x[i] <- i * i + x + } > microbenchmark(noaaloc(10^4), alloc(10^4)) Unit: milliseconds expr min lq median uq max neval noaaloc(10^4) 41.746 42.719 43.353 44.603 76.31 100 alloc(10^4) 5.524 5.896 6.019 6.777 27.35 100</syntaxhighlight>

Создание пустых объектов в R

Векторы

`integer(n)`	создаёт объект типа `integer` (число с фиксированной запятой) длинной `n`.
`numeric(n)`	создаёт объект типа `double` (число с плавающей запятой) длинной `n`^[1].
`double(n)`	создаёт объект типа `double` (число с плавающей запятой) длинной `n` (число двойной точности).
`single(n)`	создаёт объект типа `double` (число с плавающей запятой) длинной `n` (число одинарной точности).
`complex(n)`	создаёт объект типа `complex` (комплексный тип данных) длинной `n`.
`character(n)`	создаёт объект типа `character` (строковый тип данных) длинной `n`.
`logical(n)`	создаёт объект типа `logical` (логический тип данных) длинной `n`.

Создание любого типа вектора можно также осуществить с помощью функции vector(). Данная функция принимает два аргумента: mode, указывающая тип данных и length, указывающая длину вектора. Например, создание вектора целых чисел, длиной 100 можно создать с помощью следующих команд:

КодR

Списки

Списки можно создавать с помощью уже рассмотренной ранее функции vector():

КодR

Матрицы

Матрицы создаются с помощью соответствующей функции matrix(). Для создания матрицы необходимой размера, нам нужно указать количество строк и столбцов. Пример создания матрицы:

КодR

Поскольку матрица является также массивом, то матрицу можно также создать с помощью функции array(). Например:

КодR

Переменные, полученные с помощью функций matrix() и array() будут идентичными. Убедиться в этом можно с помощью функции identical():

КодR

<syntaxhighlight lang="r">> identical(matrix(NA, nrow = 100, ncol = 10), + array(NA, dim = c(100, 10))) [1] TRUE</syntaxhighlight>

Матрицы и массивы можно также получить путём преобразования векторов или списков. Для этого необходимо изменить атрибут объекта, в котом хранится информация о размерности объекта. Получиться информацию о размерности объекта можно с помощью функции dim(). Данная функция также позволяет изменять размерность объекта. Приведём примеры:

КодR

Теперь мы может преобразовать вектор в матрицы путём присвоения вектору нужной нам размерности:

КодR

Обратим внимание на то, что количество элементов в векторе и массиве должно быть одинаковым, в противном случае R выдаст ошибку. Результат данного преобразования будут также идентичен предыдущим примерам:

КодR

<syntaxhighlight lang="r">> m1 <- matrix(NA, nrow = 100, ncol = 10) > > m2 <- rep(NA, 1000) > dim(m2) <- c(100, 10) > identical(m1, m2) [1] TRUE</syntaxhighlight>

Таблицы данных

Таблицы данных (data.frame) могут могу быть созданы путём объединения векторов, содержащих требуемые типы данных (см. выше о создании векторов):

КодR

Примечания

↑ Эквивалент функции double()

[1] Эквивалент функции double()

[1]

R:Оптимизация/Предварительное выделение памяти

Создание пустых объектов в R

Векторы

Списки

Матрицы

Таблицы данных

Примечания

Psylab.info