Изменения

R:Оптимизация/Импорт данных

549 байтов добавлено, 13:35, 5 апреля 2014
м
Функция read.table()
* отключить поиск комментариев с помощью аргумента <code>comment.char = ""</code>.
Создадим таблицу данных содержащую <math>10^{56}</math> строк и 6 столбцов:
{{r-code|code=<nowiki>> N <- 10^5L 6L # задаём количество наблюдений
> DF <- data.frame(a = sample(1:10^3L, N, replace = TRUE),
b = sample(1:10^3L, N, replace = TRUE),
Теперь мы можем сравнить производительность функции <code>read.table()</code> с параметрами по умолчанию и парамтерами, рекомендованными для увеличения производительности данной функции. Для этого нам понадобится пакет {{r-package|microbenchmark}}.
 
{{r-code|code=<nowiki>> microbenchmark(defaults = read.table(tmp.csv, sep = ";", header = TRUE),
+ ompimize = read.table(tmp.csv, sep = ";", header = TRUE,
+ colClasses = c("integer", "integer", "factor", "numeric", "numeric", "numeric"),
+ nrows = N, comment.char = "", quote=""))</nowiki>}}
 
Значения для аргумента <code>colClasses</code> мы получили ранее с помощью команды <code>sapply(DF, class)</code>.
[[Категория:R]]
[[Категория:Оптимизация кода]]