Популярные вопросы по тегу DPLYR
В R dplyr, почему мне нужно разгруппировать() после того, как я count()?
... library(tidyverse) mtcars %>% count(cyl) Как только 10 я начал использовать функции apply, у меня начались 9 проблемы с count(). Если бы я просто добавил ungroup() в 8 конец моего count(), проблемы исчезли бы. Мне нечего 7 показать. Но может ли кто-нибудь о ...
lubridate: как разобрать месяц-год?
... яц соответствует определенному месяцу 7 в году. Октябрь 2015 г., ноябрь 2015 г. и 6 декабрь 2015 г. Я не могу правильно проанализировать 5 эти даты с помощью lubridate. Предполагается, что 4 месяц соответствует последнему рабочему 3 дню месяца. Как я могу перевести эту переменную 2 в переменную date, которую понимает lubridate? ...
Мутировать с помощью функции столбца списка в dplyr
... (вектор строк). Используя функцию 10 mutate dplyr, создайте names_vec, столбец 9 списка, где каждая строка теперь является 8 вектором (каждый элемент вектора представляет 7 собой букву). Затем создайте новый тиббл 6 со столбцом jaccard_sim, который должен 5 вычислять подобие Жаккара. source_vec <- c('a', 'b', 'c') df_comp <- tibble(names_ = c("b d f", "u k g", " ...
Образцы строк подгрупп из фрейма данных с dplyr
... leGroup(df,10)) Здесь отобрано 8 по 10 образцов от каждого вида. Некоторые 7 из моих фреймов данных очень большие, и 6 мой вопрос: могу ли я использовать ту же 5 функцию sampleGroup с пакетом dplyr? Или 4 есть другой способ сделать то же самое в 3 dplyr? ИЗМЕНИТЬ Версия 0.2 п ...
Назначьте промежуточный вывод временной переменной как часть конвейера dplyr
... начается в глобальный фрейм, что нежелательно. Должен 4 быть способ получше, правда? Я полагал, что 3 мой подход с использованием закомментированной 2 строки даст желаемые результаты. Никаких 1 кубиков. Не понимаю, почему это не сработало. df <- data.frame(a = LETTERS[1:3], b=1:3) df %>% filter(b &l ...
Добавить суффикс к выбранной группе имен столбцов в наборе данных
... [41] "SCARED_FUTURE" [42] "SCARED_THROW_UP" [43] "SCARED_HOW_WELL_I_DO" [44] "SCARED_GO_TO_SCHOOL" [45] "SCARED_PAST" [46] "SCARED_DIZZY" [47] "SCARED_OTHERS_WATCH_ME ...
dplyr :: mutate для добавления нескольких значений
... циальный ответ (tidyr::separate), который (я думаю) не работает для меня. This issue («суммировать или изменять с помощью функций, возвращающих несколько значений / столбцов») говорит «используйте do()». Вот мой 5 пример использования: я хочу вычислить точные 4 биномиальные доверительные интервалы dd <- data.frame(x=c(3,4),n=c(10,11)) get_binCI <- function(x,n) { rbind(setNames(c(binom.test(x,n)$conf ...
Создать новый столбец с dplyr mutate и подстрокой существующего столбца
... id. Запись столбца id всегда содержит 8 2 символа подчеркивания, и это всегда последняя 7 подстрока, которую я хотел бы. df = data.frame( id = I(c("abcd_123_ABC","abc_5234_NHYK")), x = c(1.0,2.0) ) require(dplyr) df = df %>% dplyr::mutate(new_id = strsplit(id, split="_")[[1]][3]) Я ожидал, что 6 strsplit будет действовать по очереди с 5 каждой строкой. Однако столбец new_id содержит 4 только ABC в каждой строке, тогда как я ...
dplyr :: select - Включая все остальные столбцы в конце нового фрейма данных (или в начале, или в середине)
... но, есть ли способ 6 лучше? Лучше в смысле большей гибкости. Например, одна 5 проблема: есть ли способ включить «все остальные» столбцы 4 в начало или середину нового data.frame? (Обратите 3 внимание, что select(flights, matches("."), year, month, day, ) не дает желаемого результата, поскольку 2 matches(".") прикрепил все столбцы, а year, month, day игнорируются, поскольку 1 они повторяют имена существующих столбцов ...
R - dplyr суммировать и сохранить другие столбцы
... го в оператор group_by, но это не кажется 2 «правильным». Я хочу сохранить State.Full.Name после группировки 1 по State. Спасибо TDAAtest <- data.frame(State=sample(state.abb,1000,replace=TRUE)) TDAAtest$State.Full.Name <- state.name[match(TDAAtest$State,state.abb)] TDAA.states <- TDAAtest %>% filter(!is.na(State)) %>% ...
write.csv() в цепочке dplyr
... блемой раньше, но 3 просто написал функцию экспорта вне цепочки. Есть 2 ли способ включить инструкцию write.csv в цепочку 1 dplyr? library(dplyr) data_set %>% filter(Date == Sys ...
Переименовать, только если поле существует, в противном случае игнорировать
... at don't exist. x Column `uyhgfrtgf` doesn't exist Я посмотрел 5 на ?rename_if, и там говорится, что теперь он заменен 4 на rename_with(). Какой «правильный» способ попытаться 3 переименовать поля, но с возможностью их 2 отсутствия (например, в данном случае ShinyApp 1 с селекторами филь ...
R: Как отфильтровать / подобрать последовательность дат
... декабрь) date sessions 1 2014-12-01 1932 2 2014-12-02 1828 3 2014-12-03 2349 4 2014-12-04 8192 5 2014-12-05 3188 6 2014-12-06 3277 И 8 необходимость подмножества / фильтр ...
Объединение всех строк в группе с помощью dplyr
... строку для каждого уровня 4 рук A, B, C. Таким образом, результат будет 3 выглядеть примерно так: hand_id combo_1 combo_2 combo_3 A 1-2-3 p-q-r alpha-beta-theta B 2-3-4 q-r-s beta-theta-gamma .... Я попытался сделать 2 это с помощью group_by и mutate, но не могу 1 заставить его работать data <- read_csv('data.csv') b ...
mutate() в (d) plyr не создает новый столбец при получении
... dplyr с R (такая же проблема 5 касается и plyr). Когда я вызываю source("dply_problem.R") к следующему 4 коду library("dplyr") df <- data.frame("A" = 1:6, "B" = 7:12) mutate(df, C = A + B) ...
Разница между pull и select в dplyr?
... ица кроме того, что dplyr::pull() выбирает только ...
dplyr summarize: эквивалент ".drop = FALSE" для сохранения групп с нулевой длиной на выходе
... = data.frame(a=rep(1:3,4), b=rep(1:2,6)) # Now add an extra level to df$b that has no corresponding value in df$a df$b = factor(df$b, levels=1:3) # Summarise with plyr, keeping categories with a count of zero plyr::ddply(df, "b", summarise, count_a=length(a), .drop=FALSE) b count_a 1 1 6 2 2 6 3 3 0 # Now try it with dplyr df %.% group_by(b) %.% summarise(count_a=length(a), .drop=FALSE ...
Как использовать Dplyr Summarize и which() для поиска минимальных / максимальных значений
... D", "D", "D", "D", "D") data <- data.frame(Name, Age, Group) И я хотел бы 13 использовать dplyr для (1) группируйте данные 12 по «Группе» (2) показать минимальный и максимальный 11 возраст в каждой группе (3) показать имя 10 человека с минимальным и максимальным возрастом Это 9 делает следующий код: data %>% group_by(Group) %>% summarize(minAge = min(Age), minAgeName = Name[which(Age == min(Age))], ...
Изменение уровня факторов с помощью dplyr mutate
... и фактора во фрейме данных, используя 3 mutate. Простой пример: library("dplyr") dat <- data.frame(x = factor("A"), y = 1) mutate(dat ...
dplyr summarize() с несколькими возвращаемыми значениями из одной функции
... соб использовать 4 функции с summarise (dplyr 0.1.2), которые возвращают несколько 3 значений (например, функция describe из пакета psych) ...
Использование replace_na с поперек в mutate
... ениях tbf <- tibble( ab = c(1,3,NA), ac = c(23,NA,33), d = c(22,22,NA), ads = c('ds', NA, "dwe")) tbf %>% mutate(across(starts_with('a') & where(is.numeric)), ~replace_na(999)) похоже не работает. Я тоже 2 попробовал ~replace_na(.x,999). Эт ...
Условно посчитать в dplyr
... rame(MemID=c('A','A','B','B','B','C','C','D'), week = c(1,2,1,4,5,1,4,1), value = c(10,20,10,10,2,5,30,3)) Я использую dplyr для 10 group_by MemID и суммирую "значение" для week<=2 и week<=4 (чтобы 9 узнать, сколько каждый участник заказал 8 за 1-2 и 1-4 недели. В настоящее время у 7 меня есть следующий код: : Member ...
dplyr: inner_join с частичным совпадением строки
... м string в x. Этот пример должен иллюстрировать: # What I have x <- data.frame(idX=1:3, string=c("Motorcycle", "TractorTrailer", "Sailboat")) y <- data_frame(idY=letters[1:3], seed=c("ractor", "otorcy", "irplan")) x idX string 1 1 Motorcycle 2 2 TractorTrailer 3 3 Sailboat y Source: local data frame [3 x 2] idY seed (chr) (chr) 1 a rac ...
dplyr, lubridate: как агрегировать фрейм данных по неделям?
... ер, с 9 пятницы по пятницу). Затем я просто хотел 8 бы подсчитать среднее значение values для каждой 7 недели. Например, в приведенном выше примере 6 можно вычислить среднее значение values с понедельника 5 24 февраля по воскресенье 2 марта и т. д. Как 4 я могу это сделать? Спасибо! РЕДАКТИРОВАТЬ: спасибо 3 всем, кто внес идею. Несколько необычно, я 2 думаю, что мо ...
Ошибка R "Не могу присоединиться ... из-за несовместимых типов"
... фрейма данных с объединенными 13 столбцами несовпадающих типов, что вызывает 12 эту ошибку. «Не могу присоединиться ... из-за 11 несовместимых типов» Ожидается, что производственный 10 код будет обрабатывать входные CSV-файлы, состоящие 9 из 150+ столбцов по 0-1000 строк, с 12-20 8 столбцами соединения. Я использую read.table 7 для скорости, и поскольку содержимое 150 ...
Изменение типов столбцов с помощью dplyr
... ые из моего raw_data_tbl, и 1 используя измененные типы из raw_data_tbl_int library(dplyr) raw_data_tbl %>% select_if(is.numeric) %>% select(-c(contains("units"), PRO_ALLOW, RTL_ACTUAL, REAL_PRICE, REAL_PRICE_HHU, REBATE, RETURN_UNITS, UNITS_PER_CASE, Profit, STR_COST, DCC, CR ...
Преобразование столбца в data.frame на дату
... 2, format = "%d.%m.%Y") Ошибка в as.Date.default 11 (., b2, format = "% d.% m.% Y"): не 10 знаю, как преобразовать '.' на занятие «Дата» Ну, попробовал 9 без трубы: df$b2 <- as.Date(df$b2, format = "%d.%m.%Y") Ошибка в df $ b2: объект типа 8 "закрытие" не является подмножеством Во-первых: почему 7 я получаю два разных сообщения об ошибках, если 6 я (насколько я понимаю) делаю то же са ...
Не удалось найти функцию "% <>%" с загруженным dplyr
... Обновление: воспроизводимый 2 пример ниже. Это определенно кажется ошибкой. С 1 полностью свежей системой: Data <- data.frame( Name_Bad = sample(1:10), Name_Guud = sample(1:10) ) colnames(Data) %<>% stringr::str_remove_all("_Bad") %>% stringr::str_replace_all("Guud", "Good") # Error: could not find function "%>%" install.packages("dplyr") library(dplyr) install.packages("stringr") library(str ...
Количество значащих цифр в dplyr summarize
... ростой 3 пример: test2 <- data.frame(c("a","a","b","b"), c(245,246,247,248)) library(dplyr) colnames(test2) <- c("V1","V2") group_by(test2,V1) %>% summarise(mean(V2)) Фрейм данных: V1 V2 1 a 245 2 a 246 3 b 247 4 b 248 Результат: V1 `mean(V2)` <fctr> <dbl> ...
r - фильтровать строки, содержащие строку из вектора
... трок, и фильтрует его 8 при совпадении (включая частичное совпадение 7 текста). Например, возьмите следующий фрейм 6 данных: animal |count aardvark |8 cat |2 catfish |6 dog |12 dolphin |3 penguin |38 prairie dog|59 zebra |17 и следующий вектор c("cat", "dog") Я хотел бы просмотреть 5 столбец "животное", проверяя, полностью 4 или частично соответствует значение одно ...
Применение group_by и суммирование данных с сохранением информации обо всех столбцах
... ;c","d","d","d"), c=c(1.2, 2.2, 2.4, 1.7, 2.7, 3.1, 3.2, 4.2, 3.3, 2.2), d= c("small", "med", "larg", "larg", "larg", "med", "small", "small", "small", "med")) d<- data %>% group_by(b) %>% summarise(min_values= min(c)) d b min_values 1 a 1.2 2 b 1.7 3 ...
Запуск пользовательской функции для фрейма данных в R по группам
... , например: tm w 1 result of calc 2 result of calc 3 result of calc До сих пор я пытался использовать 4 aggregate со своей функцией, но получаю следующую 3 ошибку: aggregate(df, by = list(tm), FUN = calc) Error in data$d : $ operator is invalid for atomic vectors Мне кажется, я слишком долго смотрел 2 на это, и на это есть очевидный ответ. Будем 1 признательны ...
Как я могу изменить имя фрейма данных
... ультаты во фрейме данных с соответствующим 14 названием, например, на основе добавления 13 «city_code» к общей заглушке. city_results <- paste("city_stats", city_code, sep = "") Моя проблема 12 в том, что я не могу понять, как переименовать 11 полученный фрейм данных в значение city_results. Там 10 много информации о том, как переименовать 9 столбцы фрейма данных, но не о том, как 8 переименова ...
Получение лучших значений по группам
... 461516 1 ## 1.29 0.8317092 1 ## 2.31 0.9751049 2 ## 2.34 0.9269764 2 ## 2.57 0.8964114 2 ## 2.58 0.8896466 2 ## 2.45 0.8888834 2 ## 2.35 0.8706823 2 ## 3.74 0.9884852 3 ## 3.73 0.9837653 3 ## 3.83 0.9375398 3 ## 3.64 0.9229036 3 ## 3.69 0.8021373 3 ## 3.86 0.7418946 3 Используя dplyr, я 3 ожидал, что это сработает: d ...
Нормализовать по группе
... -то 4 вроде этого: ID Item StrengthCode Nor 7 A 1 0.14 7 A 5 0.71 7 A 7 1 8 B 1 0.34 8 B 3 1 9 A 5 0.71 9 A 3 0.42 Я пробовал этот код, но застрял 3 .... Если вы можете мне помочь, было бы 2 здорово !!! normalit <- function(m){(m - min(m))/(max(m)-min(m))} Tbl.Test <- Tbl.3.1 %>% group_by(ID, Item) %>% ...
Как перестать использовать построчное использование в dplyr?
... рацию 8 построчно в dplyr, можно использовать функцию 7 rowwise, например: Applying a function to every row of a table using dplyr? Есть ли функция unrowwise, которую можно 6 использовать для прекращения ...
Использовать фильтр в dplyr условно для оператора if в R
... lastname == that_name) %>% mutate(totalrows = nrow(.)) %>% group_by(x1, y1) %>% summarize(dosomestuff) } Я 15 создаю функцию в R, которая выполняет некоторые 14 манипуляции с данными в фрейме данных mydf. Если 13 я передаю значение параметру team_name функции, то 12 я хотел бы отфильтровать фрейм данных, используя 11 столбец «команда». Если я не передам значение параметр 10 team_name, то по умолчанию ...
Почему мой dplyr group_by & summarize не работает должным образом? (имя-коллизия с плыром)
... 25 3 0 1 NA 2 30 4 0 0 150 6 65 Ответ и так далее. Я хочу 8 подытожить некоторые статистические данные 7 по AUC, Tmax и Cmax по препарату DRUG и СТАТУСУ 6 ФЕДЕРАЛЬНОГО СОБЫТИЯ FED. Пользуюсь dplyr. Например: для 5 AUC: CI90lo <- function(x) quantile(x, probs=0.05, na.rm=TRUE) CI90hi <- function(x) quantile(x, probs=0.95, na.rm=TRUE) summary <- df %>% group_by(DRUG,FE ...
Передайте имена столбцов в виде строк в group_by и суммируйте
... by_, устарели, поскольку 7 предполагается, что мы будем использовать 6 кавычки. См.: https://cran.r-project.org/web/packages/dplyr/vignettes/programming.html Я пытаюсь реализовать следующий 5 пример, используя quo и !! Рабочий пример: df <- data.fram ...
Создать новый столбец, который представляет собой сумму определенных столбцов (выбранных по их именам) в dplyr
... , который представляет собой 9 сумму Petal.Length и Petal.Width. iris %>% mutate(Petal = Petal.Length+Petal.Width) А теперь 8 представьте, что у меня есть набор данных 7 из 20 столбцов, в именах которых есть «Лепесток». Я 6 хочу создать столбец «Лепесток», в котором 5 будут суммированы все эти столбцы. Я определенно 4 не хочу вводить все имена столбцов в свой 3 код. Кажется, что это должно быть достижи ...
Эквивалент COUNTIF в dplyr summarize
... 10 NA 4 104 210 20 5 105 180 NA 6 106 150 NA Я хотел бы знать 5 количество групп в диапазонах размеров (> 400,> 200,> 100,> 0), которые 4 либо участвуют в деятельности (Sub> 0), либо 3 нет (Sub is.na) output <- structure(list(ID = c(101L, 102L, 103L, 104L, 105L, 106L) ...
Скользящее среднее (скользящее среднее) по группе / идентификатору с dplyr
... 160 NA 7 40 2007 120 NA ") Я хочу 6 вычислить новую переменную под названием 5 BLOOD_PRESSURE_UPDATED. Эта переменная должна 4 быть скользящей средней для BLOOD_PRESSURE 3 и иметь следующие характеристики: Скользящее среднее - это текущее значение плюс предыдущее значение, разделенное на два. Для первого наблюдения BLOOD_PRESSURE_UPDATED - это просто текущее BLOOD_PRESSURE. Если это отсутствует, BLOOD ...
Использование изменения с датами дает числовые значения
... нных. У меня есть две переменные date1 и date2. Я 7 хочу создать новую переменную date, чтобы она 6 принимала значение date1. Если date1 отсутствует, вместо 5 него берется значение date2. df <- data.frame(date1 = c("24/01/2016",NA,"22/07/2016"), date2 = c("31/01/2016","09/02/2017",NA), stringsAsFactors=FALSE)` Приведенная выше 4 команда дает: date1 date ...
Dplyr изменяет новый столбец в указанном месте
... a = c(10,20,30) b = c(1,2,3) c = c(4,5,6) d = c(7,8,9) df=data.frame(a,b,c,d) library(dplyr) df_1 = ...
dplyr `case_when()` проблема с NA
... tibble: 6 x 3 #> ID Date col3 #> <chr> <date> <chr> #> 1 ABC 2019-01-03 fizz #> 2 EFG 2019-01-08 buzz #> 3 HIJ 2019-06-09 NA #> 4 KLM 2019-06-11 NA #> 5 NOP ...
Подсчитайте, сколько значений в некоторых ячейках строки не являются NA (в R)
... фективно) вызвать 12 эти столбцы. Использование функции mutate, как 11 в приведенном ниже поддельном примере, дает 10 мне правильный ответ. library(stringr) df <- data_frame( id = 1:10 , name = fruit[1:10] , word1 = c(words[1:5],NA,words[7:10]) , word2 = words[11:20] , word3 = c(NA,NA,NA,words[25],NA,NA,words[32],NA,NA,words[65]) ) %>% mutate( n_words ...
Как обновить значения в трубе dplyr?
... , "children", "girl", "boy", "grand father", "grand mother", "grandparents" ) dataset0 <- data.frame(people) dataset0 И вывод: father parents father children girl boy grand father grand mother grandparents Ожидаемый рез ...
Суммирование по нескольким столбцам с помощью dplyr
... алоге 11 функции summarise_each или mutate_each для dplyr. Ниже приведен минимальный 10 пример фрейма данных: library(dplyr) df=data.frame( x1=c(1,0,0,NA,0,1,1,NA,0,1), x2=c(1,1,NA,1,1,0,NA,NA,0,1), x3=c(0,1,0,1,1,0,NA,NA,0,1), x4=c(1,0,NA,1,0,0,NA,0,0,1), x5=c(1,1,NA,1,1,1,NA,1,0,1)) > df x1 x2 x3 x4 x5 1 1 1 0 1 1 2 0 1 1 0 1 3 ...
rollmean с dplyr и magrittr
... ы, определенной столбцом o. Порядок 8 прокатки устанавливается t. Скользящее среднее 7 следует добавить как новый столбец в data.frame. Я 6 хочу использовать magrittr и dplyr. Я пробовал data %>% group_by(o) %>% sort(t) %>% select(u) %>% rollmean(3) %>% rbind Но 5 это не сработает. Можно ли это сделать с 4 пом ...
str_extract_all: вернуть все шаблоны, найденные в строке, объединенные как вектор
... data <- tibble(age = x) # extracting just the first pattern is easy data %>% mutate(age_new = str_extract(age,"[^a_]")) # combining str_extract_all and sapply doesnt work data %>% mutate(age_new = sapply(st ...