Re: [問題] 一筆資料轉多筆

作者: celestialgod (天)   2016-12-01 19:37:17
※ 引述《criky (立業成家)》之銘言:
: [問題類型]:
:
: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
: [軟體熟悉度]:
: 新手(沒寫過程式,R 是我的第一次)
: [問題敘述]:
: 若我有資料欄位如下:
:
: id start_y start_s end_y end_s
: 1 100 1 102 2
: 2 101 2 103 1
: 3 101 2 101 2
: year:
: 如何轉成下面的樣子:
: id year s
: 1 100 1
: 1 100 2
: 1 101 1
: 1 101 2
: 1 102 1
: 1 102 2
: 2 101 2
: 2 102 1
: 2 102 2
: 2 103 1
: 3 101 2 (只有一筆)
: 謝謝回答~
: [程式範例]:
:
:
: [環境敘述]:
:
: 請提供 sessionInfo() 的輸出結果,
: 裡面含有所有你使用的作業系統、R 的版本和套件版本資訊,
: 讓版友更容易找出錯誤
:
: [關鍵字]:
:
: 選擇性,也許未來有用
:
做兩次melt就可以達到你要的了,我不確定是否可以一次,看是否有高手寫得出來~~
library(data.table)
DT <- fread("id start_y start_s end_y end_s
1 100 1 102 2
2 101 2 103 1
3 101 2 101 2")
DT_melt <- melt.data.table(DT, id = c(1,2,4), value.name = "s")
DT_melt2 <- melt.data.table(DT_melt, id = c(1,5), measure = 2:3,
value.name = "year")
DT_melt2[ , variable := NULL]
setcolorder(DT_melt2, c("id", "year", "s"))
setorderv(DT_melt2, names(DT_melt2))
unique(DT_melt2, by = names(DT_melt2))
# id year s
# 1: 1 100 1
# 2: 1 100 2
# 3: 1 102 1
# 4: 1 102 2
# 5: 2 101 1
# 6: 2 101 2
# 7: 2 103 1
# 8: 2 103 2
# 9: 3 101 2
# with pipeR
library(pipeR)
resDT <- melt.data.table(DT, id = c(1,2,4), value.name = "s") %>>%
melt.data.table(id = c(1,5), measure = 2:3, value.name = "year") %>>%
`[`(j = variable := NULL) %>>% setcolorder(c("id", "year", "s")) %>>%
setorderv(names(.)) %>>% unique(by = names(.))
print(resDT)
# id year s
# 1: 1 100 1
# 2: 1 100 2
# 3: 1 102 1
# 4: 1 102 2
# 5: 2 101 1
# 6: 2 101 2
# 7: 2 103 1
# 8: 2 103 2
# 9: 3 101 2
# tidyr + dplyr解法 (data.table不需要,DT可以是data.frame)
library(dplyr)
library(tidyr)
gather(DT, value, year, -id, -start_s, -end_s) %>>%
gather(ss, s, -id, -value, -year) %>>% select(id, year, s) %>>%
arrange(id, year, s) %>>% distinct(id, year, s)
# id year s
# 1 1 100 1
# 2 1 100 2
# 3 1 102 1
# 4 1 102 2
# 5 2 101 1
# 6 2 101 2
# 7 2 103 1
# 8 2 103 2
# 9 3 101 2
作者: cywhale (cywhale)   2016-12-01 21:57:00
#1N_NLOIo data.table::foverlaps可做但程式可能不會較少ya..so.. and maybe melt is faster ^_^
作者: criky (2501-2)   2016-12-01 22:42:00
感謝板主用多種方法解答,不過id=1和2都缺了中間幾筆資料start_y到end_y中間的資料,id=1是101,id=2是102pipe R那篇的文章連結變404了 想學一下 >> 的用法 QQid=1少了y=101,s=1,2 這2筆,id=2少了y=102,s=1,2這2筆然後id=2多了y=101,s=1 , y=103,s=2 這2筆文章可以進去了 謝謝!y=學年 s=1#上學期 s=2#下學期

Links booklink

Contact Us: admin [ a t ] ucptt.com