[問題] dataframe運作embed及修正timedelay首欄

作者: paranoia5201 (邁向研究生)   2019-03-26 11:09:46
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
【原始資料型態】
> tao_b %>%
+ select(鄉鎮市區, 交易標的, 建物型態, 交易日期, 單價元平方公尺) %>%
+ arrange(鄉鎮市區, 交易標的, 建物型態, 交易日期, 單價元平方公尺)
# A tibble: 86,181 x 5
鄉鎮市區 交易標的 建物型態 交易日期 單價元平方公尺
<chr> <chr> <chr> <dttm> <dbl>
八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/6/18 36178
八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/2 29795
八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/6 30798
八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/9 35814
八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/15 30679
八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/18 25065
八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/20 52635
八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/23 33718
八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/23 33805
八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012/7/24 27712
# ... with 86,171 more rows
【所欲資料樣貌】
鄉鎮市區 交易標的 建物型態 交易日期 單價元平方公尺 timedelay [後兩項相減]
(略) (略) (略)(略)  
36178 33805 2373
29795 36178 -6383
30798 29795 1003
35814 30798 5016
30679 35814 -5135
25065 30679 -5614
52635 25065 27570
33718 52635 -18917
33805 33718 87
27712 33805 -6093
【遭遇問題】
1. 單獨用embed()拿到欄位timedelay欄位可以,但是要在檔案tao_b裡面新增這個欄位,
不知道該如何是好。
embed(tao_b$單價元平方公尺, 2)
2. 由於資料排序之下會有不同的鄉鎮市區、交易標的和建物型態,每項條件相同的
第一欄timedelay應修正為0,該如何用簡單指令找到該欄位並取代為0?
(也就是上表顯示為'2373'的欄位)
3. 從上表來看,由於同條件下,2012-07-23的資料有兩筆,想要直接合併變成一筆,
期待結果為:
八德區 房地(土地+建物)~ 住宅大樓(11層含以上有~ 2012-07-23 33761.5
=median(c(33718, 33805))
由於資料量大,如果逐步清理資料會很花時間,想請教有無聰明的作法。
還先感謝大家~
[環境敘述]:
> sessionInfo()
R version 3.5.1 (2018-07-02)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows >= 8 x64 (build 9200)
[關鍵字]:
embed()
timedelay
資料整合
作者: locka (locka)   2019-03-26 18:01:00
請問 embed 是什麼 function啊?
作者: andrew43 (討厭有好心推文後刪文者)   2019-03-27 02:56:00
不是非常肯定是不是你要的 https://ideone.com/Aj4IX9

Links booklink

Contact Us: admin [ a t ] ucptt.com