[問題] 符合條件後,將下一行的資料利用

作者: bedroom0204 (khkh)   2022-11-21 18:54:16
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
我有一組資料,如下圖左。
每個Product跟Sku會進行N次測試,但我只想要留都成功的組合。
如Product1 & M,測試了3次,但我只想要留Product1 M 2022/10/25 23:18這筆。
而Product2 & S,最後一筆的Result1 & Result2有NG的狀況,
所以我要借用前一個OK的那筆。
最後整理結果如下圖右。
我目前的想法不是用group_by,而是從for 迴圈去逐row看是否NG,
如果NG再看下一row是否為同一product和sku,
如果是的話,便將下一row的值貼上此row。
但不知道有沒有比較好的做法。
https://imgur.com/z7FPje9
===============================================================
簡單來說我想要組合同一個product & sku下的結果,
如前所述的product2 & S,11:58的result 3 & 4有OK,所以要保留,
但result 1&2的NG就要取用9:48的結果。
我一開始也想嘗試用group_by,
但是group_by(product, sku)後,
我目前僅會列出根據時間的最後一筆(arrange後summarise_all(last)),
而不知道怎麼把group_by後的結果作上述的組合動作。
[環境敘述]:
Windows
R-4.0.3
[關鍵字]:
dplyr
summarise
row
作者: DavidDX (皮猴軒)   2022-11-21 21:47:00
有點看不太懂,但是整體來說是不管有幾筆資料,只要其中一筆資料的results 1有OK的結果,就是OK。 不知道我這樣理解是否對?
作者: fox1375 (阿吠)   2022-11-21 22:10:00
不用group_by有什麼特殊考量嗎?迴圈應該會比較慢
作者: Wush978 (拒看低質媒體)   2022-11-22 08:47:00
因為你的邏輯有順序問題,建議用SQL的window clauseR我目前不知道有沒有window clause的替代品
作者: lycantrope (阿寬)   2022-11-22 09:47:00
沒有順序問題吧,最終結果不就只是看有OK就取OK.
作者: SonicJuice (光陰四濺)   2022-11-22 18:09:00
看起來可以拆分兩部分作業, 在每組product, sku找出一個符合你要求的date, 再找出result1-4的適合值, 最後再merge起來第一部份, 先把ok/ng轉換成1/0,逐row加起來(ok_cnt),每組product,sku依ok_cnt大至小排序, date早到晚排序, 再取出每組第一個row, 就會是所求的date第二部分, 每組product, sku找出max(result1)到max(result4)最後用product,sku作為key去merge兩個部分, 應該就是你要的結果, btw我前面的date排序好像講反了
作者: andrew43 (討厭有好心推文後刪文者)   2022-11-23 11:02:00
參考 data.table,也一併說明做法了。https://ideone.com/I1R28G
作者: hohiyan (海洋)   2022-11-25 11:18:00
既然 日期時間(Date) 這個欄位都是採最新的一筆資料那用 排序 + group + long/wide date 應該就可以解決了https://pastebin.com/qHCdLGpQ

Links booklink

Contact Us: admin [ a t ] ucptt.com