[問題] 特徵選取問題

作者: iambakr (123)   2025-07-01 00:21:32
經驗諮詢(我想用R作特徵選取,請問大家的經驗)
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
請簡略描述你所要做的事情,或是這個程式的目的
我打算使用 TF-IDF 作文字探勘,碰到以下幾個問題:
Q1:我打算用 mutual information 與 mRMR作特徵選取
我應該先做 TF-IDF 然後再做特徵選取?
還是反過來?
Q2: 承上,我將降維後的詞彙作機器學習分類 (ex: svm, rf, etc)
我需要將這些文字特徵以及其他數值型特徵作標準化嗎?
如下面 code 最後一行
以及倒數第二行有註解的 step_nzv() 這個實務上也是需要的嗎?
rec <- recipe(Label ~ ., data = train_data) |>
step_zv(all_predictors()) |>
#step_nzv(all_predictors()) |>
step_normalize(all_numeric_predictors())
謝謝各位

Links booklink

Contact Us: admin [ a t ] ucptt.com