トップ履歴一覧 Farm ソース検索ヘルプ PDF RSS ログイン

droplevels()

droplevels()

factor型のデータ（カテゴリー変数）で、
データ処理中に、使われないレベルが残ってしまった場合、
使われないレベルを削除する

例： PIDのうち20で始まるものだけを選んでサブセットを作る場合

元データ

tibble [414 × 3] (S3: tbl_df/tbl/data.frame)
 $ PID     : Factor w/ 233 levels "1901","1902",..: 1 2 3 4 5 6 8 9 12 13 ...
 $ Year    : Factor w/ 2 levels "JH","SH": 1 1 1 1 1 1 1 1 1 1 ...
 $ MSD_mean: num [1:414] 2.2 1.68 1.64 1.64 1.74 ...

20で始まる人だけを選ぶ

dplyr::filter(startsWith(as.character(PID), "20"))

これだけやると以下のようになる

tibble [140 × 3] (S3: tbl_df/tbl/data.frame)
 $ PID     : Factor w/ 233 levels "1901","1902",..: 76 77 78 79 80 81 82 83 85 86 ...
 $ Year    : Factor w/ 2 levels "JH","SH": 1 1 1 1 1 1 1 1 1 1 ...
 $ MSD_mean: num [1:140] 1.66 1.73 1.7 1.77 1.7 ...

PID: Factorに残ってしまっている
値はないので、データとしては存在しないのに、、、

      PID      Year       MSD_mean    
 2002   :  2   JH:70   Min.   :1.576  
 2003   :  2   SH:70   1st Qu.:1.718  
 2004   :  2           Median :1.768  
 2005   :  2           Mean   :1.774  
 2006   :  2           3rd Qu.:1.830  
 2007   :  2           Max.   :2.071  
 (Other):128

これがトラブルのもとになるので、存在しないlevelを削除する

%>% mutate(PID=droplevels(PID))

df_both2 <- df_both %>% dplyr::filter(startsWith(as.character(PID), "20")) %>% mutate(PID=droplevels(PID))

これで、構造もきれいになる。

str(df_both2)

tibble [140 × 3] (S3: tbl_df/tbl/data.frame)
 $ PID     : Factor w/ 70 levels "2002","2003",..: 1 2 3 4 5 6 7 8 9 10 ...
 $ Year    : Factor w/ 2 levels "JH","SH": 1 1 1 1 1 1 1 1 1 1 ...
 $ MSD_mean: num [1:140] 1.66 1.73 1.7 1.77 1.7 ...

https://sugiura-ken.org/wiki/

Menu

keyword

category

[GLMM]
[Linux]
[HSP]
[R]
[Python]
[Corpus]
[Google]

更新履歴

2026/3/1

FFmpeg

2026/2/7

droplevels()

2026/2/6

GoogleAlerts

2026/1/15

NICT JLE Corpus

2026/1/10

facet

2026/1/8

ImageMagick

2025/12/21

spacyr

2025/12/14

RStudio

2025/12/8

Quarto

2025/11/9

contrast coding

2025/10/23

TAASSC

2025/9/13

CaboCha

2025/9/9

Ubuntu

2025/9/4

Excel.tips

2025/8/3

2025/7/31

MeCab

2025/7/29

RMarkdown

2025/7/24

balloonplot

2025/7/6

R

2025/6/19

Colab

2025/6/18

GoogleSpreadsheet

2025/6/17

ChatGPT

2025/6/15

2025/6/12

TextForHSP05

2025/5/18

Overleaf

2025/5/14

2025/5/13

2025/5/12

GitHub

2025/5/6

sessioninfo

2025/5/2

cocaClean

2025/4/30

Audacity

2025/4/29

2025/4/28

Git

2025/4/19

2025/4/2

Postorius

2025/3/17

GoogleSlides

2025/3/16

2025/3/15

2025/3/12

2025/3/7

udpipe

2025/3/4

effects

2025/3/2

2025/2/25

Word.tips

2025/2/16

gtsummary

2025/1/31

dispersion

2025/1/25

TACT

2025/1/23

Windows11

2025/1/10

Multiple Regression Analysis

2024/12/5

Thunderbird

2024/11/25

GoogleForm

2024/11/3

formMule

2024/10/31

Discord

2024/10/17

2024/10/13

Forward Difference Coding

2024/10/8

AlmaLinux

2024/10/6

NUCT

2024/10/4

FLUCALC

2024/10/3

2024/10/2

ERRANT

2024/9/28

ROOT

2024/9/25

heatmap

2024/9/24

Log-r

2024/9/17

2024/9/15

ICC

2024/9/14

2024/9/1

sjPlot

2024/8/31

theme()

2024/8/16

RandomForest

2024/8/13

Mann-Whitney U test

2024/8/8

DateDay.hsp

2024/8/7

2024/8/3

2024/7/31

R.package

2024/7/27

OrdinalLogisticRegression

2024/7/25

2024/7/24

repmod

2024/7/22

modelsummary

2024/7/8

2024/6/27

2024/6/25

WER

2024/6/17

dummy variables

2024/6/7

GoodNotes

2024/6/5

2024/6/1

pivot_longer()

2024/5/31

TextForHSP03

2024/5/30

Python2024memo

2024/5/29

RadioButton

2024/5/26

R meets Google Spreadsheet

2024/5/24

2024/5/18

2024/5/11

Google Books Ngram Viewer

2024/5/8

スクリーンショット

2024/4/29

case_when

2024/4/24

R.data

2024/4/5

MicrosoftTeams

2024/1/28

sakura editor

2024/1/11

LCR2023

2024/1/6

jtools

2023/12/29

abline()