Linux

splitfolders로 데이터셋 분할

술임 2023. 2. 10. 16:48

python 라이브러리인 split-folders를 사용하면 train/val/test 데이터셋을 한 번에 나눌 수 있다.

 

설치

pip install split-folders

 

원하는 비율로 데이터셋 나누기

import splitfolders # import split-folders

# train / validation / test
splitfolders.ratio("input path", output="output path", seed= 1337, ratio=(.8,.1,.1))

# train / test
splitfolders.ratio("input path", output="output path", seed= 1337, ratio=(.8,.2))

 

원하는 숫자대로 데이터셋 나누기

import splitfolders # import split-folders

# train / validation / test
splitfolders.fixed("input path", output="output path", seed= 1337, fixed=(800,100,100), oversample=False, group_prefix=None)

# train / test
splitfolders.fixed("input path", output="output path", seed= 1337, fixed=(800,200), oversample=False, group_prefix=None)

'Linux' 카테고리의 다른 글

rename  (0) 2023.02.11
nohup  (0) 2023.01.30
GPU 모니터링  (1) 2023.01.29