python 라이브러리인 split-folders를 사용하면 train/val/test 데이터셋을 한 번에 나눌 수 있다.
설치
pip install split-folders
원하는 비율로 데이터셋 나누기
import splitfolders # import split-folders
# train / validation / test
splitfolders.ratio("input path", output="output path", seed= 1337, ratio=(.8,.1,.1))
# train / test
splitfolders.ratio("input path", output="output path", seed= 1337, ratio=(.8,.2))
원하는 숫자대로 데이터셋 나누기
import splitfolders # import split-folders
# train / validation / test
splitfolders.fixed("input path", output="output path", seed= 1337, fixed=(800,100,100), oversample=False, group_prefix=None)
# train / test
splitfolders.fixed("input path", output="output path", seed= 1337, fixed=(800,200), oversample=False, group_prefix=None)