반응형

error 2

[pytorch error] ValueError: Expected more than 1 value per channel when training, got input size torch.Size ...

안녕하세요 전자둥이 입니다. 학습을 진행 했을 때 분명 문제가 없던 모델이고 데이터셋만 바꿨을 뿐인데 해당 에러가 발생하는 것을 목격했습니다. ValueError: Expected more than 1 value per channel when training, got input size torch.Size ... 저의 경우 해당 에러가 발생한 이유가 (데이터셋의 개수 / batch_size) 를 했을 때 나머지가 1이 나오게 되면 저런 에러가 발생했습니다. ex) 사용한 데이터 개수가 13개 batch_size를 2 로 진행하게되면 위에서 언급한 에러가 발생하며 해당 에러를 발생 하지 않으려면 batch_size를 5를 주면 문제없이 학습이 진행됩니다. 이 글로 에러를 쉽게 해결하셨으면 좋겠습니다. 감사..

카테고리 없음 2022.08.12

[에러] RuntimeError: Error(s) in loading state_dict for ~ , size mismatch for ~

안녕하세요 pretrained된 모델을 로드하고 학습 및 추론을 할 때 다음과 같은 에러를 보신적이 한두번은 있을겁니다. size mismatch가 아닌 없는 layer또는 있는 layer를 무시할 때는 state_dict = torch.load(cached_file) mdl.load_state_dict(state_dict,strict=False) 위에 코드처럼 load_state_dict()에 strict=False만 기입해주면 해결이 됩니다. 하지만 맨 위에 에러처럼 같은 layer에서의 size mismatch는 strict=False로 해결이 안됩니다... 외국 포럼 사이트에서 해결방법을 찾게되어 소개를 해볼려고 합니다. 우선 코드부터 보드리겠습니다. def on_load_checkpoint(se..

AI 2021.12.07
반응형