Notice
[중요] 본선 상세 안내 ***
2023.10.30
- 본선: 10/30(월) 14:00 ~ 11/4(토) 14:00
- 결과 발표: 11/13(월) 10:00
- 예선과 동일 주제 데이터를 이용한 음성인식 모델을 개발
- [참고] 본선 데이터는 데이터 수량이 늘고 발화 길이도 길어짐에 따라 제공 시스템을 최대한 활용
- [참고] 평가데이터에는 일부 잡음이 포함되었으므로 데이터 증강 기법 등 성능 개선에 참고
- 사전 학습 모델: 제한 없음
(단, 본 대회의 트랙별 주제 데이터를 재료로 한 베이스 모델을 사용할 경우, 대회 공지일(7/31) 이전에 생성된 버전만 가능)
- 외부 데이터: 제한 없음. (외부 데이터로 학습데이터 증강 등 가능)
- 모델및 데이터 파일의 반입/반출: 가능
(이전 세션의 모델을 로드하고자 할 경우 해당 모델을 pull 한 후 반입하여 사용할 수 있음)
- nova submit 명령에 의해 자동 평가되며 CER, WER 을 1, 2 순위 지표로 하고 이후에는 제출 순서를 고려하여 최종 순위가 리더보드에 나타남
- 평가는 1 시간에 1 번 가능하므로 팀원들 간 제출 시간을 협의하시기 바람 (submit 수행 1 시간 후 다시 submit 가능)
- 추론 시간 제한은 2시간 이내 (시스템에 의해 제한됨)
- GPU (NVIDIA Tesla V100 32GB) 2 개 설치된 클라우드 서버 제공
- 이메일 가이드에 따라 시스템에 접속 시 모델 학습 및 평가 등 개발에 필요한 플랫폼 'nova' 는 설치되어 있음.
- 데이터가 이미 세팅 되었으므로 초기 세션 생성시 데이터 바인딩 소요시간이 짧아짐.
- 필요에 따라 multi-GPU 이용 가능하며 인퍼런스(submit) 시에도 2 GPU 사용이 가능하나 베이스라인 코드에서는 지원되지 않음.
- 베이스라인 코드는 데이터 로딩과 학습/평가 방법 등을 안내할 목적이므로 해당 로직을 따를 경우 베이스라인 코드를 사용하지 않아도 됨.
- Visual Studio Code 사용을 지양하시기 바람. (예선에서 접속 장애를 일으킨 주요 원인)
- 본선 종료 시 리더보드에 게시된 버전의 세션은 실행 검증을 위해 삭제하지 않아야 합니다. (삭제시 평가에서 제외)
- 소프트웨어 패키지, 사전 학습 모델, 제공 이외의 데이터는 저작권 등 법적으로 위배되지 않아야 합니다.
- 허용되지 않은 시도가 시스템 운영에 부정적인 영향을 미치는 경우는 부정행위로 간주합니다.
예) CPU 과부하에 의한 접속 장애, 평가 데이터 반출 및 확인 시도 (관련 코드의 존재도 포함)
- 시스템 내의 모든 시도는 로그에 기록되므로 허용되지 않는 행위는 부정행위로 조치됩니다.
- 대회 직후 참가팀의해당 세션 코드를 검증 예정이며 규정 위반 등의 사유 발생시 사후에도 시상이 취소될 수 있습니다.
*** 상세한 안내를 위해 트랙별 '문의 게시판' 또는 '이메일'을 이용해 주시기 바라며, 필요한 경우 전화 문의 대응은 오전 10시 ~ 오후 6시 입니다.
email: koreanai@urbancorp.co.kr