인포보스 유전체AI 경진대회

배경 효소는 미생물부터 인간까지 모두 가지고 있는 화학반응을 담당하는 단백질입니다. 이들 효소들 중에서 식물유래 효소는 다양한 기능을 가지고 있는데, 이들을 아미노산으로부터 그 기능을 정확하게 예측하는 것은 식물체가 생산할 수 있는 유용한 물질(2차 대사산물)을 아는데 큰 도움을 줄 수 있습니다. 기존의 방식으로는 이 기능을 예측하는데 한계가 있어, Deep Learning 모델을 활용하여, 이들의 기능을 정확하게 예측할 수 있는 인공지능 엔진을 만드는 것이 본 경진대회의 목표입니다.
주제 효소 유전자의 아미노산 서열을 통한 EC number 예측
설명
  • - 효소 유전자의 아미노산 서열을 입력 데이터로 사용하여 해당 유전자의 EC number 다중 클래스 분류를 목적으로 합니다.
  • - 아미노산 서열은 알파벳 문자 21개(A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, Y, X) 로 이루어진 문자열 데이터입니다. X는 특정지을 수 없는 아미노산이라는 의미입니다.
  • - EC number는 1.2.7.7. 과 같이 숫자 네개로 이루어진 번호이며 이 네자리 숫자의 조합이 하나의 class가 됩니다. 대회에서 활용하는 데이터에는 111개의 EC number class가 제공됩니다.
  • 주최/주관
  • 주최: 인포보스 주식회사
  • 주관: 인포보스 주식회사
  • 후원: NIA 한국지능정보사회진흥원
  • 참가자격 인공지능에 관심 있는 대한민국 국민 누구나

    참가신청 참가자 로그인

    상세정보

    평가산식 Macro-average F1 Score (산식 및 코드는 제공)
  • * 1차 평가는 비공개 test set에 대한 평가지표로 2배수 필터링 (8팀 선정)
  • * 2차 코드, ppt 평가로 수상자 결정 (4팀 선정)
  • * 발표회는 수상자만 진행 (순위 결정)
  • 참여규칙
  • * 개인 또는 팀으로 참가할 수 있음
  • * 팀 최대인원: 5인
  • * 동일인이 개인 또는 복수팀에 중복하여 등록 불가
  • * 별도의 팀 병합 기간이 없으니 팀으로 참가를 원하시는 분들은 처음에 팀으로 신청해 주시기 바랍니다.
  • 외부 데이터 및 사전 학습 모델
  • * 사용에 법적 제약이 없으며 공개된 외부 데이터 사용 가능 (출처 필수 기재)
  • * 법적 제약이 없으며 공개된 사전 학습 모델 사용 가능 (출처 필수 기재)
  • 제출물
  • * 대회 종료일까지 아래 세가지 제출물 모두 제출해야 합니다.
  • - Test dataset에 대한 예측 csv 파일
  • - 정리된 코드
  • - ppt 자료
  • 코드 제출 규칙
  • * 코드에 데이터 입출력 경로 포함 및 주석 작성
  • * 코드파일 확장자: .py, .ipynb
  • * 코드와 주석 인코딩: UTF-8
  • * 모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)
  • * 별도 필요한 라이브러리가 있을 경우 소스코드 내에 설치하는 코드가 있어야 함
  • * 모든 프로세스를 가독성 있게 정리하고 주석을 포함하여 하나의 파일로 제출
  • * 개발 환경(OS) 및 라이브러리 버전 기재
  • * 외부 데이터 및 모델 사용시 출처와 같이 다운로드 링크 혹은 메일 첨부
  • PPT 제출 규칙
  • * PPT 자료는 아래 내용을 필수적으로 포함하고, 해당 작업(혹은 모델 선정등)을 한 사유를 자유 형식의 설명자료로 구성하여 제출
  • - 데이터 전처리 방식
  • - 모델 구조
  • - 시도한 실험
  • * 코드와 PPT 자료 모두 제출해야 수상이 가능합니다

    유의사항
  • * 사용 가능한 언어: python
  • - 모든 학습 과정은 정상적인 코드를 바탕으로 이루어져야 하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 실격 처리
  • - 데이터 및 베이스라인 모델은 참가 신청 하신 후 개별 이메일로 전달 드리는 ID, 비밀번호로 로그인 하시면 확인하실 수 있습니다.
  • 일정
  • * 11.14: 대회 페이지 공개 및 대회 시작
  • * 12.11: 대회 종료, 코드 및 PPT 제출 마감
  • * 12.13: 발표팀 선정
  • * 12.16: 오프라인 발표 및 시상
  • 오프라인 발표 및 시상장소
  • * 일시 : 12월 16일 금요일 오후 2시
  • * 장소 : 서울대학교 NICEM
  • 시상계획
    시상계획
    상 훈 상금
    (천원)
    포상수량
    대 상 3,000 1
    우수상 1,000 1
    장려상 500 2
  • * 평가지표, 코드, ppt 제출본을 평가하여 4팀의 시상 후보팀을 선정합니다.
  • * 상세 일정 및 장소는 선정되신 팀에게 별도 안내드릴 예정입니다.
  • * 시상 후보팀은 오프라인 발표에 꼭 참석하여 제출한 ppt에 대해 발표를 진행하여야 합니다.
  • * 대상, 우수상, 장려상은 팀은 제출 ppt 와 발표를 종합하여 결정됩니다.
  • 베이스라인
  • * 베이스라인
  • - 참가 신청 하신 후 개별 이메일로 전달 드리는 ID, 비밀번호로 로그인 하시면 확인하실 수 있습니다.
  • 참가신청 온라인형식

    팀명
    팀원수 (1명 이상)
  • * 개인정보 수집∙이용 동의서 *
    • 1. 수집하는 개인정보 항목 : 성명, 소속, 이메일주소, 휴대폰번호
      2. 개인정보의 수집 및 이용 목적 : 제공하신 정보는 경진대회 참가, 본인확인 및 대회 관련 안내를 위해 활용됩니다.
      2-1. 본인 확인 식별(동명이인, 소속 확인 등) 절차에 이용 : 성명, 소속, 이메일주소, 휴대폰번호
      2-2. 의사소통 및 정보 전달 등에 이용 : 성명, 이메일주소, 휴대폰번호
      3. 개인정보의 보유 및 이용기간 : 수집된 개인정보의 보유기간은 경진대회 대회 종료 후 6개월간이며, 삭제 요청 시 당사자는 개인정보를 재생불가능한 방법으로 즉시 파기합니다.
      ※ 귀하는 이에 대한 동의를 거부할 수 있습니다. 다만 동의가 없을 경우 해당 경진대회의 신청이 불가능함을 알려드립니다.
      개인정보 수집∙이용 동의서에 동의함.

    참가신청

    참자가 로그인

    ID
    비밀번호

    로그인