프로젝트 (1) 썸네일형 리스트형 [데이콘] 코드 유사성 판단 시즌2 AI 경진대회 코드 유사성 판단 시즌2 AI 경진대회 기간: 2024.03.04 ~ 2024.04.01 개인 순위: 24th 소스 코드는 Github에서 확인할 수 있습니다. 참가 목표 취업 준비로 인해 기간이 일주일 가량 남았을 때 시작했었다. 그럼에도 불구하고 NLP 중 Program Language를 다룰 수 있고 LLM Fine-tuning 수행 경험을 해볼 수 있어 참가하였다. 데이터셋 제공된 데이터는 500개의 문제에 대해 해당 문제를 해결하는 서로 다른 코드 500개로 총 250000(=500x500)개의 C++로 작성된 스크립트 파일이다. Siamese network로 학습시키기 위해 모든 코드가 데이터셋에 1번 씩만 포함되면 gold similarity(0 or 1)의 비율이 1:1이 되도록 구축하였다.. 이전 1 다음