[AI는 지금] 개발 코드 30%는 AI가 작성…개발 문화도 조용히 '혁신'

컴퓨팅입력 :2025-06-21 15:00:01    수정: 2025-06-21 18:47:25

개발자들이 작성하는 코드의 30%는 이미 생성형 인공지능(AI)에 의해 만들어지고 있는 것으로 나타났다. 단순한 자동완성 수준을 넘어 AI가 실질적인 개발 파트너로 자리잡고 있다는 분석이다.

21일 업계에 따르면 네덜란드 위트레흐트대학교와 오스트리아 복잡성 과학 허브(CSH) 등으로 구성된 국제 공동 연구팀은 '생성형 AI의 세계적 확산과 영향(Global Diffusion and Impact of Generative AI)'이라는 제목의 논문을 아카이브를 통해 이 같은 내용을 발표했다.

연구진은 2019년부터 2024년까지 깃허브(GitHub)에 업로드된 약 8천만 건의 오픈소스 파이썬(Python) 커밋을 분석해 생성형 AI가 실제로 코드 생산에 얼마나 활용되고 있는지를 정량적으로 측정했다. 그 결과 2024년 말 기준 미국 깃허브 사용자들이 작성한 파이썬 함수 중 30.1%가 AI에 의해 생성된 것으로 확인됐다.

연도별 국가 AI코딩 비율(이미지=아카이브)

이번 연구는 단순한 설문이나 사용자 보고에 의존하지 않고 AI가 작성한 코드와 사람이 작성한 코드를 구분하는 딥러닝 분류 모델을 구축해 실데이터에 적용한 것이 핵심이다.

연구진은 파이썬 함수 단위의 코드 블록을 분석 대상으로 삼아 그래프코드버트(GraphCodeBERT) 기반 언어 모델에 함수 내부의 토큰, 주석, 변수 흐름 등을 입력해 AI 생성 여부를 자동 판별하도록 훈련시켰다. 해당 모델은 외부 테스트셋 기준 정확도(AUC) 0.964, 정밀도 0.969라는 높은 성능을 기록했다.

AI 판별 모델을 훈련하는 데에는 세 가지 종류의 데이터셋이 활용됐다. 먼저 생성형 AI가 등장하기 전인 2018년 이전에 작성된 인간 고유의 코드와 사람과 AI가 코딩 문제를 해결한 결과가 담긴 벤치마크 데이터셋과 테스트셋이 사용됐다. 마지막으로는 AI가 설명을 바탕으로 직접 생성한 코드 쌍이다.

이렇게 다양한 데이터로 훈련된 AI 판별 모델을 통해 연구팀은 깃허브 코드 중 어떤 것이 AI가 작성한 것인지를 높은 정밀도로 판별할 수 있었고, 이를 바탕으로 시간 흐름, 국가별 차이, 사용자 특성 등 다양한 분석을 수행할 수 있었다.

국가별로는 미국이 가장 높은 AI 코드 작성 비율을 기록했다. 2020년에는 사실상 0%였던 비율이 2024년 말에는 30.1%까지 급등했다. 이는 챗GPT, 깃허브 코파일럿 등 주요 AI 도구가 출시된 이후 급속히 확산된 결과로 풀이된다.

그 뒤는 독일(24.3%), 프랑스(23.2%), 인도(21.6%), 러시아(15.4%), 중국(11.7%) 순으로 나타났다. 한국은 이번 분석 대상 국가에 포함되지 않았다.

특히 인도는 2023년 이후 AI 활용이 급격히 증가, 프랑스와 독일을 빠르게 추격하고 있다. 반면 중국과 러시아는 상대적으로 낮은 도입률을 보였는데, 이는 기술 접근성, 규제 환경, 깃허브 대신 기티(Gitee) 등 독자 플랫폼을 사용하는 개발 생태계의 차이 때문으로 분석된다.

개발자 개인 특성에 따른 AI 활용 양상도 뚜렷했다. 깃허 활동 기간이 짧은 신입 개발자일수록 AI 도구를 더 적극적으로 사용하는 경향을 보였다. 최근 가입자는 전체 코드의 41%를 AI로 작성한 반면 10년 이상 경력자는 28% 수준에 머물렀다.

성별에 따른 AI 활용률은 통계적으로 유의미한 차이를 보이지 않았다. 깃허브 사용자 이름을 기반으로 성별을 예측한 결과 남성과 여성 모두 유사한 수준의 AI 도입률을 보였다.

AI 활용은 단순히 코드 양을 늘리는 데 그치지 않았다. 연구진은 동일 개발자의 활동 변화를 추적한 결과, AI 사용률이 높을수록 분기별 커밋 수가 평균 2.4% 증가했다고 밝혔다.

또 새로운 소프트웨어 라이브러리 도입과 기존에 없던 라이브러리 조합 실험도 함께 증가했다. 이는 AI가 반복 작업을 대신할 뿐 아니라 개발자의 기술 탐색성과 창의성까지 확장시키고 있다는 점을 보여준다.

연구진은 "생성형 AI는 개발자의 학습 속도와 폭을 넓히고 새로운 기술 영역으로의 진입 장벽을 낮춘다"고 설명했다.

AI 도입이 가져오는 경제적 효과도 상당한 수준이다. 연구진은 미국 내 소프트웨어 개발 업무에서 AI가 가져온 생산성 향상을 보수적으로 추산했을 때 연간 96억144억 달러(약 13조20조원) 규모의 경제적 가치가 발생한다고 분석했다.

이 수치는 AI 사용률 30%, 커밋 수 2.4% 증가라는 데이터를 바탕으로 미국 전체 개발자 임금 총액을 고려해 산출됐다. 여기에 최근의 무작위 대조 실험(RCT) 및 자연실험에서 나타난 더 큰 생산성 향상을 반영할 경우 그 가치는 최대 640억 달러(약 131조원)까지 확대될 수 있다고 연구진은 강조했다.

이번 연구의 핵심은 단순한 AI 도입률이 아니라 AI가 개발자의 일하는 방식 자체를 바꾸고 있다는 사실을 실증 데이터로 보여줬다는 점이다.

AI를 적극 활용한 개발자는 코드의 양뿐 아니라 내용, 구조, 기술적 폭에서도 유의미한 변화를 보였다. 이는 AI가 단순한 자동화 도구가 아니라 실제 코딩 과정에 깊숙이 관여하는 협업 파트너로 자리잡고 있음을 의미한다.

김홍일 방통위원장

관련기사