에이닷 720억개 vsR16710억개 변수 적게 쓰고도 언어능력 유사 GPT4o보다는 한국어 1.5배 유창 비용 GPU의존 줄여 <span class=\"hanja\">韓</span><span class=hangul>(한)</span> 안성맞춤 SKT, 딥시크급 AI내주 공개
딥시크 9분의 1규모로 동급 성능 SK 그룹 AI밸류체인 속도
에이닷 720억개 vsR16710억개 변수 적게 쓰고도 언어능력 유사 GPT4o보다는 한국어 1.5배 유창 비용 GPU의존 줄여 <span class=\"hanja\">韓</span><span class=hangul>(한)</span> 안성맞춤 SKT, 딥시크급 AI내주 공개
김윤수 김성태 기자
SK텔레콤이 딥시크 쇼크 의 주인공인추론형 인공지능(AI) 모델 R1보다 9배가벼운 모델로 동급의 추론 성능을 구현하는 데성공했다.
SK텔레콤이 이처럼 추론형 모델 경쟁에 서둘러 뛰어들어 AI가성비(비용 대비 효율) 에 공들이는 것은글로벌 AI경쟁에서 만성적으로 한국 기업의발목을 잡는투자 여력 한계와그래픽처리장치(GPU) 수급난이라는 이중고를 극복할 돌파구로 주목받기 때문이다.
SK텔레콤은 이를 통해 오픈AI구글 딥시크 등 쟁쟁한 글로벌 빅테크와의 AI경쟁을 본격화하고 회사를 필두로 한 SK그룹 차원의 AI밸류체인(가치사슬) 구축에도 속도를 낼 방침이다.
23일 정보기술(IT) 업계에 따르면 SK텔레콤의 추론형 모델 에이닷엑스(A.X) 4.1은 대규모다중작업언어이해(MMLU) 점수 87.3점으로 딥시크 R1(90.8점) 과맞먹는다.
R1의파라미터(매개변수 모델 크기) 가 6710억 개인데 반해 에이닷엑스4.1은 720억 개에 불과해글로벌 수준의 효율을 달성한 셈이다.
에이닷엑스4.1은 또 비(<span class=\"hanja\">非</span><span class=hangul>(비)</span>) 추론형 최신 모델인 오픈AI의 GPT4o보다 한국어 토큰처리 성능이 1.5배높다.
이에 관련비용을 34%절감할 수 있다.
MMLU 점수도GPT4o에 맞먹는 것으로 알려졌다.
올 초 딥시크 쇼크 로 진가가 알려진추론형 모델 개발은 한국 기업들에 특히절실하다는 게 업계의 전언이다.
같은 작업에 드는파라미터와 토큰 비용이 더적을수록 모델 학습과 개발 운영에 드는 비용은 물론 모델 구동에 필요한 AI반도체인 GPU개수도 줄일 수 있기 때문이다.
한국 기업들은 투자 여력 부족으로 조(<span class=\"hanja\">兆</span><span class=hangul>(조)</span>) 단위 파라미터로 커진 글로벌 대규모언어모델(LLM) 규모 경쟁을 따라가기 힘든 데다 그런 LLM을 만든다고 해도이를 구동시킬 GPU를 확보하는 데도국가적으로 난항을 빚는 이중고를 겪고 있는 상황에서 추론형모델이 해법이 될수있다는 것이다.
업계 관계자는 LLM 개발사들이 고객사를 확보하려면 결국 비용 효율성과 해당 분야의 전문 지식이 필요하다 며 추론형 모델은 비용 문제를 개선할 수 있을뿐더러 기존에는 파라미터를 크게 늘리지않으면 어려웠던 복잡한 수학 계산, 과학연구, 코딩, 제조 등 고난도 분야에 특화한 모델로도 응용될 수 있다 고 말했다.
SK텔레콤 역시 그동안 에이닷엑스를 자사AI통화 에이전트(비서) 에이닷 에 탑재하는정도였다면 앞으로는 다양한 고객사확보에 나설 것이라는 관측이 나온다.
SK텔레콤뿐 아니라 국내 주요 기업들이 이 시장에 출사표를 던진 상황이다.
LGAI연구원이 3월 엑사원 딥을 공개한데 이어 양대 플랫폼 네이버와 카카오도자체 기술을 개발 중이다.
네이버는 기존하이퍼클로바X의 추론형 버전을 다음달 출시한다.
이 모델은 벤치마크 심플QA 에서 90.1점을 기록해 GPT4o(90점) 급 성능을 보여줬다.
카카오 역시 언어모델 기반의 추론형 모델을 개발 중이며이르면 상반기 공개할 것 이라고 밝혔다.
라이너 업스테이지 등 AI스타트업들도자체 모델을 출시했거나 준비 중이다.
해외 기업들도 주도권 선점을 위해 앞다퉈 고도화에 나서는 중이다.
구글은 제미나이 2.5프로 와 함께 이를 기반으로한 고급 추론 기능 딥 싱크, 앤트로픽도7시간 동안 스스로 코딩하는 등 자율성을높인 클로드 오푸스4를 최근 공개했다.
샤오미도 지난달 말 70억 파라미터의 미모 를 내놓았다.
SK그룹 차원에서도 이번 추론형 모델출시를 계기로 AI밸류체인 구축에 속도가 붙을 것으로 전망된다.
SK그룹은 SK텔레콤의 AI모델과 데이터센터 등 인프라 사업을필두로 반도체 조달로 이를 떠받치는 SK하이닉스, 최근 사명 변경으로AI 솔루션 조직으로 재편된 SKAX(구SKC&C) 등을 통해 서비스 분야까지 독자적 밸류체인을 구축 중이다.
SK텔레콤은 연내 에이닷 유료화와 북미 버전 에스터 출시, GPU6만장 규모의 AI데이터센터 구축을, SK하이닉스는 엔비디아 등에 고대역폭메모리(HBM) 4조기 공급을추진 중이다.
업계 및 LM아레나 리더보드
에이닷 720억개 vsR16710억개 변수 적게 쓰고도 언어능력 유사 GPT4o보다는 한국어 1.5배 유창 비용 GPU의존 줄여 韓 안성맞춤 SKT, 딥시크급 AI내주 공개
딥시크 9분의 1규모로 동급 성능 SK 그룹 AI밸류체인 속도
에이닷 720억개 vsR16710억개 변수 적게 쓰고도 언어능력 유사 GPT4o보다는 한국어 1.5배 유창 비용 GPU의존 줄여 韓 안성맞춤 SKT, 딥시크급 AI내주 공개
김윤수 김성태 기자
SK텔레콤이 딥시크 쇼크 의 주인공인추론형 인공지능(AI) 모델 R1보다 9배가벼운 모델로 동급의 추론 성능을 구현하는 데성공했다.
SK텔레콤이 이처럼 추론형 모델 경쟁에 서둘러 뛰어들어 AI가성비(비용 대비 효율) 에 공들이는 것은글로벌 AI경쟁에서 만성적으로 한국 기업의발목을 잡는투자 여력 한계와그래픽처리장치(GPU) 수급난이라는 이중고를 극복할 돌파구로 주목받기 때문이다.
SK텔레콤은 이를 통해 오픈AI구글 딥시크 등 쟁쟁한 글로벌 빅테크와의 AI경쟁을 본격화하고 회사를 필두로 한 SK그룹 차원의 AI밸류체인(가치사슬) 구축에도 속도를 낼 방침이다.
23일 정보기술(IT) 업계에 따르면 SK텔레콤의 추론형 모델 에이닷엑스(A.X) 4.1은 대규모다중작업언어이해(MMLU) 점수 87.3점으로 딥시크 R1(90.8점) 과맞먹는다.
R1의파라미터(매개변수 모델 크기) 가 6710억 개인데 반해 에이닷엑스4.1은 720억 개에 불과해글로벌 수준의 효율을 달성한 셈이다.
에이닷엑스4.1은 또 비(非) 추론형 최신 모델인 오픈AI의 GPT4o보다 한국어 토큰처리 성능이 1.5배높다.
이에 관련비용을 34%절감할 수 있다.
MMLU 점수도GPT4o에 맞먹는 것으로 알려졌다.
올 초 딥시크 쇼크 로 진가가 알려진추론형 모델 개발은 한국 기업들에 특히절실하다는 게 업계의 전언이다.
같은 작업에 드는파라미터와 토큰 비용이 더적을수록 모델 학습과 개발 운영에 드는 비용은 물론 모델 구동에 필요한 AI반도체인 GPU개수도 줄일 수 있기 때문이다.
한국 기업들은 투자 여력 부족으로 조(兆) 단위 파라미터로 커진 글로벌 대규모언어모델(LLM) 규모 경쟁을 따라가기 힘든 데다 그런 LLM을 만든다고 해도이를 구동시킬 GPU를 확보하는 데도국가적으로 난항을 빚는 이중고를 겪고 있는 상황에서 추론형모델이 해법이 될수있다는 것이다.
업계 관계자는 LLM 개발사들이 고객사를 확보하려면 결국 비용 효율성과 해당 분야의 전문 지식이 필요하다 며 추론형 모델은 비용 문제를 개선할 수 있을뿐더러 기존에는 파라미터를 크게 늘리지않으면 어려웠던 복잡한 수학 계산, 과학연구, 코딩, 제조 등 고난도 분야에 특화한 모델로도 응용될 수 있다 고 말했다.
SK텔레콤 역시 그동안 에이닷엑스를 자사AI통화 에이전트(비서) 에이닷 에 탑재하는정도였다면 앞으로는 다양한 고객사확보에 나설 것이라는 관측이 나온다.
SK텔레콤뿐 아니라 국내 주요 기업들이 이 시장에 출사표를 던진 상황이다.
LGAI연구원이 3월 엑사원 딥을 공개한데 이어 양대 플랫폼 네이버와 카카오도자체 기술을 개발 중이다.
네이버는 기존하이퍼클로바X의 추론형 버전을 다음달 출시한다.
이 모델은 벤치마크 심플QA 에서 90.1점을 기록해 GPT4o(90점) 급 성능을 보여줬다.
카카오 역시 언어모델 기반의 추론형 모델을 개발 중이며이르면 상반기 공개할 것 이라고 밝혔다.
라이너 업스테이지 등 AI스타트업들도자체 모델을 출시했거나 준비 중이다.
해외 기업들도 주도권 선점을 위해 앞다퉈 고도화에 나서는 중이다.
구글은 제미나이 2.5프로 와 함께 이를 기반으로한 고급 추론 기능 딥 싱크, 앤트로픽도7시간 동안 스스로 코딩하는 등 자율성을높인 클로드 오푸스4를 최근 공개했다.
샤오미도 지난달 말 70억 파라미터의 미모 를 내놓았다.
SK그룹 차원에서도 이번 추론형 모델출시를 계기로 AI밸류체인 구축에 속도가 붙을 것으로 전망된다.
SK그룹은 SK텔레콤의 AI모델과 데이터센터 등 인프라 사업을필두로 반도체 조달로 이를 떠받치는 SK하이닉스, 최근 사명 변경으로AI 솔루션 조직으로 재편된 SKAX(구SKC&C) 등을 통해 서비스 분야까지 독자적 밸류체인을 구축 중이다.
SK텔레콤은 연내 에이닷 유료화와 북미 버전 에스터 출시, GPU6만장 규모의 AI데이터센터 구축을, SK하이닉스는 엔비디아 등에 고대역폭메모리(HBM) 4조기 공급을추진 중이다.
업계 및 LM아레나 리더보드