본문 바로가기

🏁 IT & Product/🍒 Marketing

AI계 새로운 플레이어의 등장, 딥시크(Deepseek)와 오픈AI

반응형

 

 

 

딥시크(DeepSeek)는 2023년 5월 중국 항저우에서 설립된 인공지능(AI) 스타트업입니다.

딥시크는 AI 기술 분야에서 아주 빠르게 주목받고 있는데요.

저렴하고 접근성이 뛰어단 특징으로 출시 이후 2025 1 27 기준 App Store에서 가장 많이 다운로드된 앱이라는 타이틀을 얻기도 했습니다.

 

딥시크의 주요 특징 및 성과는 다음과 같습니다.

 

딥시크는 저비용 고효율 AI 개발을 목표로 하며, 다음과 같은 혁신적인 기술을 선보였습니다.

일반화된 AI 모델과 달리 DeepSeek 매우 정확하고 맞춤형 응답을 제공하는 중점을 두고 있어

정밀성과 심층성이 필요한 특정분야의 사용자에게 더욱 강력한 도구가 될 수 있습니다. 

 

  1. DeepSeekMoE (Mixture of Experts): AI 모델을 여러 개의 작은 "전문가" 모델로 나누어 효율성을 극대화하는 기술
  2. DeepSeekMLA (Multi-head Latent Attention): 추론 과정의 메모리 병목 현상을 해결하는 기술
  3. 강화학습(RL) 기반 모델: 인간의 평가 없이 AI 스스로 보상 시스템을 구축하는 방식을 채택

주요 모델

딥시크는 다음과 같은 주요 AI 모델을 발표했습니다:

  • 딥시크 V3: 6,710억 개의 매개변수를 가진 대규모 언어 모델
  • 딥시크 R1: 자기 강화학습 기반으로 고급 추론 작업에 특화된 모델, 이를 통해 다른 AI모델에 비해 저비용 가능

성능과 영향

딥시크의 모델들은 다양한 벤치마크 테스트에서 우수한 성능을 보여주고 있습니다:

  • Math-500 테스트에서 90.2점 기록
  • 128,000개의 토큰을 처리할 수 있는 뛰어난 컨텍스트 이해 능력
  • 프로그래밍, 번역, 에세이 작성 등 다양한 작업 수행 가능

비용 효율

딥시크는 약 600만 달러 미만의 비용으로 첫 생성형 AI 모델을 개발했으며,

이는 기존 AI 모델 개발 비용의 약 5%에 불과합니다.

이러한 저비용 고효율 전략으로 AI 산업의 패러다임을 바꾸고 있다는 평가와 관심을 받고 있는데요.

 

딥시크는 핵심 기술을 오픈소스로 공개하여 개발자들이 자유롭게 모델을 활용하고 개선할 수 있도록 하고 있습니다.

이로써 AI 기술 발전과 생태계 확장에 기여할 것으로 기대하고 있습니다. 

 

 

딥시크의 급부상은 전 세계 AI 산업에 큰 영향을 미치고 있으며,

특히 미국의 빅테크 기업들에게는 새로운 도전으로 받아들여지고 있습니다

중국의 AI 기술 발전을 상징하는 딥시크의 성과는

앞으로 글로벌 AI 시장의 판도를 바꿀가능성이 있습니다.

 

 

 


그럼 딥시크는 어떤 방법으로 비용을 절감했다는 걸까요? 

 

먼저 기술적인 기술로는

  1. 최적화된 알고리즘: 딥시크는 더 효율적인 알고리즘을 개발하여 계산 능력 요구를 줄였습니다.
  2. 모델 증류 기술: 대규모 모델을 압축하고 추론 속도를 개선하며 하드웨어 의존도를 낮추는 기술을 사용했습니다.
  3. MoE (Mixture of Experts): AI 모델을 여러 개의 작은 "전문가" 모델로 나누어 효율성을 극대화했습니다.

상대적으로 저렴한 하드웨어 사용 전략

  1. 저렴한 GPU 사용: 고가의 NVIDIA A100/H100 대신 상대적으로 저렴한 H800 GPU를 사용했습니다.
  2. 화웨이 칩 활용: 중국 화웨이의 어센드(Ascend) 910B 칩을 사용하여 비용을 크게 절감했습니다.

기타 비용 절감 요소

  1. 정부 보조금: 중국 정부의 보조금으로 인해 실제 비용이 더 낮아졌을 가능성이 있습니다.
  2. 클라우드 최적화: 비용 효율적인 클라우드 솔루션을 활용하고 자원 할당을 최적화했습니다.
  3. 오픈소스 전략: 핵심 기술을 오픈소스로 공개하여 개발 비용을 분산시켰습니다.

 


 

기타 요인으로는 아래와 같은 의견이 있습니다. 

  1. 특화된 응용 분야: 일반적인 AI가 아닌 특정 분야에 특화된 모델 개발로 비용을 절감했을 수 있습니다.
  2. 데이터 활용 전략: 기존 대형 모델의 응답 데이터를 활용해 더 작은 모델을 훈련시키는 '증류' 기법을 사용했습니다.
  3. 비용 과장 의혹: 일부에서는 딥시크가 비용을 지나치게 축소해서 발표했을 가능성을 제기하고 있습니다.

딥시크의 저비용 고효율 전략은 AI 산업의 패러다임을 바꾸고 있으며, 이는 기존 빅테크 기업들에게 새로운 도전이 되고 있습니다. 그러나 동시에 데이터 유출 의혹 등 논란도 제기되고 있어, 앞으로 이 모델의 정확한 비용 구조와 기술적 세부사항에 대한 더 많은 검증이 필요할 것으로 보입니다.

 

 

 


 

 

딥시크(DeepSeek) 와 챗GPT(ChatGPT) 성능을 비교해보았습니다. 

 

비교항목 DeepSeek ChatGPT
모델 아키텍처 Mixture of Experts (MoE) 트랜스포머 기반 NLP
파라미터 수 671억 개 (37억 활성화) 1.8조 개
수학 정확도 90% 83%
코딩 성능 97% 논리 퍼즐 디버깅 높은 코딩 성능
추론 능력 RL 기반 단계별 추론 복잡한 다단계 문제 해결
창의적 글쓰기 구조적, 사실 기반 콘텐츠 스토리텔링, 창의적 글쓰기
멀티모달 지원 텍스트 전용 텍스트 + 이미지
컨텍스트 윈도우 128K 토큰 200K 토큰
비용 무료, API 비용 저렴 유료 모델, 높은 API 비용
주요 강점 기술적 작업, 코딩, 데이터 분석 창의적 작업, 고객 지원, 일반 문의
주요 약점 창의성 부족, 감정적 표현 제한 기술적 깊이 부족, 높은 운영 비용
 

 

성능비교 참고링크 :  https://www.elegantthemes.com/blog/business/deepseek-vs-chatgpt

 

 

 

 

 

 

 

 

반응형