딥시크의 '지식 증류' 기술은 지적재산권 도용일까?🤖
작성자 생크션랩
딥시크의 '지식 증류' 기술은 지적재산권 도용일까?🤖

최근 AI 업계를 뒤흔든 중국 소규모 AI 스타트업 '딥시크(DeepSeek)'. 딥시크가 개발한 오픈소스 AI 챗봇이 엄청난 속도로 성장하면서 전세계가 깜짝 놀랐는데요. 미국 대표 AI 챗봇(OpenAI 등)보다 훨씬 적은 비용으로 개발됐고, 연산 자원도 1/10 수준밖에 안 들었기 때문이죠.
💥그런데 최근 오픈AI와 딥시크 사이에 논란이 일어났어요.
딥시크가 '지식 증류(Distillation)'라는 기술을 사용해 ChatGPT 출력을 기반으로 자체 모델을 훈련했다는 의혹이 제기된 거죠.
*본 컨텐츠는 Law360에 3월 7일자 게재된 ‘딥시크의 지식 증류는 지적재산권 도용인가?(Is AI Distillation By DeepSeek IP Theft?)를 요약 및 정리한 것입니다.
💡 지식 증류(Distillation)란?
작고 효율적인 AI 모델(학생 모델)이 큰 AI 모델(교사 모델)을 모방하면서 성능을 끌어올리는 기술이에요. 쉽게 말해, 큰 모델이 만든 출력을 작은 모델이 배우는 거죠. 그래서 비용도 줄고 배포도 쉬워진다는 장점이 있어요.

여기에 캡지식증류 개요도/Cornell University Arxiv 캡쳐션을 입력하세요
🚨 그럼 이게 저작권 침해일까?
지식 증류는 법적으로 명확하게 저작권 침해로 규정돼 있지 않습니다. 미국 저작권법은 '인간의 창작'을 보호 대상으로 삼아요. 그래서 AI가 만든 콘텐츠 자체는 저작권 보호를 받기 어렵죠.
즉, 오픈AI는 ChatGPT의 '출력 자체'를 저작권으로 보호받지 못하기 때문에, 딥시크가 이 출력을 학습 데이터로 쓴 걸 저작권 침해라고 주장하기는 애매한 상황인 겁니다.
또 오픈AI 이용약관을 보면, "사용자가 생성한 출력물에 대해 소유권을 주장하지 않는다"고 명시돼 있어요. 그래서 딥시크가 ChatGPT 출력을 학습했다고 해도 오픈AI가 저작권 침해를 입증하기는 어렵죠.
심지어 오픈AI도 인터넷상의 데이터를 대규모로 크롤링(Crawling)해서 모델을 학습시킨 전력이 있기 때문에, 스스로 내세웠던 저작권 방어 논리를 뒤집어야 하는 난관이 존재합니.
📑 특허나 계약 위반으로 기소?
오픈 AI가 '출력 자체'에 대한 특허를 보유하고 있을 가능성은 굉장히 낮아요. 그래서 이를 문제 삼기는 현실적으로 어렵고, 그나마 가능성이 있는 건 계약 위반을 주장하는 방법입니다. 오픈 AI 이용약관 중 “사용자는 AI 모델의 출력을 자동으로 크롤링하거나 프로그램적으로 추출해서는 안 된다”는 내용을 근거로, 계약 위반으로 문제 제기를 하는 것이 현재로선 가장 현실적인 방법이랍니다.
💡 미국 정부의 움직임
현재 미국 정부도 딥시크 사용 금지 조치를 추진 중이에요. NASA랑 뉴욕주 정부는 이미 딥시크 사용을 금지했고, 미국 하원도 정부 기기에서 딥시크 사용을 금지하는 법안(No DeepSeek on Government Devices Act)을 발의했어요.
🔮 결론
이번 사건은 AI 산업에서 법적, 윤리적 문제를 어떻게 다룰지 큰 숙제를 남겼어요. 기술 발전과 지적재산권 보호 사이에서 균형을 맞추는 건 앞으로도 계속 논의가 필요할 것 같아요!