실리콘밸리 VC가 쓴 DeepSeek 완전 정복: The Great Reset, 드디어 올 것이 왔다.
이 글 하나로 너무나 부풀려진 모든 딥시크 논란 종결!
안녕하세요 이안입니다. 지난주부터 시장을 요동치게 한 DeepSeek 사태가 어느정도 마무리가 지어지는 모습입니다. 저도 계속 팔로우업 하면서 우리 오픈카톡방에서 다양한 의견을 나누었는데 제가 이번주에 샌프란시스코 다운타운으로 이사를 하는 바람이 시간이 없어서 이제서야 뉴스레터를 보내드립니다. 늦은만큼 Late mover의 강점을 살려 이 글 하나면 모든걸 이해하시고 월요일 회의에 도움되시도록 잘 정리해보겠습니다. 참고로 뉴스레터가 너무 길어서 이메일에서는 모든 내용을 보실수 없으니 제 홈페이지인 ianpark.vc 로 오셔서 전문을 보시기를 추천드립니다.
기술 수렴한다고 “했제?”, 엔비디아 버블있다고 “그랬제?”
기본적으로 DeepSeek은 제가 2022년부터 꾸준히 외쳐왔던 “기술은 수렴한다, 소비자 경험이 더 중요하다”의 방점을 찍은 사건이라고 생각합니다. 제 글들중 가장 많은 조회수를 보여준 작년 2월에 쓴 Nvidia 버블론과도 맞닿아있는 부분이구요. 동시에 모델이 커지는 것에 대한 ROI가 줄어들고 있고 효율화, 최적화로 대세가 넘어간다는 주장과도 맞닿아있구요.
이 대부분의 주장이 이번 DeepSeek 사태의 최대 피해자라고 여겨지는 OpenAI와 Anthropic과 같은 Closed AI들의 “전문가들” 주장과는 상반되었기때문에 비주류 의견으로 치부되었지만 DeepSeek은 저를 포함한 “인공지능이 세상을 바꿀 것은 믿지만, 그 버블을 경계하던 많은 투자자들”에게 그들의 이해가 옳았다는 것을 증명해주었습니다.
그렇다고 알트만이나 다리오가 악의를 가지고 거짓말을 했다는 주장은 아닙니다. 그들은 그들의 인센티브에 맞춰 행동했을뿐이라고 생각합니다. 이발사에게 내가 이발이 필요한 것 같냐고 물으면 언제나 필요해보인다고 대답하는 것과 마찬가지인 셈이죠.
저의 인센티브는 뭐냐구요? 저는 실리콘밸리의 헨젤과 그레텔로써 앤드류응 교수님이나 주변의 최고의 VC들이 흘리는 인사이트 부스러기를 주워먹으며 그걸 바탕으로 트렌드를 이해하고 좋은 글을 써서 좋은 창업자분들을 찾고 설득하는 것이 저의 인센티브입니다. 그러니 나중에 부끄럽지 않은 글을 쓰려고 늘 노력하고 있고 이런 글들이 구독자분들께 도움이 되었으면 좋겠습니다.
아무튼 victory lap은 여기까지만하고 이번 사태에 대해 기초부터, 부풀려진 부분, 잘못 알려진 부분, 그리고 제가 생각하는 승자와 패자, 앞으로의 트렌드에 대해서 정리해보았습니다.
1. 도대체 DeepSeek이 뭔가요?
DeepSeek은 2023년에 창립된 중국의 인공지능 스타트업으로, 퀀트샵인 헤지펀드 High-Flyer에서 분사한 자회사로 최근 두개의 인공지능 모델을 발표했습니다.
DeepSeek-V3: 2024년 말에 출시된 모델로 GPT-4o 및 Claude 3.5 Sonnet와 비슷한 성능과 역할입니다.
DeepSeek-R1: 2025년 1월에 출시된 모델로 OpenAI의 o1 모델과 비슷한 성능과 역할입니다
에, 그냥 또 하나의 인공지능 회사인데 왜 난리죠?
바로 성능, 비용, 오픈소스, 제조사, 그리고 국적때문에 그렇습니다.
결국 인공지능의 선두주자라고 불리는 OpenAI와 비슷한 성능의 모델을, OpenAI의 5%밖에 되지 않는 훈련비용으로, 미국이 아닌 중국에서, 최신 Nvidia GPU도 없이, 작은 헤지펀드의 자회사가, Closed source인 OpenAI와 다르게 Open Source(트레이닝 데이터를 공개하지 않았으므로 정확히는 Open Weight)로 만들어냈다는게 시장에 큰 충격을 준 것이죠.
2. 그런데 이거 다 믿을 수 있는 걸까요?
일단 중국회사이기때문에 진실성에 대한 어떤 의심이 존재하긴 하지만 오픈 소스로 공개한만큼 금방 들통날 거짓말을 하였다고 생각하진 않습니다. 성능의 경우는 바로 모두가 테스트하고 체감하고 있는 부분이고 비용의 경우는 오해가 있었다고 생각합니다.
압도적으로 낮은 비용? 언론에 의해 부풀려졌을 것
그보다 저는 딥시크가 한말을 제대로 이해하지 못했거나 안하고 자극적인 기사들을 내보낸 언론의 문제점도 있다고 생각합니다. 제 생각에 이번 사태에서 가장 중요한 부분은 아래 기사와 같이 “중국 모델이 성능은 OpenAI와 비슷한데 모델을 만드는데 든 비용이 5%밖에 되지 않는다”인데 이 부분에서 비용에 대한 서로의 비교 대상이 잘못되었다고 생각합니다.
Open-source DeepSeek-R1 uses pure reinforcement learning to match OpenAI o1 — at 95% less cost
지금 비교하는 부분은 샘알트만이 2023년에 추산한 OpenAI의 GPT-4의 훈련비용 $100M과 DeepSeek의 V3의 비용으로 밝힌 $5M인데 그 정의가 다르다고 생각합니다.
2023년초에 비해 2024년말의 인공지능 모델을 만드는 비용은 현저히 낮아졌기때문에 마치 과거 가격을 인플레이션으로 조정하는 것과 같이 조정이 필요한 부분도 있습니다.
DeepSeek의 경우 최종 모델을 훈련하는 그 비용만을 계산한 것이고, OpenAI의 경우 그 모델을 만드는데 들었던 여러번의 시도를 포함해 개발과 GPU구매와 같은 부분까지도 어느정도 포함했다고 보여집니다.
이와 관련해 찾아보다보니 비슷한 고민을 하는 덕후들이 올린 글을 어제 찾았는데 엔비디아의 H100 GPU를 시간당으로 대여를 해서 훈련하는 것으로 정의했을때 OpenAI GPT-4와 Claude Sonnet도 $30M정도로 분석이 되었고 Anthropic의 CEO인 Dario도 “tens of millions of dollars”라고 발언하면서 어느정도 설득력이 있어보입니다.
더군다나 DeepSeek의 경우 OpenAI나 Anthropic같은 최신 모델들의 답변으로 본인들의 모델을 다시 훈련을 시키는 distillation 방식을 사용하였기때문에 raw data를 가지고 훈련시키는 미국 인공지능 회사보다 비용이 더 낮을수밖에 없습니다. 사실 이건 OpenAI의 정책위반이라서 알트만이 화를 내고있지만, 솔직히 본인들도 인터넷에 있는 저작권있는 데이터를 가지고 ChatGPT를 만든 입장이라 이미 오픈소스로 모델을 전세계에 풀어버린 중국의 회사를 현실적으로 문닫게 할수있는 방법도 없습니다.
따라서 만약 DeepSeek의 남의 모델을 쓰지않고 최종모델을 만드는 비용만 OpenAI도 같은 조건으로 최종모델을 만드는 비용만 2025년 기준으로 동시에 비교한다면, DeepSeek의 비용은 남의 모델을 사용하지 않으면서 올라가고, OpenAI의 비용은 최종 모델 비용만 고려하고 트레이닝 비용이 낮아졌음을 고려했을때 둘의 최종 모델에 대한 훈련 비용은 1/10 가격은 커녕 생각보다 크게 차이가 나지 않을수도 있다는 분석도 가능합니다.
OpenAI를 넘어선 기술? 이 또한 언론에 의해 부풀려졌을 것
이 부분은 제 의견이 논란이 될수도 있을거같은데, 저는 DeepSeek의 기술력이 OpenAI보다 뛰어나다고 생각하지 않습니다. 제 생각에 DeepSeek은 OpenAI가 o1을 만들면서 공유했던 다양한 연구들을 참고하여 OpenAI가 만든 o1을 복제 replicate 하는데 성공했다고 생각합니다.
제가 왜 이렇게 생각하냐면, (1) 우선 성능이 o1과 비슷하기때문에 같은 접근을 하고 있다는 생각이 들었고, (2) 딥시크의 R1의 성과가 인센티브 기반인 강화학습을 통해 이뤄냈다고 발표하였는데 관련해서는 지난 1월 UKF 82스타트업의 인공지능데이에 오셔서 저에게 1:1로 40분동안 고문당하셨던 OpenAI의 정형원 박사님께서 2024년 9월에 이미 MIT에서 강연을 한 내용입니다.
이런 점을 비추어볼때 딥시크는 이런 OpenAI의 힌트들을 이용해서 OpenAI가 이용한 방법론을 복제해내는데 성공했다는 가설도 어느정도 설득력이 있다고 보고, 이 부분과 남의 모델을 이용해 distillation을 통한 모델 성능향상등을 종합적으로 고려했을때 DeepSeek가 OpenAI보다 뛰어난 기술력이 있다는건 좀 과장된 부분이 있지않을까 생각합니다. 다만 DeepSeek이 OpenAI의 최신 모델을 이렇게 빨리 복제할수있다는게 OpenAI의 기술의 해자에 대해 다시 생각해보게 만드는 부분은 있습니다.
그리고 제가 지금 글을 쓰고 이 순간 OpenAI의 o3-mini가 출시되었고 (o2를 건너뛴 이유는 아마 영국 통신사 o2랑 이름이 겹쳐서 그런게 아닐까…), 당연히 o1과 비슷하거나 더 뛰어난 성능을 보여주고 있습니다. 여담이지만 저는 이번 o3의 성능 향상이 대단하긴해도 지금의 패러다임을 바꾸는 정도라고 하기에는 부족하고 점점 더 큰 모델을 찾던 scaling law도 수렴했듯이 점점 더 긴 추론을 찾는 scaling law 또한 점차 수렴해나갈 것이라고 믿습니다.
에이, 그럼 별거 아니네요? 또 그렇진 않습니다.
그렇다고 해서 아무것도 아니라고 할수는 없습니다. 반도체 관련 규제를 받고있는 중국의 회사이자 헤지펀드의 자회사에 불과한 새롭고 작은 회사가 이런 일을 해냈다는게 정말 놀라운 부분이죠. 특히 본인들에게 주어진 상황, 즉 Nvidia의 최신 GPU에 대한 엑세스가 떨어진다는 부분을 floating point의 최적화등으로 계산량을 줄이면서 해결할 것은 굉장히 인상적이고 모두에게 도움이 되는 기여라고 생각합니다.
그리고 이미 가는 길에 대한 힌트를 알고있다고 해도, 그 힌트들을 다 조합하여 이렇게 현존 최고의 모델 SOTA 성능의 모델을 만들어내는 능력자체도 대단하고 좀 더 규제로부터 자유로운 상황에서의 강점을 극대화한 접근(남의 모델로 내 모델 훈련하기)을 취하고 대부분의 것들을 오픈소스로 밝히고 공유한 것은 대단하다고 봅니다. 동시에 압도적으로 낮은 가격으로 o1과 비슷한 성능의 모델을 제공할수 있다는건 정말 놀랍죠.
근데 잘했긴한데 어차피 메타나 구글이 했을것…
다만 저는 이번에 o1모델과 비슷한 모델을 DeepSeek이 내놓은 것은 대단하지만 동시에 DeepSeek이 아니었더라도 구글이나 메타에서 금방 따라잡았을거라고 생각하고, 이미 알리바바의 Qwen 2.5 Max나 Allen AI라는 마이크로소프트의 공동창업자 Paul Allen이 2014년에 만든 비영리 연구소에서도 강화학습을 이용해서 DeepSeek V3를 뛰어넘고 GPT-4o에 견주는 모델을 완전 오픈소스로 발표했고 o1과 같은 추론모델도 곧 또 나올거라고 생각합니다.
결론적으로 제 생각에는 결국 순서의 문제였지, 누군가는 o1을 따라잡았을 것이고, 따라잡는데 걸리는 시간은 점점 더 줄어들고 있으며, 점점 더 많은 곳들이 따라잡을수 있는 역량을 갖추어가고 있다는 겁니다. 인공지능 모델회사들의 기술력이 수렴하고 있고 민주화되어가고 있다는 증거죠.
3. 이번 사태 승자와 패자는?
승자: 빅테크, 창업가들, 그리고 우리 모두
솔직히 완벽한 승자와 패자는 없다고 생각하지만 아무래도 수혜를 입은 곳들은 OpenAI와 Anthropic에 기술적으로 밀리던 빅테크들이라고 생각합니다. DeepSeek덕분에 이들은 손안대고 코 푼격이고 이제 가진 자금력과 인프라, 고객층을 기반으로 더 좋은 서비스, 어플리케이션을 만들면 됩니다.
다만 저는 이와 관련해 약간 아쉬운 부분도 있는데, 어떻게보면 빅테크가 너무 큰 힘을 가지고 있고 트렌드의 변화에도 계속 맞춰 변화하고 살아남으면서 그 권력의 집중이 걱정되던 시기에 OpenAI라는 메기가 나타나면서 뭔가 기존 질서의 재편이 기대되었지만 이번 사태로 그 변화가 또 조금 더 멀어진게 아닌가라는 생각이 듭니다.
동시에 창업가들에게도 아주 좋은 기회가 왔습니다. 아래 글에서 말씀드린 것처럼 Llama 3.1부터 계속 이어지는 오픈소스와 저렴한 모델들이 비싼 클로즈드모델들의 성능을 따라잡는만큼, 아주 저렴한 비용으로 최고의 인공지능을 사용할수있게되었고, 이를 이용해 어플리케이션을 빠르고 저렴하게 만들수 있는 시대가 온 것입니다.
당연히 소비자인 우리 모두에게는 더 많은 경쟁은 더 저렴하고 수준높은 서비스를 제공하기때문에 이러한 경쟁은 당연히 좋고, 이번 사태로 인해 API가격이 또 한번 폭락하면서 더 많은 인공지능 서비스와 어플리케이션이 나올 것이라고 기대합니다.
패자: OpenAI, Nvidia, VC들
OpenAI
가장 속이 쓰릴만한 곳은 당연히 OpenAI라고 생각합니다. 본인들의 기술적 우위가 큰 해자가 아니었음을 이제는 모두가 알아버렸고 훨씬 더 낮은 가격으로 비슷한 수준의 서비스를 제공하면서 현재 가격 책정에 대한 의구심마저 들게되었죠. 제가 여러번 말씀드렸다시피 오픈소스와 데이터문제때문에 인공지능 파운데이션모델 회사들의 마진률은 앞으로도 계속 낮아질수밖에 없다는 생각이 듭니다. 솔직히 그 가격을 유지하기위해 이들은 모델을 만드는데 비용이 아무 많이드는 것처럼 부풀린 경향도 있다고 생각하고 오히려 그때문에 역풍을 심하게 맞은 부분도 있다고 생각합니다. 그리고 저는 AGI에 대한 과도한 낙관론이나 인공지능의 위험에 대한 과도한 경계도 비슷한 맥락에서 본인들의 우월함을 강조하기 위한 행위였다고 생각합니다.
결국 o1모델이 1.5개월만에 따라잡힌건 이래저래 OpenAI에게는 큰 타격이라고 봅니다. 그렇게 강조하던 기술력이 생각보다 쉽게 따라잡혔고, 따라잡히는 속도가 점점 빨라지고 있으니까요. 그래서 o3를 급하게 내놓았지만 크게 감명깊진 않았고, 스타게이트 프로젝트는 아래 스레드글에 썼듯이 안그래도 의심의 눈초리가 많았는데 이번 사태로 더 돈을 모으기가 쉽지 않아진 것 같습니다 (앞으로 이런 짧은 글을 Hot Take라는 섹션으로 이 홈페이지에 올리고 이메일로 보내드릴 예정입니다. 원치 않으시는 분들은 이 부분만 구독취소가 가능하실 겁니다!)
지금 또 다음라운드를 준비하며 자금을 모으는데 $40B 타겟이고 소프트뱅크가 절반정도를 투자할 것이라는 소문이 있습니다. 과연 잘 모을수있을지 지켜봐야할 것 같습니다.
뭔가 소뱅이 투자한다고 하니까 위워크의 아담뉴먼이 떠오르는 밤이네요.
또 한가지는 애초에 만든 취지 및 이름과 정반대로 오픈소스가 아닌 클로스즈소스의 대명사가 되어버린 OpenAI가 이번일을 계기로 좀더 오픈되지않을까라는 기대도 있습니다. 아래는 레딧에서 이루어진 Ask Me Anything에서 알트만이 한 답변인데 OpenAI의 오픈소스 전략에 긍정적인 변화가 있을수도 있을 것 같습니다. 그리고 이미 o3-mini의 경우 그동안 숨겨왔던 추론의 단계 Chain-of-Thought 를 공개하기 시작했네요.
Nvidia
엔비디아의 경우 “승자이다”라는 평가가 많은데 ,개인적으로는 패자에 가깝다고 생각합니다. 물론 인공지능의 저렴해지고 접근성이 올라가면서 더 많이 사용하게되고 그럼 GPU가 더 필요할수도 있다는 의견도 어느정도 공감은 합니다. 다만 이번 사태로 거의 독점이나 다름없던 엔비디아의 위치와 수요에 대한 기대가 무너진 것이 저는 훨씬 더 큰 피해라고 생각합니다.
(1) training과 inference에서 inference 시장이 더 커질 것이라고 여러번 말씀드렸는데 이 부분에서 inference는 Cerebras, Groq, AMD, Intel과 같은 대체제가 많은 상황이고 빅테크들도 독자적으로 칩을 개발하고 있으며 (2) 최근 강화학습을 통한 reasoning model들이 메인스트림이 되었고 이들은 동시 연산보다는 차례로 연산을 필요로 하기때문에, GPU의 장점인 동시연산이 빛이 바래는 부분도 있습니다. (3) 또한 엔비디아의 해자로 알려졌던 CUDA로 만든 코드를 엔비디아 GPU뿐만 아니라 다른 GPU에서 구동하도록 번역하는 것도 DeepSeek의 R1같은 저렴한 모델을 통해 더 쉬워지지않을까 생각합니다.
물론 엔비디아가 망할 것이다!라는 말은 저는 예전 글에서도, 지금도 한적이 없습니다. 뛰어난 회사이고 좋은 회사임에는 틀림없지만, 주식 가격에 거품이 많이 끼어있고 20x나 되는 forward sales multiple과 75%의 마진율은 앞으로 지키기 어려울 것이라는 생각입니다.
VCs
VC들중에서는 파운데이션모델에 과도하게 투자한 VC들이 펀드의 존폐의 위협까지 느끼고 있다는 소문이 들고있습니다. 너무 비싸게 많이 투자해뒀는데 이렇게 저렴하고 좋은 대체제가 나와버리니 걱정이 될수밖에 없죠. 남들과 함께 FOMO에 휩쓸려 투자를 한 결과는 아마 참담할 것입니다.
한가지 기억해야할 건 영원한 승자도, 영원한 패배자도 없다는 점입니다. 지금 이 순간, 오늘까지는 승자와 패자가 이렇게 나누어져있다고 생각하지만 이는 언제 또 금방 바뀔지 모르니까요.
4. 다른 자주하는 질문들
어떻게 중국이 이렇게 할수있었던거죠? 이제 중국이 미국을 앞서나가나요? 스푸트니크 모먼트인가요?
사실 중국의 인공지능 분야에서의 미국에 대한 위협은 업계에서는 오래전부터 대두되어 왔으며 저를 포함해 다들 규제도 없고, 인재도 많은 중국이 미국보다 앞서나갈수도 있다고 생각을 하고 있었고 어떻게든 막아야한다는데 대부분 동의하는 분위기입니다. 일단은 반도체 규제로 어느정도 억제가 가능하다고 생각했던 것이 오판으로 판명난 것이 안그래도 중국에 대한 경계심이 그 어느때보다 높은 상황에서 시장의 패닉을 불러왔다고 생각합니다.
그렇다고 하더라도 앞서 말씀드린 것처럼 저는 중국의 인공지능 기술력이 미국보다 뛰어나지는 않다고 생각하고 러시아가 미국보다 인공위성을 쏘아올려 해서 미국인들을 패닉에 빠트렸던 스푸투니크사태와는 좀 결이 다르다고 봅니다. 여전히 최고의 인재들과 자금은 실리콘밸리에 몰려있고 인공지능 기술은 미국이 리드하고 있다고 생각하고 이 추세는 앞으로도 변하지 않을 것이라고 생각합니다. 중국에 대해서는 미국이 정부차원에서 계속해서 견제할 것이고 투자자들도 거리를 두려고 노력을 할 것이라고 생각하기때문에 중국도 계속 좋은 성과를 보여주겠지만 미국을 넘어서기는 힘들 것이라고 생각합니다.
사실 이번 사태는 중국의 기술력을 보여준 부분도 있지만 더 중요한건 기술을 계속해서 수렴하고 있고 지금의 파운데이션 모델회사들의 기술적인 해자는 오래가지 못한다는 부분입니다.
딥시크 써도 되나요? 데이터유출에 대한 걱정은요? 미국서버에 직접 돌리면 해결가능
아시다시피 딥시크는 단 몇일만에 미국 앱스토어에서 ChatGPT를 제치고 무료 앱들중에서는 1등을 차지했습니다. 그럼에도 불구하고 저를 비롯한 실리콘밸리 VC들중에는 딥시크앱을 안깐 사람들이 제법 있는데요, 아무래도 중국앱이다보니 폰에 깔기에는 보안이 걱정되긴 합니다.
일단 지금 딥시크에서 직접 제공하는 API나 앱에 대해서는 아직까지 안심하긴 이르다는 생각도 들긴하는데 Perplexity와 MS Azure와 같이 오픈소스인 모델을 가져와서 미국 서버에서 돌리면 상대적으로 안전한 것은 맞다고 생각합니다.
개인적으로 곧 메타와 구글과 같은 빅테크가 딥시크의 모델을 뜯어보고 똑같이 만들 것이기때문에 그때 그들의 모델을 쓰는게 가장 좋은 방법이 아닐까 생각합니다.
인프라투자가 줄어들까요?
개인적으로 인프라에 대한 투자가 줄어들 이유는 없다고 생각합니다. 다만 과거와같이 엔비디아 GPU에 집중된 인프라 투자가 아니라 추론위주로 방향을 틀어야한다고 생각하고, 이는 더 다양한 제품과 자산에 대한 투자를 권장할 것이라고 생각합니다.
CUDA안쓰고 PTX쓴다던데요? 엔비디아 망하나요?
제가 전문가는 아니지만 PTX는 high-level CUDA와 low-level GPU사이의 중간 코딩 언어이고 이를 수정하여 효율성을 높이는건 사실 이미 최고의 인공지능 회사들과 헤지펀드들은 다들 하고 있다고 알려져있습니다. 그리고 PTX 역시 엔비디아 생태계의 일부이기때문에 CUDA가 아니라 PTX를 쓴다고해서 엔비디아 생태계를 떠날수있다는 것은 잘못된 정보라고 봅니다. 사실 이것보다 CUDA를 다른 곳에서 쓸수있게 번역해주는 인공지능이 나오는게 엔비디아에게는 더 큰 위협이 되지 않을까 생각합니다.
5. 그렇다면 앞으로는 어떻게 될까?
오늘도 지내보는 기우제
(참고로 뉴스레터가 너무 길어서 이메일에서는 아래 내용을 모두 보실수 없으니 제 홈페이지인 ianpark.vc 로 오셔서 전문을 보시기를 추천드립니다)
VC를 비롯한 투자자들은 어쩌면 미래를 예측하는 직업이라고 생각합니다. 그리고 미래를 예측하기 위해서는 방향성과 타이밍이라는 두가지를 다 맞춰야하는데, 저는 VC로써 타이밍을 맞추는게 너무 어렵다고 느껴서 방향성에 더 초점을 두는 편입니다. 그러다보니 전형적인 기우제 제사장 타입으로, 자세한 디테일이나 타이밍은 모르지만 트렌드의 큰 그림을 이해하려고 노력하는 편입니다.
따라서 제 말은 듣고 엔비디아 주식을 숏치시거나 파신분들은 타이밍이 안맞아서 돈을 잃거나 벌지 못하셨을거라고 봅니다. 다만 언젠가는 엔비디아의 버블이 세상에 알려질 것이라고 생각했고 그 시작점이 딥시크가 아닐까 생각합니다. 다시한번 말씀드리지만 엔비디아도 OpenAI도 위대한 회사라고 생각합니다. 하지만 좋은 투자인가, 버블이 없는가에 대한 의문을 제기해보자는게 제가 쓴 글들의 취지입니다. 그럼 기우제 7가지 더 지내보도록 하겠습니다.
오픈소스가 더 중요해질 것이다
OpenAI GPT-4의 경우 Anthropic의 Claude와 Meta LLama가 성능을 따라잡는데 각각 12개월과 16개월정도가 걸렸습니다. GPT-4o의 경우는 Claude가 따라잡는데 6개월 걸렸다고 보고 구글 Gemini는 8개월정도가 걸렸다고 생각합니다. 하지만 o1의 경우 DeepSeek이 따라잡는데 겨우 1.5개월, 46일이 걸렸습니다.
물론 OpenAI가 Startgate등을 위해 거대한 추가 펀드레이징을 계획하면서 급하게 o3-mini를 발표하면서 다시 갭이 벌어졌지만 저는 이 갭이 그렇게 오래가지는 않을 것이라고 생각합니다. 또 한가지는 o3-mini를 발표하면서 API 가격은 90% 낮췄음에도 불구하고 여전히 DeepSeek의 2배인 상황입니다.
여기서 제가 전에 말씀드린 가격 대비 성능에 대한 고민이 나올수밖에 없죠. 꼭 모든 사람이 모든 상황에서 최고의 모델을 비싼 가격을 주고 써야하는 것은 아니니까요. 그래서 저는 저렴하고 쓰기편한 오픈소스 모델들이 앞으로도 더 중요한 트렌드이자 메인스트림이 될수도 있다고 생각합니다.
기술보다는 소비자경험
이젠 지겨우실만도한데 저는 VC로써 기술은 결국 수렴하고 소비자경험이 가장 중요하다고 생각하는 편입니다. 물론 연구가 너무 힘들고 어렵지만 오히려 기술 개발이 소비자들의 마음을 얻는 것보다 더 쉬울수도 있다고 생각하구요. 이러한 관점에서 기존 소비자들에게 좋은 접근성을 가지고 있는 구글과 같은 빅테크가 지금의 인공지능 경쟁에서도 유리할 것이라고 생각하고 앞으로 나타날 많은 인공지능 어플리케이션 스타트업들도 기술보다는 소비자경험이 압도적인 곳이 이길 것이라고 생각합니다. 이와 관련해서는 아래 두 글에 좀 더 자세히 적어두었습니다.
B2C 킬러앱이 등장할 것
인터넷시대의 구글, 메타, 아마존, 모바일시대의 애플, 우버, 클라우드시대에 넷플릭스, 유튜브, 스포티파이등 새로운 기술 패러다임이 등장할때마다 B2C 킬러앱들이 등장했고 이번 인공지능 시대에도 저는 크게 다르지 않을 것이라고 생각합니다. 이걸 찾기위해 오늘도 저를 포함한 많은 VC들이 오늘도 열심히 뛰고 있습니다!
소형화, on-device, privacy
지금 DeepSeek를 쓰면서도 다들 걱정하는 부분이 privacy입니다. 솔직히 저는 Tiktok은 물론이고 OpenAI를 쓰면서도 비슷한 걱정을 하는데 이 부분을 해소해주려면 모델이 작고 가벼워져서 on-device로 올라가야한다고 생각하고 이미 더 작은 버전의 R1도 딥시크에서 개발중인 것으로 알려져있습니다. 또한 캘리포니아 버클리 대학에서 단돈 30달러로 R1-Zero 모델과 비슷한 성능을 가진 아주 작은 3B개의 변수를 가진 모델을 만들어냈다는 기사도 등장했습니다.
이 트렌드를 피할수없고 어쩌면 모델의 경량화와 효율화를 통해 작은 디바이스에 들어가게 된다면 더이상 아이폰이 아니라 다른 모습의 하드웨어가 나올수도 있다고 생각합니다. 이 내용도 아래 글에서 더 자세히 다뤄보았습니다.
중국에 대한 경계: 트럼프가 대통령이 된 이유
그 어느때보다 중국에 대한 경계가 정부뿐만아니라 투자자들과 국민들사이에도 높은 상황이고 저는 이 부분이 트럼프 대통령이 당선되는데 큰 역할을 했다고 생각합니다. 그리고 이번 사태를 계기로해서 중국의 인공지능에 대한 견제가 저는 더욱 심해질 것이라고 보고 개인적으로는 그게 미국을 위해 맞는 방향이라고 생각합니다. 이미 미국은 캐나다와 멕시코에도 관세를 매기면서 무역전쟁을 시작했는데 중국과는 더 심한 무역전쟁이 벌어지지않을까라는 생각도 듭니다.
트럼프 대통령과 실리콘밸리에 대해서는 아래글에 자세히 정리해보았습니다.
모델의 크기가 아니라 추론 시간으로 확장; 하지만 결국 수렴
이것도 입이 아프게 말씀드렸는데 결국 큰 모델에 대한 scaling law는 이미 diminishing returns on scale에 도달해서 더 크게 만드는것은 비용대비 성과가 떨어지고 (OpenAI는 본인이 가진 자금력으로 이겨야했기때문에 이걸 계속 강조했다고 생각함…), 이러한 scaling law의 트렌드는 추론 시간의 확장으로 넘어가고 있는 추세입니다. 하지만 저는 이 부분도 기술이 곧 수렴하는 비슷한 결과를 보여줄 것이라고 생각하고 그 시작이 딥시크사태라고 생각합니다.
새로운 알고리즘에 대한 연구 확대
개인적으로 점점 기술이 수렴하고 있고 환각등을 포함해 트랜스포머기반 모델들의 한계가 보이고 있다고 생각하기때문에 이를 벗어나기위한 다양한 시도들이 앞으로는 더 많아질 것이라고 생각합니다. 다만 이 한계라는 것은 기술적인 부분이고 현실적으로는 지금까지 나온 모델들만으로도 어마어마한 밸류를 만들고 세상을 바꿀수있다고 생각해서 굳이 기다릴 필요없이 지금 가진 것들을 얼마나 잘 조합하고 소비자들에게 가치를 창출해줄수 있는가가 정말 중요한 시기라고 생각합니다.
The Great Reset: 모두에게 다시 한번 기회가 주어졌다.
오늘의 결론중 제일 중요한건 바로 모두에게 다시 한번 기회가 왔다는 부분이라고 생각합니다. 사실 중국도 했는데 한국은 왜 못하냐에 대한 토론도 많았고 그 부분을 글로 쓸까했는데, 그것보다는 속도가 중요한 지금 이 순간 우리가 당장 해야할 일은 복기나 자책이 아니라 지금 이 사태를 최대한 이용해야한다는 것이라고 생각합니다.
이번 사태의 가장 중요한 시사점은 DeepSeek R1을 통해 다시 모두가 동일선상에서 경쟁을 해볼수있는 평평한 운동장이 되었다는 것입니다. 그리고 기업들, 창업자들, 투자자들 모두 이 기회를 놓쳐선 안되고 최고의 어플리케이션을 만드는데 다함께 집중하고 노력해야하는 시기가 아닐까 생각합니다.
이번 기회를 놓치고 싶지않은 인공지능 B2C 어플리케이션을 개발하시는 창업자분들께서는 언제든 제 커피챗링크나 ipark@sazze.vc로 연락주세요. 그럼 다음 구글을 만드실 대표님들의 연락을 기다리고 있겠습니다. 감사합니다.
코로나 시즌 클럽하우스때부터 듣던 회원입니다 :)
바쁘신 와중에도 딥시크 관련 뷰 공유해주셔서 감사합니다.
AI 합성 이미지는 별도로 표시했으면 좋겠습니다.