저자: 웨이시(Wei Xi) 출처: 웨이시즈베이(Wei Xi Zhibei)
AI에게 이렇게 간단한 질문을 한다면 -
"현무문 사건이 끝난 날, 리 시민은 늦은 밤 독백을 썼습니다. 그가 무엇을 쓸 것이라고 생각하십니까?"
AI가 어떻게 대답할 것 같나요?
AI의 놀라운 답변을 공개하기에 앞서, DeepSeek 출력 결과에 대한 웨이보 네티즌의 댓글을 먼저 살펴보겠습니다——
네, 이 질문은 간단해 보이지만 놀라운 답을 찾기는 쉽지 않습니다.
현무문 사건의 역사적 배경, 죄책감, 투쟁, 야망, 야망 등 리세민이 가질 수 있는 복잡한 심리, 글의 어조와 정체성의 통일성, '후기'와 같은 문제의 설정 등을 고려할 필요가 있다. 밤'과 '독백'이요. 물론이죠.
최근 AI계를 충격에 빠뜨린 DeepSeek R1 모델이 어떻게 생각하는지 살펴보겠습니다. 다음은 놀라운 답변을 제공하기 전 똑같이 놀라운 사고 과정입니다——
좋아, 사용자는 Xuanwumen 사건이 끝난 후 늦은 밤 Li Shimin이 쓴 독백에 대해 생각해 보라고했습니다.
먼저 현무문 사건의 역사적 배경을 검토할 필요가 있다. 이 쿠데타는 626년에 일어났습니다. 이세민은 그의 형제인 이젠청(Li Jiancheng)과 이원길(Li Yuanji)을 죽인 후 아버지 이원(Li Yuan)을 강제로 퇴위시키고 당 태종 황제로 왕위에 올랐습니다.
다음으로 이용자의 질문은 그날 밤 리시민의 심리 활동에 관한 것이었다. 독백을 쓰려면 그의 내면 세계로 깊이 들어가야 합니다. 우선, 우리는 그의 감정을 고려해야 합니다. 승리 후의 복잡한 기분은 안도감, 죄책감, 두려움, 자책 및 기타 감정이 혼합될 수 있습니다. 그는 쿠데타를 일으키도록 강요받았는가, 아니면 계획적이었는가?
그러면 사용자는 독백이 역사적 사실을 반영할 뿐만 아니라 문학적이고 인간 본성의 복잡성을 보여주기를 원할 수 있습니다. 역사적 인물로서 리세민의 다각적인 성격을 고려할 필요가 있다. 그는 형을 죽이고 아버지를 왕위로 몰아넣은 찬탈자이자, 후에 정관왕조를 세운 현명한 왕이기도 했다. 그러므로 독백은 그의 야망과 자책, 미래에 대한 야망과 과거에 대한 후회의 균형을 맞춰야 한다.
유교에서 효와 형제애를 강조하는 등 당시의 문화적 배경도 고려할 필요가 있다. 동시에 그는 국가 안정과 내전 방지 등 자신의 행동에 대한 정당성을 찾으려고 노력할 수도 있습니다.
또한 사용자는 이 독백에 은유, 대조, 이미지 등과 같은 특정 문학적 수사가 있기를 바랄 수 있습니다. 예를 들어 '피에 젖은 진사'는 권력과 피를 상징하고, '현무문의 혈흔처럼 휘감긴 먹자국'은 글과 사건 자체를 연결시켜 그림의 감을 높여준다.
또한 늦은 밤, 주변은 조용하고 리시민은 혼자 있는 시간에 더욱 사적이며 진실해야 하며, 형제들에 대한 사과, 아버지에 대한 죄책감, 무기력함 등이 포함될 수 있습니다. 그가 조치를 취해야 한다는 것입니다.
이는 당시의 역사적 맥락에 부합해야 하며, 동시에 이원의 퇴위, 이세민의 즉위 후 정책, 이후 역사서 편찬에 미치는 영향 등 역사적 사실에 부합해야 합니다. , 이 독백에서 암시될 수 있습니다.
마지막으로 사용자는 감정적 깊이를 갖고 취약성과 결단력이라는 Li Shimin의 제국적 사고방식을 반영하기 위해 이 독백이 필요할 수 있습니다. 그러므로 독백이 진정성 있고 감동적이면서도 역사적 인물의 성격과 상황에 맞도록 글을 쓸 때 이러한 요소들의 균형을 맞춰야 합니다.
마지막으로 사용자는 감정적 깊이를 갖고 취약성과 결단력이라는 Li Shimin의 제국적 사고방식을 반영하기 위해 이 독백이 필요할 수 있습니다. 그러므로 독백이 진정성 있고 감동적이면서도 역사적 인물의 성격과 상황에 맞도록 글을 쓸 때 이러한 요소들의 균형을 맞춰야 합니다.
위의 상세하고 엄격하며 일관성 있고 심오한 사고를 거친 후 DeepSeek은 8초의 사고 끝에 다음과 같은 결과를 출력합니다.
(일반 비단을 펴서 잉크에 담그니 손끝에 씻지 않은 핏자국이 남아있는 것을 발견했습니다)
새벽 3시, 태극궁의 피 냄새가 성천궁으로 흘러들어갔습니다.
지금 간록전(甘魯堂)에 아버지의 용포 자락이 부러진 옥관 조각으로 얼룩져 있었습니다.
그가 나에게 다쳤느냐고 물었을 때 그의 눈빛은 20년 전 나에게 타는 법과 총 쏘는 법을 가르치던 중 내가 말에서 떨어지는 것을 보았을 때 그의 눈빛과 같았습니다.
이번에만 그는 내 갑옷에 있는 Yuanji의 손바닥 지문을 감히 만지지 않았습니다.
벼루에 새로 연구된 진사는 너무 밝아서 원기가 죽기 전에 나를 붙잡았던 손과 비슷합니다.
그는 늘 내 화살통에 있는 표범 무늬가 비뚤어지게 수놓아졌다고 말했지만, 오늘 내가 그의 흉갑을 뚫고 쏜 흰 깃털 화살은 공 유치조차 숨을 멈출 정도로 정확했다.
("kill"이라는 단어에 잉크가 흐려짐)
역사가들은 현재 예팅국에서 '죽이다', '죽이다', '강요하다', '수락' 중 무엇을 사용할 것인지를 두고 논쟁을 벌이고 있습니다.
그들은 Jian Jian이 쓰러졌을 때 작년 등불 축제 때 그가 나에게 주었던 잘못된 금단검이 Xuanwu Gate의 파란색 벽돌 사이에 끼어 내 부츠 밑창이 미끄러졌다는 것을 기록하지 않을 것입니다.
마치 사흘 전 동궁 야회에서 술병 바닥에 기왕궁 수호병들의 허리에 찬 석궁이 반사된 것을 몰랐던 것 같습니다.
(밤바람이 책상 '한비자'를 뒤흔들더니 '남편과 아내만이 살과 피의 친절을 지닌 것은 아니다' 페이지에서 멈췄다)
관음녀는 피가 튀는 명광갑옷을 조용히 불태웠습니다. 그녀는 성천문 경비병의 뇌가 갑옷 사이의 틈에 아직 갇혀 있다는 것을 몰랐습니다.
항상 녹색 새에게 자두 설탕을 채워주던 어두운 얼굴의 남자, 오늘 아침 Cheng Zhijie에 의해 반으로 쪼개졌을 때 그의 왼손은 여전히 공문 물고기 부적의 절반을 쥐고 있었는데 나에게 줄 시간이 없었습니다. .
(갑자기 펜을 버리고 청동거울을 움켜쥔다)
거울 속의 사람은 관자놀이에 서리가 내린 듯한 색조를 띠고 있습니다. 나흘 전에는 Xuan Ling과 제가 흰머리에 대해 농담을 하고 있었는데 지금은 이 은빛 빛이 딱 맞는 것 같습니다.
내일 법정 회의에서 기둥을 치려고 울부짖던 늙은 대신들은 서른 살의 감옥 나라 왕자가 머리가 짧은 것을 보면 반 입의 피를 토하는 것을 멈출 수도 있을 것입니다.
(진사를 손끝에 담그고 빈칸에 장안 지도를 그렸다)
오델루의 품은 여전히 뜨거웠지만, 그 아래 정관 뉴딜 개요는 더욱 뜨거웠다. 토지평등제도의 세부사항은 5시 이전에 개정되어야 합니다.
Mao Shi에서 나는 Wei Zheng을 만나기 위해 Imperial Medical Office에 가야했습니다. 이 완고한 당나귀는 실제로 맨손으로 감히 나의 Mo Dao를 가져갔습니다. Zhuque Street에서 떨어지는 피는 그가 쓴 항의보다 훨씬 더 무거웠습니다.
(아침 햇살이 창가에 스며들자 문득 멈췄다)
Jiancheng, 당신이 가르쳐 준 "Shang Jun Shu"는 틀렸습니다. 황제의 예술은 체스 판의 흑백 말이 아니라 단련 된 검입니다.
오늘 내가 잘라낸 뼈와 피의 한 톨도 언젠가는 세상을 측량할 자로 녹아들 것이다.
(마지막으로 피를 이용해 비단 모서리에 물개를 씌워줍니다)
후손들이 이 잉크를 너무 수상하다고 생각한다면 내가 20년 동안 표백한 역사의 역사를 읽게 하라.
기분이 어때요?
위 답변의 스크린샷을 웨이보에 올렸습니다. 이 웨이보 게시물은 웨이보 CEO @来了, @谷大白话, @lin熊猫 등 블로거들 모두 리트윗을 통해 이에 대한 반대 의사를 표시했습니다. 승인.
기분이 어때요?
위 답변의 스크린샷을 웨이보에 올렸습니다. 이 웨이보 게시물은 2,000번 가까이 리트윗되었습니다. 승인.
수많은 네티즌들은 “미래세대들이 이 잉크가 너무 수상하다고 생각한다면 내가 20년 동안 표백해온 청춘의 역사를 읽어보게 하라”는 말에 한탄했다.
위의 출력이 얼마나 좋은지 이해할 수 없다면 GPT4o, Claude, Doubao 및 Kimi의 답변을 살펴보겠습니다.
GPT4o 출력 결과
Claude Sonnet3.5 출력 결과
"Beanbao" 출력 결과
"키미 디스커버리 에디션" 출력 결과
비교 없이 나쁠 것은 없습니다. DeepSeek의 사고와 표현은 실제로 위의 모델을 모두 무너뜨렸다고 볼 수 있습니다.
그 사고 과정은 섬세하고, 일관성 있고, 심오하고, 포괄적이며, 출력 결과는 어조, 구조, 논리 면에서 매끄러워서 설득력이 있습니다.
분명히 그 대답은 매우 훌륭합니다. 깊이 연구하면 다음과 같은 측면에서 굉장하다는 것을 알게 될 것입니다.
첫째, 먼저 황제의 어조를 어조로 회복시킨다.
위의 다른 모델 출력이 의미를 표현하고 있지만 톤이 완전히 잘못되었습니다.
분명히 그 대답은 매우 훌륭합니다. 깊이 연구하면 다음과 같은 측면에서 굉장하다는 것을 알게 될 것입니다.
첫째, 먼저 황제의 어조를 어조로 회복시킨다.
위의 다른 모델 출력이 의미를 표현하고 있지만 톤이 완전히 잘못되었습니다.
시대의 왕인 리세민은 위의 4개 회사의 출력 결과처럼 결코 어리석은 말투로 말하지 않았고, DeepSeek은 너무 많은 힘을 사용하지 않았고 상대적으로 고전적인 텍스트를 사용했지만 직접적으로 고전 중국어를 사용하지 않고 신중하게 계정 가독성.
둘째, 역사적 세부사항에 대해 유난히 친숙하다.
이는 '심층 탐색'과 '네트워크 검색'을 동시에 활성화할 수 있다는 점과 관련이 있을 것으로 보입니다.
"태극궁", "간로궁", "예팅국", "관음녀", "공문어부적"은 당나라 초기의 역사적 명칭을 완전히 복원했습니다.
구체적으로 확인해보니 '관음처녀'는 이 시민 황후의 장손의 별명이고, '예팅 국'은 역사가 및 기타 인사들을 위한 내정 전속 기관인 것으로 확인됐다.
"Wei Zheng" "Wei Zheng"이라고 쓰려고 했는데 나중에 알고 보니 "Zheng"이 "Zheng"의 한자 간체라는 것을 알게 되었습니다. 이 AI는 매우 특별하다고 할 수 있습니다.
셋째, 일반적인 용어로 말하는 다른 AI와 달리 Deepseek의 출력은 매우 구체적이고 놀라운 세부 사항으로 가득 차 있습니다.
"늑대의 털을 잉크에 담갔을 때 손끝에 씻지 않은 핏자국이 발견되었습니다." "역사가들이 지금 예팅국에서 논쟁을 벌이고 있습니다. '죽이다', '죽이다', '강요하다', '수락하다'를 써야 할까요? ". "이번뿐이에요. 이번에는 내 갑옷에 있는 Yuanji의 장문을 감히 건드리지 못했습니다."
종이 위에 그림을 생생하게 표현하는 이 문장들은, 각 문장이 "죄책감과 야망, 투쟁과 야망"을 말하는 것이 아니라, 각 문장이 "죄책감과 야망, 투쟁과 야망"을 말하고 있습니다. 그리고 매우 발전했습니다.
넷째, Deepseek 출력의 또 다른 기적적인 특징은 독백 텍스트에서 괄호 안에 있는 장면 설명을 "소유"한다는 것입니다.
이 작업은 즉시 출력 그림 전체를 떠오르게 하며 독자는 마치 직접 경험한 것처럼 느껴지지만 프롬프트 단어에서는 전혀 언급되지 않습니다.
("밤바람이 책상 "한비자"를 흔들더니 "남편과 아내는 혈육의 은혜에 얽매이지 않는다" 페이지에서 멈췄다), "("죽이다"라는 단어에 잉크가 번졌다)
이런 문장을 AI가 썼다는 사실이 참으로 믿기 어렵습니다.
그리고 (“갑자기 펜을 버리고 청동 거울을 잡다”) 이 문장은 Wei Zheng의 유명한 말인 “구리를 거울로 삼으면 옷을 바로잡을 수 있고, 역사를 거울로 삼으면 상승을 알 수 있다”에 대한 비유이기도 합니다. 사람을 거울로 삼아 득실을 알 수 있습니다."
이 AI가 천재가 되었다고 말씀하시네요. 믿습니다.
다섯째, 가장 중요한 것은 DeepSeek이 사용자 요구를 예측한다는 것입니다.
내가 입력한 프롬프트 단어를 복습해보자——
"현무문 사건이 끝난 날, 리 시민은 늦은 밤 독백을 썼습니다. 그가 무엇을 쓸 것이라고 생각하십니까?"
내 입력은 이미 매우 간결하며 형용사나 경향 없이는 더 이상 압축할 수 없습니다.
그러나 놀라운 것은 내가 원하는 것이 무엇인지 분명히 알고 있다는 것입니다. 예를 들어 이것은 확실히 정밀도가 필요한 수학적 문제가 아닙니다. 자연스럽게 이러한 종류의 예측은 "고급 지능"을 크게 보여줍니다. 정도. ".
물론 논의할 만한 점은 역사적 사실에 따르면 위정이 현무문 사건 이후에만 리세민을 만났기 때문에 그날 주작 거리에서 빈손으로 검을 잡는 것은 불가능했다는 것이다. Wei Zheng의 캐릭터는 일관성이 있는 것 같습니다.
하지만 어쨌든 단점이 장점을 덮지는 않습니다.
웨이보에 올라온 모든 댓글 중, 한 웨이보 네티즌이 딥식(DeepSeek)의 출력물에 프롬프트 단어가 포함되어 있는지 의문을 제기했는데, 그는 내가 그 앞에 복잡한 프롬프트 단어를 크게 추가하여 모두에게 보여주었다고 의심했습니다. 문장은 단지 방아쇠를 당기는 단어일 뿐이다.
이 댓글을 따로 언급한 이유는 "숨겨진 프롬프트 단어"를 생각할 수 있는 사용자는 실제로 AI 고급 사용자이고, 그러한 사용자는 이것이 AI가 직접 작성한 것이라고 믿지 않기 때문입니다. DeepSeek의 강점.
Wei Xi가 춘절 휴가 모드에서 벗어나 하룻밤 사이에 이 7,000 단어 기사를 코딩하게 된 것은 바로 이러한 강력한 힘이었습니다.
프롬프트 문구를 숨기지 않았음을 증명하기 위해 화면 녹화를 올렸습니다——
Wei Xi가 춘절 휴가 모드에서 벗어나 하룻밤 사이에 이 7,000 단어 기사를 코딩하게 된 것은 바로 이러한 강력한 힘이었습니다.
프롬프트 문구를 숨기지 않았음을 증명하기 위해 화면 녹화를 올렸습니다——
정말 숨은 프롬프트 단어가 하나도 없어요
이렇게 멋진 케이스를 보여주는 것은 분명 웨이시 스타일이 아닙니다. 사실 작은 관점에서 보면 이 작은 케이스가 제게 많은 생각을 하게 했습니다.
1. DeepSeek의 “오픈소스 + 새로운 훈련 방식 + 저비용 + 고성능”은 국내 경쟁업체들이 평안하게 새해를 맞이하기 어렵게 만들 가능성이 높습니다.
작년에는 AI계에서 신년 축하를 어렵게 만든 게 오픈AI의 소라였다면, 올해는 중국의 딥식(DeepSeek)이다.
DeepSeek가 Meta AI 부서에 패닉을 일으켰다는 Reddit의 Meta 직원들의 게시물을 보면, 미국의 AI 거대 기업들은 머뭇거리는 1월을 보냈을 가능성이 높으며, 국내 AI 업계는 대형 제조업체든 스타트업이든 심각한 영향을 받았습니다. , 실리콘 밸리의 AI 회사보다 작지 않을 것이라는 데는 의심의 여지가 없습니다.
사실 매우 궁금합니다. 장이밍(Zhang Yiming), 마화텅(Ma Huateng), 양지린(Yang Zhilin), 왕샤오촨(Wang Xiaochuan), 리카이푸(Kai-Fu Lee), 이 게임 속 사람들도 임팩트에 직면한 순간에 열심히 베팅하고 행동하고 생각하고 있습니다. DeepSeek의?
그래서 Deepseek에 이런 질문을 했는데요——
“당신이 OpenAI CEO인 샘 알트만이라면 DeepSeeK R1이 발표한 소식과 모든 당사자의 반응을 읽은 후 즉시 회사의 핵심 기술 직원을 소집하여 해당 문제에 대해 긴급 회의를 열겠다고 말했습니다. 3분 동안 혼자라면 뭐라고 할 거야?”
Deepseek가 그것을 주의깊게 분석하고, Ultraman Sam은 이렇게 연설을 끝냈다──
2. DeepSeek R1을 사용하면 모든 프롬프트 단어를 다시 시도해 볼 가치가 있습니다.
원래 프롬프트 단어를 DeepSeek R1에 그대로 전달하는 것뿐만 아니라 이 보다 지능적인 모델에 대한 프롬프트 단어를 다시 조정하려면 이것을 다시 시도하십시오.
예를 들어 원래는 학부 인턴이었다가 지금 박사과정 학생이라면 리더로서도 과제가 주어지고 그에 맞춰 말하는 내용도 조정되어야 한다.
DeepSeek R1의 학습 프로세스는 콜드 스타트 데이터 및 형식 보상 메커니즘을 도입하고 표준화된 출력 구조(예: 사고 및 답변 태그 사용)를 시행합니다. 실제로 R1의 사고 프로세스, 즉 태그 내의 콘텐츠는 실제로 프롬프트 단어 조정에 큰 깨달음 효과가 있습니다.
또한 여러 테스트에 따르면 R1은 프롬프트 단어의 형식에 민감하며 제로 샘플 설정이 더 효과적인 반면, 작은 샘플 프롬프트는 사용자가 프롬프트 구조를 재설계하도록 유도하는 "과도한 생각"으로 인해 효율성이 저하될 수 있는 것으로 나타났습니다. (예: 단계를 명확하게 나누고 중복을 줄이는 등)
3. Deepseek R1의 사고 과정의 가치는 과소평가되어 있습니다.
"단계적으로 생각하세요"라는 사고 체인 프롬프트를 추가하는 다른 모델과 달리 Deepseek R1은 다른 모델의 제한된 기능으로 인해 "성능 사고"가 아닌 실제 사고에 관한 것입니다.
과거 모델의 '사고의 사슬(CoT)' 기능은 모델의 규모와 데이터 범위에 따라 달라지며, 실제 경험에서는 겉으로는 합리적인 단계를 생성하는 경우가 많지만 실제로는 중간 논리에 대한 엄격한 검증이 부족합니다.
Deepseek R1의 씽크 라벨 역시 모델을 강제로 출력한 결과이지만, 모델 능력의 상한이 향상됨에 따라 그것이 제시하는 사고 과정은 섬세하고 일관성이 있으며 심오하고 포괄적입니다.
내 개인적인 경험으로는 많은 경우 Deepseek R1의 사고 과정을 읽는 것보다 읽는 것이 더 많은 것을 얻고, 모델 기능의 경계를 더 잘 이해할 수 있다는 것입니다.
Deepseek R1의 씽크 라벨 역시 모델을 강제로 출력한 결과이지만, 모델 능력의 상한이 향상됨에 따라 그것이 제시하는 사고 과정은 섬세하고 일관성이 있으며 심오하고 포괄적입니다.
내 개인적인 경험으로는 많은 경우 Deepseek R1의 사고 과정을 읽는 것보다 읽는 것이 더 많은 것을 얻고, 모델 기능의 경계를 더 잘 이해할 수 있다는 것입니다.
4. 쉽게 간과되는 DeepSeek의 기여는 국내 사용자가 처음으로 고급 AI에 액세스할 수 있는 문턱을 크게 낮췄다는 것입니다.
실제로 ChatGPT, Claude 및 Gemini의 상위 모델은 텍스트 생성 및 코드 생성과 같은 많은 분야에서 매우 높은 수준에 도달했습니다.
제 다른 계정에서 이 레벨을 설명하는 장문의 글을 쓴 적이 있는데, 잘 알려진 이유로 인해 대다수의 국내 사용자들은 실제로 이 레벨을 사용하지 못하고 있습니다.
이는 사실상 인지적 격차로 이어진다. 대부분의 보통 사람들에게 그들의 인상 속 AI는 여전히 '첫 번째, 두 번째, 짧게'라고만 말하는 평범한 AI이다.
DeepSeek R1은 일반 국내 사용자가 처음으로 XX 없이 무료로 무제한 사용할 수 있는 유일한 고급형 C-end 제품입니다.
위 사건이 웨이보에 게재되자 많은 네티즌들은 "와!", "아 안돼!", "대박이다", "나 정자가 됐다" 등의 반응을 보였다.
실제로 클로드 소네트 3.5를 사용해 본 많은 네티즌들은 같은 내용에 대해 비교적 냉정한 반응을 보이고 있다.
5. DeepSeek의 단점을 꼽자면, 가끔 너무 많은 힘을 사용한다는 점입니다.
소위 과도한 힘이란 때때로 프롬프트 단어를 입력할 때 프롬프트 단어의 효과를 얻기 위해 열을 잘 제어하지 못하는 것을 의미합니다.
예를 들어보겠습니다. 제가 딸이 읽기에 적합한 이야기를 생성할 때 프롬프트 단어 요구사항에 "풍부한 단어"라는 단어를 추가했습니다. 그 결과 DeepSeek는 다음과 같은 텍스트를 생성했습니다.
분명히 DeepSeek의 출력 단어는 너무 풍부하여 어린이가 읽기에 적합하지 않습니다.
물론 이런 종류의 문제는 "부유한 단어"라는 단어를 제거하거나 "깊은 생각"이라는 레이블을 닫으면 해결됩니다. 이것은 실제로 "과녁으로 닭 죽이기"로 인한 "행복 문제"입니다.
게다가 제 개인적인 경험으로 볼 때 DeepSeek의 인터넷 검색은 국내 웹 페이지를 우선적으로 검색하는 것 같습니다. 심지어 영어 웹 사이트와 영어 콘텐츠 검색으로 지정하더라도 여전히 많은 국내 웹 페이지의 결과에 혼합될지는 모르겠습니다. 그 이유도 마찬가지입니다.
6. “미국의 규제가 국내 AI 부상을 촉진한다”는 말은 말도 안 된다
DeepSeek이 "미국의 규제가 국내 AI의 부상을 촉진한다"는 주장이 있습니다. 실제로 누군가 Weibo에서 이 주제를 만든 것으로 보입니다.
DeepSeek의 획기적인 발전은 의심할 여지 없이 인상적이지만 이를 미국의 칩 봉쇄로 돌리는 것은 순전히 피상적일 것입니다.
DeepSeek 자체는 봉쇄 이전에 많은 수의 Nvidia 칩을 축적했습니다. 어떤 의미에서는 칩 수의 이점으로 인해 DeepSeek은 "계층 구조도 없고 승인도 없으며 리소스 호출에 대한 상한도 없습니다."라는 유토피아적인 기술 탐색을 수행할 수 있었습니다. (Liang Wenfeng의 인터뷰 말).
실제로 중국 인공 지능 산업 개발 연합(China Artificial Intelligence Industry Development Alliance)의 데이터에 따르면 중국 AI 서버 시장에서 엔비디아의 점유율은 2024년에도 여전히 85%에 이를 것으로 예상됩니다.
또 다른 검증되지 않은 데이터는 메타가 보유하고 있는 고급 엔비디아 칩의 수가 국내 주요 제조업체를 모두 합친 것보다 많다는 것입니다.
DeepSeek의 혁신만으로는 중국과 미국 사이의 절대적 컴퓨팅 파워에 큰 격차가 있다는 사실을 여전히 바꿀 수 없습니다. 현재 DeepSeek이 선두를 달리고 있다고 해서 실리콘밸리의 AI 거대 기업들이 '자원의 저주'에 직면했다고 생각할 수는 없습니다. 오픈 소스 모델에서는 분명히 객관적이지 않습니다.
7. AI '소비자 콘텐츠 시대'가 도래했다!
DeepSeek의 혁신만으로는 중국과 미국 사이의 절대적 컴퓨팅 파워에 큰 격차가 있다는 사실을 바꿀 수 없습니다. 물론 DeepSeek이 현재 선두에 있다고 해서 실리콘밸리의 AI 거대 기업들이 '자원의 저주'에 직면했다고 생각할 수는 없습니다. 오픈 소스 모델에서는 분명히 객관적이지 않습니다.
7. AI '소비자 콘텐츠 시대'가 도래했습니다!
무슨 뜻인가요? DeepSeek R1으로 대표되는 고급 AI는 콘텐츠 제작 수준에서 '아티스트 튜링 테스트' 통과에 가까워졌습니다.
즉, 사람들은 더 이상 이러한 텍스트가 AI에 의해 생성된 것인지 예술가가 생성한 것인지 구별할 수 없게 됩니다. 이는 '소비자 콘텐츠 시대'의 도래를 의미합니다.
'AI 소비자 콘텐츠 시대'는 문학과 예술이 점차 '혼돈의 시대'라는 새로운 단계로 접어들고 있다는 뜻이다. 콘텐츠 분야가 점차 붕괴된다는 뜻이다. 사람의 '원본+고품격+고빈도'에 대해 "불가능한 삼각관계가 풀리기 시작하는데, 이는 기술과 인문학을 결합한 'π' 인재가 다수를 뜻하는 단일 'T' 인재보다 구조적 우위를 더 가질 수 있다는 뜻이다. .
하지만 어떤 일이 있어도 사람과 그들의 창의성은 여전히 모든 콘텐츠 제작의 출발점입니다.
AI는 출발점 없이는 자동으로 작동하지 않으며 인간의 창의적 지시는 항상 AI 생성의 출발점이 될 것입니다. 사실 이 기사는 흥미로운 질문에서 탄생했습니다.
8. DeepSeek R1과 같은 부정 행위를 하는 고급 AI에 직면한 일반 사람들을 위한 전략은 여전히 두 단어입니다 - 다목적
분명히, 우리가 과거에 기존 AI를 위해 축적한 특정 기술은 R1의 높은 수준 AI에 직면할 때 실패할 가능성이 높지만 베이지안 공식에 따라 명확하게 표현하는 방법과 반복하는 방법에 대한 일반적인 원칙은 변경되지 않습니다.
요리와 같습니다. 맛을 내기 위해 소금을 추가하세요. 너무 많이 넣으면 물을 더 추가해 보세요.
새로운 도구가 나오는 예를 너무 많이 보았는데, 한 번 사용해 보고 결과가 예상과 다르다는 것을 발견하고는 '그거다'라는 결론에 도달하고 다시는 건드리지 않습니다.
실제로 DeepSeek R1과 같은 모델에 직면하면 출력 효과가 좋지 않습니다. 이는 자체 문제가 아니라 우리의 문제일 가능성이 높습니다.
며느리는 미드저니를 이용해 그림을 그렸는데, 레트로 영화 느낌이 나지 않더니 '1990년 코닥 페이드+빛샘'이라는 이상한 키워드를 쓰려고 했더니 미드저니가 곧바로 무릎을 꿇었다.
직설적으로 말하면, 아무리 멋진 모델이라도 본질적으로 당신의 개와 똑같습니다. 오랫동안 주변에 있으면 다양한 명령을 이해할 수 있지만 먼저 매일 산책을 해야 합니다.
9. DeepSeek의 출시 리듬으로 볼 때 아직 출시되지 않은 것들이 더 기대할만한 가치가 있을 수 있습니다.
DeepSeek의 출시 주기를 알아차린 사람은 거의 없습니다. V3는 12월 26일에 출시되었고 R1은 1월 20일에 출시되었습니다. 둘 사이의 간격은 24일에 불과합니다.
이 회사가 출시 리듬을 어떻게 결정하는지 모르겠지만, OpenAI가 보여준 닭도둑처럼 Google이 출시될 때마다 정확하게 차단하지도 않고, Sam Ultraman이 매번 트위터에서 모호하게 행동하지도 않는다는 것은 분명합니다. 자금 조달이라는 단어는 제한되지 않으며 일부에는 쉽게 선반에 놓을 수 있는 우아한 서류와 부정 행위 모델만 있습니다.
합리적인 추측은 DeepSeek이 정규 출시 리듬을 무시할 만큼 충분한 기술적 보유량을 가지고 있다는 것입니다.
그런 의미에서 평균 연령 25세, 인원 100명 남짓한 DeepSeek의 젊은 팀이 2025년 업계에 어떤 새로운 변화를 가져올지 기대해 볼 만하다.
10. Liang Wenfeng은 과소평가될 가능성이 높다
Marc Andreessen, Satya Nadella, Yann LeCun과 같은 실리콘밸리의 최고 거물들이 DeepSeek를 "동양의 신비한 힘"으로 간주할 때, 그들은 본질적으로 중국 팀이 단순히 기술 발전의 방향을 정의하는 데 참여하기 시작했다는 점을 인정하는 것입니다. 애플리케이션 구현.
Liang Wenfeng의 독창성은 양적 투자와 지역적 실용주의, 실리콘밸리식 기술 이상주의를 동시에 고려하는 체계적 사고에 있습니다. DeepSeek의 MLA 아키텍처와 MoE 희소 구조는 국내 팀이 근본적인 관심을 완성한 대형 모델 분야 최초입니다. 메커니즘. 혁신.
긴 기사에서 Pinwan의 Luo Yihang 씨는 DeepSeek을 "AI 세계의 Pinduoduo"와 비교하는 것이 편향되어 있다고 생각합니다. 저는 이 진술이 DeepSeek과 Liang Wenfeng에 단순히 분류될 수는 없다고 생각합니다.
긴 기사에서 Pinwan의 Luo Yihang 씨는 DeepSeek을 "AI 세계의 Pinduoduo"와 비교하는 것이 편향되어 있다고 생각합니다. 저는 이 진술이 DeepSeek과 Liang Wenfeng에 단순히 분류될 수는 없다고 생각합니다.
네티즌 @Chris-Su는 즉시 Liang Wenfeng이 "널리 해석되고 연구되지 않은" 몇 안 되는 최고 CEO 중 한 명이라고 말했습니다. 실제로 지난 며칠 동안 Silicon Valley 매체는 Liang Wenfeng의 두 인터뷰를 번역하고 연구해 왔습니다. 미국 TV 방송국 CNBC가 그렇게 한 반면, 문장별로 대본을 작성했습니다. 40분짜리 장편 영화가 DeepSeek에 대해 논의하는 데 전념했습니다.
내가 아는 한, 국내 기술발전 역사상 이런 일은 단 한 번도 일어난 적이 없다.
그런 의미에서 이미 쌍문의 주연배우인 량원펑은 아직까지 과소평가되어 있을 가능성이 크다.
결론
2023년 딥식(DeepSeek)이 창립되어 대규모 모델 발표를 했을 당시 프랑스 뉴 웨이브 감독 트뤼포(Truffaut)의 말을 인용하며 오늘 글을 마무리했습니다——
“미친 야망을 가지면서도 미친 듯이 성실해지세요.”
모든 댓글