Cointime

Download App
iOS & Android

거대 기업들이 인수를 서두르고 자본이 끓어오르는 상황에서 AI 에이전트는 어떻게 '환상'의 함정을 극복할 수 있을까?

Cointime Official

저자: 루 쉬밍

마누스의 등장은 기술 및 자본 시장에 이중 충격을 일으켰습니다. 한동안 AI 에이전트 관련 컨셉 주식이 집단적으로 급등했고 알리바바, 구글, 마이크로소프트와 같은 기술 거대 기업들이 지능형 에이전트 연구 및 개발 계획을 집중적으로 발표했습니다...

이러한 추세의 배경에는 AI 기술의 패러다임이 '수동적 대응'에서 '능동적 실행'으로 전환되고 있다는 점이 있습니다.

시장에서의 평가는 엇갈리지만, Manus의 획기적인 진전은 복잡한 시나리오에서 일반 AI 에이전트의 상업적 타당성을 처음으로 검증했다는 점에 있다는 점은 부인할 수 없습니다.

기존의 대규모 언어 모델은 텍스트를 생성할 수 있지만, 폐쇄 루프에서 작업을 수행하는 데 어려움을 겪습니다. Manus는 "계획-검증-실행" 아키텍처를 통해 대규모 AI 모델의 인지 기능을 생산성 도구로 변환합니다.

McKinsey 및 기타 기관의 여러 권위 있는 보고서에 따르면, 다양한 수요에 힘입어 AI Agent 시장은 폭발적인 성장을 경험하고 있습니다. 2024년 글로벌 AI Agent 시장 규모는 약 51억 달러에 이를 것으로 예상되며, 2030년에는 471억 달러로 치솟을 것으로 예상되며, 연평균 성장률은 44.8%입니다.

하지만 이 "지적 에이전트의 물결"은 순탄치만은 않습니다. 기술적 병목 현상과 상업적 야망의 충돌은 AI 에이전트의 경쟁을 상상력이 풍부하면서도 위험스럽게 만듭니다.

성벽의 전투

본질적으로 AI Agent는 인간의 사고 패러다임을 갖춘 디지털 인력입니다.

챗봇이 아직 "대화" 단계에 있다면 에이전트는 이미 "행동"을 시작한 것입니다. 간단히 말해서, 질문에 답할 뿐만 아니라 작업을 수행하고 거래를 완료할 수 있는 더욱 스마트하고 자율적인 AI 애플리케이션으로 이해될 수 있습니다.

이러한 기술은 고객 서비스, 재무 분석, 소프트웨어 개발 등 다양한 시나리오에 적용되어 생산성과 효율성을 크게 향상시킬 수 있습니다.

AI 에이전트는 대규모 언어 모델을 "두뇌"로 사용하여 명령어의 표면적 의미를 이해할 수 있을 뿐만 아니라 암묵적인 요구 사항도 포착할 수 있습니다. 예를 들어, 사용자가 "가격 대비 좋은 호텔을 찾고 있어요"라고 말하면 Manus는 계절과 지역 활동 등의 맥락에 따라 "예산에 민감한" 또는 "경험을 우선시하는" 요구 사항을 추론합니다.

우리가 기대할 수 있는 것은 대형 모델의 멀티모달 기능의 지속적인 획기적인 발전, 특히 멀티모달 융합 기술의 반복적 업그레이드를 통해 AI 에이전트가 사용자 요구 사항을 보다 정확하게 분석하고 대응할 수 있고 점차적으로 인간과 같은 시청각적 인식 및 상호 작용 기능을 달성할 수 있다는 것입니다.

이를 통해 AI Agent는 의료 진단, 자율주행, 스마트 보안 등 보다 다양한 분야에 적용될 수 있습니다.

개별 유닛의 지능이 지속적으로 최적화되는 가운데, 미래의 AI 에이전트도 단독 작동 모드를 돌파하고 협업 메커니즘을 통해 복잡한 작업 처리 및 의사 결정 체인을 재구성할 수도 있을 것으로 예상됩니다.

다중 에이전트 시스템(MAS)을 사용하면 각 에이전트가 역할 배치 메커니즘을 통해 전문적인 업무 분담을 통해 인간 팀처럼 행동할 수 있습니다.

예를 들어, 소프트웨어 개발 시나리오에서 각 AI 에이전트는 각자의 전문 지식을 가지고 있습니다. 어떤 사람은 프로그래밍에 능숙하고, 어떤 사람은 디자인에 능숙하고, 어떤 사람은 품질 검사에 능숙합니다. 그들이 잘 협업할 수만 있다면, 그들은 함께 고품질 소프트웨어 프로젝트를 완료할 수 있습니다.

다중 에이전트 시스템(MAS)을 사용하면 각 에이전트가 역할 배치 메커니즘을 통해 전문적인 업무 분담을 통해 인간 팀처럼 행동할 수 있습니다.

예를 들어, 소프트웨어 개발 시나리오에서 각 AI 에이전트는 각자의 전문 지식을 가지고 있습니다. 어떤 사람은 프로그래밍에 능숙하고, 어떤 사람은 디자인에 능숙하고, 어떤 사람은 품질 검사에 능숙합니다. 그들이 잘 협업할 수만 있다면, 그들은 함께 고품질 소프트웨어 프로젝트를 완료할 수 있습니다.

또한 MAS 시스템은 인간의 의사결정 과정을 시뮬레이션할 수 있습니다. 사람들이 문제에 직면했을 때 다른 사람에게 조언을 구하는 것처럼, 다중 에이전트도 집단적 의사결정 행동을 시뮬레이션할 수 있으며, 이는 특히 복잡한 상황에서 사용자에게 더 나은 정보 지원을 제공할 수 있습니다.

예를 들어, 비상 상황에서 이러한 AI 에이전트는 사용자가 가능한 모든 상황을 시뮬레이션하고 적절한 시기에 유용한 정보를 제공하도록 도와 사용자가 더 빠르고 더 나은 결정을 내릴 수 있도록 돕습니다.

이러한 '인간과 유사한' 지능 패러다임은 삶과 일의 비용 구조를 재편하고 있다고 할 수 있다. 마누스를 시작으로 AI Agent는 개념 검증 단계를 벗어나 대규모 구현의 중요한 지점으로 옮겨간 것 같습니다.

자이언츠 레이싱

AI 에이전트에 대한 열풍은 우연이 아니라 기술 발전의 불가피한 산물입니다.

2024년 Sequoia AI Summit에서 Andrew Ng 교수는 "AI Agent가 AI 개발의 다음 핵심 단계"라고 예측했습니다. 실제로 2024년에는 많은 기술 거대 기업들이 AI 에이전트를 배포하기 시작했습니다.

예를 들어, 구글은 2024년 12월에 최신 대형 모델인 제미니 2.0 시리즈를 출시하고 Project Astra와 같은 여러 지능형 에이전트 애플리케이션을 선보였습니다. Microsoft는 또한 2024년 10월과 11월에 영업, 운영 및 기타 시나리오를 위한 여러 AI 에이전트를 출시했으며 사용자가 자율 에이전트를 구축할 수 있도록 지원하는 Copilot Studio 플랫폼을 출시했습니다.

2025년에 들어서면서 마누스의 인기는 시장 심리를 완전히 끌어올렸습니다.

해외에서는 OpenAI가 최근 발표한 상용화 계획이 AI Agent의 B-side 잠재력을 더욱 확인시켜 주고 있다. "박사 수준" 에이전트는 과학적 연구 및 소프트웨어 개발 시나리오를 대상으로 하며, 월 서비스 요금은 최대 20,000달러로 기본 분석부터 복잡한 작업에 이르기까지 전체 요구 사항을 포괄합니다.

국내에서 Alibaba Qianwen의 QwQ-32B 모델은 지능형 에이전트와 관련된 기능도 통합하여 도구를 사용하면서 비판적으로 생각하고 환경 피드백에 따라 추론 프로세스를 조정할 수 있습니다.

반면, 오픈소스 커뮤니티에서는 OpenManus와 OWL과 같은 새로운 제품이 등장했습니다. Manus를 기반으로 한 복제와 혁신은 Agent 제품의 번영을 촉진할 것으로 기대됩니다.

자본시장의 열풍은 이러한 추세를 더욱 확인시켜 줍니다.

마누스가 출시된 날, 150개 이상의 A주 AI 컨셉 주식이 일일 한도에 도달했고, Cube Holdings, Coote Intelligence 등이 20% 이상 상승했습니다.

출처: Eastmoney

또한 Manus 출시 후 브로커리지 PPT와 애널리스트 로드쇼가 온라인에서 빠르게 시작되었습니다. 불완전한 통계에 따르면 CICC, Huatai, China Merchants, Zhongtai 등 수십 개의 브로커리지 연구 기관이 로드쇼를 진행했으며, 그 중 애널리스트가 여러 로드쇼를 온라인에서 시작했습니다. 로드쇼 콘텐츠는 기술 원리, AI 응용 프로그램, 수혜자 지침, 랜딩 시나리오, 산업 서클 공제에 이르기까지 다양한 콘텐츠가 풍부했습니다.

물론, 이러한 열풍 뒤에는 다양한 목소리도 있습니다. 업계 관계자들은 Manus가 AI Agent의 초기 단계 애플리케이션이며 시장 반응이 과도하다고 생각합니다.

실제로 그렇습니다. AI는 정보 격차를 더욱 좁힐 것입니다. 정보 수집 및 데이터 정리와 같은 많은 작업을 AI에 맡길 수 있지만, 실제로 투자 결정을 내리기까지는 의심할 여지 없이 먼 길입니다.

그 가운데 가장 큰 과제는 AI 환각의 망령이 늘 남아 있다는 것이다.

기술적 병목 현상

AI 에이전트 경쟁에서는 입구가 왕이다.

그 가운데 가장 큰 과제는 AI 환각의 망령이 늘 남아 있다는 것이다.

기술적 병목 현상

AI 에이전트 경쟁에서는 입구가 왕이다.

더 많은 사용자 트래픽을 제어하는 ​​제조업체는 "트래픽-데이터-사용자 경험"의 긍정적인 순환을 달성할 것으로 기대됩니다. 오픈소스 모델 역량이 대형 제조업체와 소규모 제조업체 간의 기술 격차를 메우기 위해 업그레이드됨에 따라 AI 제품 엔지니어링 역량이 제품 사용자 경험의 격차를 넓힐 수 있습니다.

그러나 엄청난 잠재력을 보여주고 있음에도 불구하고 AI 에이전트의 폭발적 성장은 여전히 ​​여러 가지 장애물에 직면해 있습니다. 사업 모델부터 기술적 병목 현상, 규제 부족부터 사용자 인식까지 모든 측면이 업계의 인내심을 시험하고 있습니다.

가장 중요한 이유는 기존 기술로는 AI 환각 문제를 효과적으로 해결할 수 없다는 것입니다.

예를 들어, 인기 있는 Manus는 GAIA 벤치마크 테스트에서 우수한 결과를 달성했지만 실제 적용에서는 여전히 불안정한 상황이 몇 가지 있습니다.

GAIA 벤치마크 순위 출처: ManusAIX 플랫폼

실제 사용자 피드백에 따르면, 복잡한 작업을 처리할 때 Manus는 가끔 작업을 실행하지 못하거나 정확하지 않은 결과를 생성합니다. Manus는 주식 데이터를 분석할 때 데이터 인터페이스의 일시적인 오류나 데이터 형식의 미세한 변경으로 인해 분석 결과에 편차가 생길 수 있습니다.

예를 들어 OpenAI의 GPT4.5를 살펴보면, 이것이 현재 가장 강력한 대규모 언어 모델이라는 점에는 의심의 여지가 없습니다. 그러나 SimpleQA 벤치마크에서 GPT-4.5는 정확도가 62.5%이고 환각률은 7.1%입니다. 이 결과는 GPT-4o, OpenAIo1 및 o3-mini와 같은 모델보다 훨씬 뛰어나지만 여전히 매우 높은 환각률이 있습니다.

이러한 착각으로 인해 금융이나 의료와 같은 고위험 분야에서는 어떤 실수라도 체계적 위험으로 이어질 수 있습니다.

의료 진단 에이전트가 희귀 질환 사례를 잘못 진단할 확률이 3%라고 가정합니다. 수천만 명의 사용자 그룹에 적용하면 잠재적인 오진 수는 30만 건에 달할 것입니다.

이러한 환상 외에도 데이터 사일로와 보편적 역량 사이의 모순이 발생합니다.

AI 에이전트의 효율성은 시나리오 데이터에 크게 의존합니다. 예를 들어, 재무 위험 관리에는 실시간 거래 데이터가 필요한 반면, 의료 진단은 환자 병력 데이터베이스에 의존합니다. 데이터 단편화로 인해 일반 에이전트가 도메인 간에 마이그레이션하기 어려울 것입니다.

마지막으로 윤리와 규제의 부족이 있습니다. AI 에이전트의 자율적 의사결정에는 개인 정보 유출, 책임 귀속, 사용자 건강 데이터 활용, 자율 주행 사고 등 윤리적 문제가 수반되며, 글로벌 규제 프레임워크는 아직 성숙되지 않았습니다.

이를 통해 AI Agent의 획기적인 발전으로 나아가기 위해서는 기술, 생태, 감독의 세 가지 측면에서 조화로운 발전이 필요하다는 것을 알 수 있습니다. 미래에는 기술적 병목 현상을 먼저 돌파하고 규정을 준수하는 생태계를 구축하는 사람이 지능형 개체 시대의 '노르망디 상륙작전'에서 우위를 차지할 것이 틀림없다.

댓글

모든 댓글

Recommended for you