Cointime

Download App
iOS & Android

AI는 Crypto의 에이전트입니다: AI Agent의 진화

Cointime Official

작가: 주오 예(Zuo Ye)

예술 작품은 완성되지 않고 버려질 뿐입니다.

모두가 AI Agent에 대해 이야기하고 있지만, 그들이 말하는 내용은 동일하지 않습니다. 이는 우리가 관심을 갖는 AI Agent와 대중의 관점, 그리고 AI 실무자의 관점의 차이로 이어집니다.

오래전부터 Crypto는 AI의 환상이라고 썼습니다. 그때부터 지금까지 Crypto와 AI의 결합은 짝사랑이었습니다. AI 실무자는 Web3/블록체인이라는 용어를 거의 언급하지 않는 반면 Crypto 실무자는 Web3라는 용어를 거의 언급하지 않습니다. /blockchain. 하지만 저는 AI에 대한 열정이 있고, AI Agent 프레임워크가 토큰화될 수 있다는 경이로움을 보고 나서 AI 실무자를 실제로 우리 세상에 소개할 수 있을지 모르겠습니다.

AI는 Crypto의 에이전트입니다. 이것은 암호화폐 관점에서 AI 급증을 보는 가장 좋은 설명입니다. 우리는 특히 금융 자산의 발행 및 운영을 AI에 통합하기를 희망합니다.

에이전트 진화, 기술 마케팅의 기원

AI Agent의 뿌리를 살펴보면 최소한 세 가지 소스가 있는데, OpenAI의 AGI(General Artificial Intelligence)에서는 이를 중요한 단계로 나열하여 기술 수준을 넘어서는 용어를 유행어로 만들고 있습니다. 그러나 본질적으로 Agent는 새로운 개념이 아닙니다. 거기에 AI 역량 강화를 더한다면 혁명적인 기술 트렌드라고는 할 수 없을 것입니다.

하나는 자율주행 분류에서 L3와 유사한 OpenAI의 눈으로 보는 AI 에이전트다.

사진 설명: OpenAI 기획의 AGI 단계, 사진 출처: https://www.bloomberg.com/

둘째, 이름에서 알 수 있듯이 AI 에이전트는 AI의 축복을 받은 에이전트입니다. 에이전트 메커니즘과 모델은 컴퓨터 분야에서 흔합니다. OpenAI의 계획에 따르면 에이전트는 대화 형식(ChatGPT)과 추론 형식(다양한 봇)이 됩니다. ) 마지막 L3 단계는 "특정 행동을 자율적으로 수행하는 것"으로 특징지어지거나 LangChain의 창립자인 해리슨 체이스(Harrison Chase)의 정의를 사용하면 "AI 에이전트는 LLM을 사용하는 에이전트입니다. 프로그램 제어 흐름 결정을 내리는 시스템입니다."

이것이 미스테리입니다. LLM이 등장하기 전에는 Agent가 주로 인위적으로 설정된 자동화 프로세스를 실행했습니다. 한 가지 예를 들자면 프로그래머가 크롤러 프로그램을 설계할 때 브라우저 버전과 같은 세부 사항을 모방하도록 User-Agent를 설정했습니다. 물론, AI Agent를 사용하여 인간의 행동을 더 자세히 모방한다면 AI Agent 크롤러 프레임워크가 나타나게 됩니다.

이러한 변화에는 AI Agent의 추가가 기존 시나리오와 결합되어야 하며 완전히 독창적인 분야는 거의 없으며 Curosr 및 Github Copilot과 같은 코드 생성 기능도 LSP(Language Server Protocol)를 기반으로 합니다. 생각해 보면 이에 대한 예가 많이 있습니다.

  • Apple: AppleScript(스크립트 편집기)--Alfred--Siri--단축키--Apple Intelligence
  • 터미널: 터미널(macOS)/Power Shell(Windows)--iTerm 2--Warp(AI 네이티브)
  • 인간-컴퓨터 상호작용: Web 1.0 CLI TCP/IP Netscape Browser--Web 2.0 GUI/RestAPI/ 검색 엔진/Google/Super App--Web 3.0 AI Agent + dapp?

조금 설명하자면, 인간과 컴퓨터의 상호작용 과정에서 Web 1.0 GUI와 브라우저의 결합은 실제로 대중이 아무런 장벽 없이 컴퓨터를 사용할 수 있게 해준다. Windows + IE의 결합으로 대표되며, API는 데이터 추상화와 API이다. 인터넷 이면의 전송 표준, 웹 2.0 시대 브라우저는 이미 크롬 시대에 들어섰고, 모바일로의 전환은 사람들의 인터넷 사용 습관을 변화시켰습니다. 위챗, 메타 등 슈퍼 플랫폼의 앱은 사람들의 삶의 모든 면을 포괄합니다. .

셋째, 암호화폐 분야의 의도 개념은 AI 에이전트 서클 폭발의 전조입니다. 그러나 이는 불완전한 비트코인 ​​스크립트부터 이더리움 스마트 계약에 이르기까지 암호화폐 내에서만 유효하다는 점에 유의해야 합니다. 널리 사용된 후 생성된 크로스체인 브리지 - 체인 추상화, EOA - AA 지갑은 모두 이러한 사고 방식의 자연스러운 확장이므로 AI 에이전트가 암호화폐를 "침략"한 후 DeFi로 이어졌습니다. 그 장면은 전혀 놀라운 일이 아닙니다.

이것이 AI 에이전트의 개념이 혼란스러워지는 지점입니다. Crypto의 맥락에서 우리가 실제로 달성하려는 것은 "자동으로 재정을 관리하고 자동으로 새로운 밈을 생성하는" 에이전트입니다. 그러나 OpenAI의 정의에 따르면 이러한 위험한 시나리오에는 심지어 필요한 것이 있습니다. L4/L5는 진정으로 실현될 수 있으며, 대중이 가지고 노는 것은 자동 코드 생성이나 AI 원클릭 요약, 대필 등의 기능입니다. 두 당사자 간의 의사소통은 동일한 차원에 있지 않습니다.

이제 우리가 정말로 원하는 것이 무엇인지 이해했으니, AI Agent의 조직적 논리에 집중해 보겠습니다. 기술적인 세부 사항은 나중에 숨겨지겠지만, AI Agent의 에이전트 개념은 대규모 대중화의 장애물에서 기술을 제거하는 것입니다. 개인용 PC 산업의 마이다스 터치(Midas touch)이므로 인간-컴퓨터 상호 작용의 관점에서 AI 에이전트를 살펴보는 것과 AI 에이전트와 LLM의 차이점 및 연결에 중점을 두고 세 번째로 살펴보겠습니다. 부분: 암호화폐와 AI 에이전트의 조합은 결국 아무 것도 남기지 않습니다.

AI_Agent = LLM+API로 설정합니다.

ChatGPT와 같은 채팅 기반의 인간-컴퓨터 상호 작용 모델 이전에는 인간과 컴퓨터 간의 상호 작용이 주로 GUI(그래픽 인터페이스)와 CLI(명령줄 인터페이스)의 형태로 이루어졌습니다. App과 같은 형태, CLI와 Shell의 조합은 거의 변하지 않습니다.

그러나 이는 '프런트엔드' 표면에서의 인간-컴퓨터 상호작용일 뿐이다. 인터넷의 발달로 인해 데이터의 양과 유형이 증가하면서 데이터 간의 '백엔드' 상호작용도 증가하게 되었다. 두 가지가 서로 상호 작용하므로 단순한 웹 탐색 동작에도 실제로 두 가지의 협력이 필요합니다.

그러나 이는 '프런트엔드' 표면에서의 인간-컴퓨터 상호작용일 뿐이다. 인터넷의 발달로 인해 데이터의 양과 유형이 증가하면서 데이터 간의 '백엔드' 상호작용도 증가하게 되었다. 두 가지가 서로 상호 작용하므로 단순한 웹 탐색 동작에도 실제로 두 가지의 협력이 필요합니다.

사람과 브라우저 및 앱 간의 상호 작용에 대해 이야기하면 API 간의 링크와 점프는 실제로 일반 사용자에게는 필요하지 않은 부분입니다. 명령줄 및 API와 같은 용어를 이해하면 목적을 달성할 수 있습니다.

LLM의 경우에도 마찬가지입니다. 이제 사용자는 한 단계 더 나아갈 수 있으며 전체 프로세스는 다음 단계로 설명할 수 있습니다.

  1. 사용자가 채팅 창을 엽니다.
  2. 사용자는 자연어, 즉 텍스트나 음성을 사용하여 자신의 요구 사항을 설명합니다.
  3. LLM은 이를 간소화된 운영 단계로 분석합니다.
  4. LLM은 결과를 사용자에게 반환합니다.

이 과정에서 가장 큰 난제는 구글이라는 것을 알 수 있는데, 사용자가 검색 엔진을 열 필요가 없고 GPT와 같은 다양한 대화창을 열 필요가 있고 트래픽 입구가 조용히 바뀌고 있기 때문입니다. 이 LLM이 검색 엔진의 삶에 혁명을 일으킨다고 생각합니다.

그렇다면 AI 에이전트는 여기서 어떤 역할을 할까요?

한마디로 AI Agent는 LLM의 전문 분야입니다.

현재 LLM은 AGI가 아닙니다. 즉, OpenAI의 이상적인 L5 구성자가 아닙니다. 예를 들어 사용자가 너무 많은 정보를 입력하면 환각을 일으키기 쉽습니다. 예를 들어, GPT 1+1=3을 반복적으로 말하면 다음 상호작용에서 1+1+1=을 질문할 확률이 있습니다. 답이 4일 확률을 제공합니다.

현재 GPT의 피드백은 전적으로 개인 사용자로부터 나오기 때문에 모델이 인터넷에 연결되어 있지 않으면 귀하의 정보가 작동 메커니즘을 변경하는 것이 전적으로 가능합니다. 1+1=3을 알고 있습니다. 그러나 모델이 인터넷에 연결되도록 허용되면 결국 인터넷상의 대다수 사람들은 1+1=2를 믿습니다.

계속해서 난이도가 높아지면서 로컬에서 LLM을 사용해야 한다면 어떻게 이러한 문제를 피할 수 있습니까?

간단하고 조악한 방법은 두 개의 LLM을 동시에 사용하는 것이며, 질문에 답할 때마다 두 개의 LLM이 서로를 검증해야 한다고 규정하여 이것이 작동하지 않을 경우 오류가 발생할 가능성이 있습니다. 두 명의 사용자가 한 번에 하나의 프로세스를 처리하도록 하는 것과 같은 다른 방법에서는 한 사람은 질문을 담당하고 다른 사람은 질문을 미세 조정하여 언어를 보다 표준화되고 합리적으로 만드는 일을 담당합니다.

물론, 인터넷이 문제를 완전히 피할 수 없는 경우도 있습니다. 예를 들어 LLM이 정신지체자 막대에서 답변을 검색하는 경우에는 더 나쁠 수도 있습니다. 그러나 이러한 데이터를 피하면 사용 가능한 데이터의 양이 줄어들므로 기존 데이터가 분할될 수 있습니다. 답변의 신뢰성을 높이기 위해 이전 데이터를 기반으로 새로운 데이터를 생성하기도 합니다. 실제로 이것이 RAG(Retrieval-Augmented Generation)의 자연어 이해입니다.

인간과 기계는 서로를 이해해야 합니다. 여러 LLM이 서로를 이해하고 협력할 수 있도록 허용하면 본질적으로 AI 에이전트의 작동 모드를 건드리는 것입니다. 다른 대리인.

이를 통해 LLM과 AI Agent의 연관성을 파악했습니다. LLM은 인간이 대화창을 통해 소통할 수 있는 지식의 집합이지만 실제로는 특정 작업 흐름이 특정 작은 프로그램, Bot, 및 명령어 세트를 Agent로 정의합니다.

AI Agent는 여전히 LLM의 일부이며 둘을 동일하다고 볼 수 없습니다. AI Agent의 호출 방법은 LLM을 기반으로 하며 특히 외부 프로그램, LLM 및 기타 Agent의 협업에 중점을 두므로 AI Agent = LLM입니다. +API 느낌.

그런 다음 LLM 워크플로에서 AI 에이전트에 대한 지침을 추가할 수 있습니다. X의 API 데이터 호출을 예로 들어 보겠습니다.

  1. 인간 사용자가 채팅 창을 엽니다.
  2. 사용자는 자연어, 즉 텍스트나 음성을 사용하여 자신의 요구 사항을 설명합니다.
  3. LLM은 이를 API 호출과 유사한 AI 에이전트 작업으로 구문 분석하고 대화 권한을 에이전트에 전송합니다.
  4. AI 에이전트는 사용자 X에게 계정과 API 비밀번호를 묻고, 사용자의 설명을 바탕으로 온라인으로 X와 통신합니다.
  5. AI Agent는 최종 결과를 사용자에게 반환합니다.

Web 1.0과 Web 2.0에 존재했던 브라우저와 API는 여전히 존재하겠지만, 사용자는 그 존재를 완전히 무시하고 AI Agent API 호출과만 상호작용하면 됩니다. 및 기타 프로세스는 대화식으로 사용될 수 있으며, 이러한 API 서비스는 상대방이 인터페이스를 열고 사용자에게 권한이 있는 한 로컬 데이터, 네트워크 정보, 외부 앱 데이터를 포함하여 모든 유형이 될 수 있습니다. 그것을 사용하기 위해.

위 그림은 완전한 AI Agent 사용 과정을 보여주고 있습니다. LLM은 AI Agent와 별개의 부분으로 간주될 수도 있고, 프로세스의 두 개의 하위 링크로 간주될 수도 있습니다. , 이는 사용자의 요구를 충족시킵니다.

인간-컴퓨터 상호작용 과정의 관점에서 볼 때, 사용자가 자신과 대화를 하고 있더라도 자신의 생각과 생각을 표현하기만 하면 AI/LLM/AI 에이전트가 사용자의 요구 사항을 계속해서 추측합니다. 피드백 메커니즘을 추가하고 LLM이 현재 상황 컨텍스트(Context)를 기억하도록 요구하면 AI 에이전트가 자신이 하고 있는 일을 갑자기 잊지 않도록 할 수 있습니다.

간단히 말해서 AI Agent는 기존 스크립트 및 자동화 도구와의 본질적인 차이점입니다. 성격은 여전히 ​​일종의 확률이다. 추측에 따르면, L3급 AI 에이전트는 인간의 이해와 표현 능력이 없기 때문에 외부 API와 연결하는 것은 위험으로 가득 차 있다.

AI 프레임워크로 수익화 후

AI 프레임워크가 수익화될 수 있다는 사실은 제가 암호화폐에 계속 관심을 갖는 중요한 이유입니다. 전통적인 AI 기술 스택에서는 프레임워크가 그다지 중요하지 않으며, 적어도 데이터 및 컴퓨팅 성능만큼 중요하지도 않습니다. 결국 대부분의 AI 알고리즘과 모델 프레임워크는 오픈 소스 제품이기 때문에 데이터와 같은 민감한 정보가 바로 그것입니다.

본질적으로 AI 프레임워크나 모델은 일련의 알고리즘을 담은 컨테이너이자 조합인데, 이는 거위를 끓이는 솥과 같다. 그러나 거위의 종류와 열의 조절이 맛을 구별하는 열쇠이다. 판매하는 제품은 본질적으로 다릅니다. 큰 거위여야 하는데 지금은 진주를 위해 관을 사고 싶지만 냄비를 사서 거위를 버리는 고객이 있습니다.

그 이유는 복잡하지 않습니다. Web3의 AI 제품은 기본적으로 다른 사람의 지혜를 기반으로 합니다. 그들은 모두 기존 AI 프레임워크, 알고리즘 및 제품을 기반으로 하는 맞춤형 제품이므로 서로 다른 Crypto AI 프레임워크의 기술적 원리도 크게 다르지 않습니다. 구별할 수 없으므로 이름, 응용 시나리오 등에 대해 소란을 피울 필요가 있습니다. 따라서 AI 프레임워크 자체에 대한 일부 사소한 조정이 다른 토큰의 지원이 되어 Crypto AI Agent의 프레임워크 버블이 발생했습니다.

학습 데이터와 알고리즘에 막대한 투자를 할 필요가 없기 때문에 이름 구별 방법이 특히 중요합니다. DeepSeek V3가 아무리 저렴하더라도 여전히 의사의 머리카락과 GPU 및 전력 소비가 많이 필요합니다.

어떤 의미에서 이것은 최근 Web3의 일관된 스타일이기도 합니다. 즉, 토큰 발행 플랫폼이 토큰보다 더 가치가 있다는 것입니다. 이는 Pump.Fun/Hyperliquid에서도 마찬가지입니다. 에이전트는 원래 애플리케이션이자 자산이어야 하지만, 에이전트 발급 프레임워크는 가장 인기 있는 제품이 되었습니다.

실제로 이는 다양한 유형의 Agent 간에 구분이 없으므로 Agent 프레임워크가 더 안정적이고 자산 발행의 가치 사이펀 효과를 생성할 수 있는 암호화폐 조합의 현재 1.0 버전입니다. 그리고 AI 에이전트.

2.0 버전이 등장하고 있는데, 일반적으로 DeFi와 AI 에이전트의 결합입니다. DeFAI의 개념은 물론 열기에 자극받은 시장 행동이지만 다음과 같은 상황을 고려하면 다르다는 것을 알 수 있습니다.

2.0 버전이 등장하고 있는데, 일반적으로 DeFi와 AI 에이전트의 결합입니다. DeFAI의 개념은 물론 열기에 자극받은 시장 행동이지만 다음과 같은 상황을 고려하면 다르다는 것을 알 수 있습니다.

  • Morpho는 Aave와 같은 오래된 대출 상품에 도전하고 있습니다.
  • Hyperliquid는 dYdX의 온체인 파생상품을 대체하고 심지어 Binance의 CEX 상장 효과에 도전하고 있습니다.
  • 스테이블코인은 오프체인 시나리오를 위한 결제 도구가 되고 있습니다.

AI가 DeFi의 기본 로직을 개선하는 것은 DeFi의 진화 배경에 어긋납니다. 이전 DeFi의 가장 큰 로직이 스마트 계약의 타당성을 검증하는 것이라면 AI Agent는 DeFi의 제조 로직을 변경할 필요가 없습니다. DeFi를 이해하려면 이러한 방식으로만 DeFi 제품을 만들 수 있습니다. 이는 체인 추상화보다 더 발전된 하위 수준의 권한 부여입니다.

누구나 프로그래머가 되는 시대가 온다. 복잡한 계산은 AI 에이전트 뒤에 있는 LLM과 API에 아웃소싱하면 된다. 개인은 자신의 아이디어에만 집중하면 되고, 자연어는 프로그래밍 로직으로 효율적으로 변환될 수 있다.

결론

Cookie.Fun은 AI 에이전트 정보 수집 및 토큰 발견 플랫폼, AI 에이전트 프레임워크, 마지막으로 에이전트 생성 작업을 충분히 수행했기 때문에 이 기사에서는 Crypto AI 에이전트 토큰 및 프레임워크에 대해 언급하지 않습니다. 갑자기 왔다가 사라지는 것, 기사에 계속해서 정보를 나열하는 것은 가치가 없습니다.

그러나 이 관찰 기간 동안 Crypto AI Agent가 시장에서 가리키는 것이 무엇인지에 대한 실질적인 논의가 항상 부족합니다.

다양한 기초자산을 지속적으로 자산으로 변환할 수 있는 능력이 바로 크립토의 매력입니다.

댓글

모든 댓글

Recommended for you