Cointime

Download App
iOS & Android

“AI 훈련하려면 돈 내”…학습용 데이터 갈등 격화

챗GPT가 세계적으로 주목받으면서 인공지능(AI) 개발 열풍이 불고 있다. AI 능력의 최대변수는 학습용 데이터다. 최근 이미지, 영상, 텍스트 등 AI 훈련에 쓰이는 학습용 데이터에 대한 권리를 주장하는 목소리가 커지고 있는 이유다.

언론사부터 소셜미디어, 창작자까지 데이터 소유권자들은 개발사들이 AI 훈련에 데이터를 활용하는 만큼 적절한 이용료를 내야 한다고 요구하고 있다. 앞으로 AI 학습용 데이터를 둘러싼 갈등이 커질 것으로 보인다.

이런 상황에서 최근 일론 머스크 테슬라 최고경영자(CEO)는 마이크로소프트(MS)가 인공지능(AI)을 언어모델을 훈련하기 위해 트위터의 데이터를 불법적으로 사용했다며 소송을 제기하겠다고 밝혔다.

머스크는 19일(현지시간) 트위터를 통해 “그들이 트위터 데이터를 사용해 불법적으로 훈련했다”며 “소송해야 할 때”라고 말했다.

머스크가 소송까지 불사하겠다고 반응한 이유는 MS가 자사의 마케팅 플랫폼에서 트위터를 제외한 것에 따른 대응 차원으로 풀이된다.

MS는 ‘디지털 마켓팅 센터'(DMC)를 통해 인스타그램, 페이스북, 링크드인 등 여러 소셜미디어 계정을 관리하고 고객에게 메시지를 보내는 기능을 제공해왔다.

IT매체 매셔블은 트위터가 이달 29일부터 기업 고객을 대상으로 API 유료화 정책을 시행하겠다고 밝히면서 MS가 대응에 나섰다고 보도했다. 트위터는 무료로 제공했던 API 접근 권한에 대한 이용료로 월 4만2000달러(약 5600만원)를 부과할 예정이다.

외신들은 이같은 조치가 AI 훈련 과정에서 발생하는 데이터 소유권 논란을 잘 보여주는 사례라고 말했다. CNBC는 “머스크의 고소 위협은 데이터 소유권이 생성형 AI 개발 경쟁의 우려스러운 전쟁터가 되고 있음을 보여주는 최근의 징후”라고 설명했다.

오픈AI의 챗GPT가 주목을 받으면서 빅테크 기업들이 생성 AI 개발에 몰두하고 있는 가운데 데이터 소유권자들이 언어모델 훈련에 사용되는 데이터에 대한 비용을 지불해야 한다고 주장하고 있다.

GPT와 같은 거대 언어모델(LLM)을 훈련시키기 위해서는 데이터가 필수적인데, 이를 온라인에서 수집하는 경우가 많다. 특히 트위터와 같은 소셜미디어의 데이터는 격식 없는 대화 내용이 담겨 있어 가치가 높은 것으로 알려졌다.

데이터를 소유하고 있는 회사들과 단체들은 AI 개발사를 상대로 대응 마련에 나섰다. 데이터 사용비용을 청구할 예정이거나 심지어 법적 대응에 나서는 경우도 있다.

미국의 온라인 커뮤니티 레딧은 AI 개발 기업들이 자사의 데이터를 다운로드 하기 위해 API를 사용하면 비용을 청구할 계획이라고 밝혔다.

스티브 허프먼 레딧 CEO는 “레딧의 데이터는 정말로 가치가 있다”며 “그러한 가치 있는 것들을, 그것도 세계에서 가장 큰 회사들에 전부 무료로 제공할 필요는 없다”고 말했다.

미국과 캐나다 언론사 2000여개가 가입된 뉴스미디어연합(NMA)은 AI 학습에 뉴스 콘텐츠가 어느 정도 활용되고 있는지 조사 중이라고 밝혔다. 월스트리트저널(WSJ)의 모기업인 뉴스코프는 AI 개발사가 자사의 콘텐츠를 활용하는 것에 대한 소송도 검토 중이다.

미국에서 인기 래퍼 드레이크가 부른 신곡이 AI가 만들었다는 사실이 밝혀지면서 음반제작사인 유니버셜 뮤직이 저작권 침해 가능성을 경고하기도 했다.

이미지 서비스 업체인 게티이미지는 AI 훈련을 위해 자사의 데이터를 무단으로 활용했다고 주장하며 스테이블 디퓨전을 개발한 스태빌리티 AI를 고소했다.

출처: blockmedia

댓글

모든 댓글

Recommended for you

  • AI 인프라 플랫폼 마호진, 500만 달러 자금 조달 완료

    AI 인프라 플랫폼 마호진은 a16z CSX와 Maelstrom이 주도한 500만 달러 규모의 자금 조달 라운드를 완료했다고 발표했습니다. 마호진은 AI 모델 제작자와 데이터 세트 개발자를 위한 "GitHub"를 구축하는 것을 목표로 합니다. 해당 플랫폼은 지적 재산권을 추적하고 모델과 데이터 세트의 원래 기여자에게 비용을 지불할 수 있습니다.

  • 브라질 고위 관리: 비트코인 ​​매장량은 브라질 번영에 "필수적"

    "비트코인의 전략적 비축은 국가적 번영에 필수적입니다. BTC 비축금 창출에 대한 논의는 브라질의 번영을 결정하는 핵심 요소가 될 수 있으며 국가와 대중의 이익에 부합합니다." 브라질 부통령의 수석 고문인 페드로 조콘도 게라는 최근 연설에서 정부를 대신하여 말했다고 합니다. 브라질 의원 에로스 비온디니(PL-MG)는 이전에 "전략적 주권 비트코인 ​​보유금"(RESBit) 창설을 제안하는 법안을 도입했습니다. 외환 보유액(국제 보유액)의 5%를 비트코인으로 보유할 예정이다. 브라질 중앙은행은 첨단 모니터링 시스템, 블록체인 기술, 인공지능을 활용해 거래를 모니터링하고 보관을 담당할 예정입니다.

  • Bitpanda, 두바이 가상자산청으로부터 브로커-딜러 라이선스 취득

    비엔나에 본사를 둔 Bitpanda는 두바이 가상자산 규제기관(VARA)으로부터 브로커-딜러 라이선스를 받았습니다.

  • Hibit은 Bochsler Finance와 Nvdia가 주도한 500만 달러 규모의 신규 자금 조달 라운드 완료를 발표했습니다.

    히빗은 500만 달러 규모의 신규 자금 조달을 완료했다고 발표했습니다. 이번 라운드의 투자자로는 Bochsler Finance, Nvdia, Distributed Shenbo, Waterdrop Capital, Web3 Venture, Betterverse DAO, Hitters 등 여러 유명한 전통 기업가가 포함됩니다. 자금 조달은 Layer2 인프라, Hibit DEX, 풀체인 상호 운용성 기술, AI Agent 경제의 심층적 레이아웃을 포함하여 Hibit 생태계를 더욱 개선하는 데 사용될 예정입니다.

  • 미국 인공지능 스타트업 유토리, 1500만 달러 모금

    샌프란시스코에 본사를 둔 스타트업 Yutori가 인공지능 개인 비서를 개발하기 위해 1,500만 달러의 자금을 조달했습니다. 2025년 3월 27일에 발표된 이 라운드는 Radical Ventures의 Rob Toews가 주도했으며 Felicis, AI 전문가 Fei-Fei Li, Google DeepMind 수석 과학자 Jeff Dean이 참여했습니다.

  • 밈 인큐베이션 플랫폼 코어스카이, 1,500만 달러 규모의 시리즈 A 자금 조달 완료

    Meme 인큐베이션 플랫폼 Coresky는 Tido Capital이 주도하고 WAGMi Ventures, Copilot Venture Studio, Web3 Vision Fund, Parallel Ventures가 참여한 1,500만 달러 규모의 시리즈 A 자금 조달 라운드를 완료했다고 발표했습니다. 아직 평가 정보는 공개되지 않았습니다. 지금까지 이 회사의 총 자금 조달은 2,100만 달러에 달했습니다.

  • Vest Labs, Amber Group, QCP Capital 및 기타 투자자와 함께 500만 달러 규모의 시드 라운드 자금 조달 완료

    Golden Finance는 실시간 위험 가격 책정을 기반으로 하는 금융 인프라 기업인 Vest Labs가 Jane Street, Amber Group, Selini Capital, QCP Capital, Big Brain Holdings가 참여한 500만 달러 규모의 시드 라운드 자금 조달을 완료했다고 발표했습니다. 이 새로운 자금은 금융 시장의 투명성과 효율성을 개선하기 위해 제로 지식 증명을 기반으로 하는 실시간 검증 가능한 위험 가격 책정 모델을 구축하는 데 사용될 예정입니다. 동시에 Arbitrum, Solana, Base와 같은 L2를 지원하는 영구 선물 거래 플랫폼도 출시할 예정입니다.

  • 디지털 자산 고빈도 거래 회사 ABEX, 600만 달러 신규 자금 조달 라운드 완료

    영국 런던에 본사를 둔 디지털 자산 고빈도 거래 회사인 ABEX는 MMC Ventures가 주도한 600만 달러 규모의 자금 조달 라운드를 완료했다고 발표했습니다. 이 새로운 자금은 중앙 집중형 및 분산형 금융 장소에서 거래 실행의 효율성을 개선하기 위한 파생 상품 거래 및 알고리즘 실행 솔루션을 출시하는 데 사용될 예정입니다. 이 회사는 영국 금융 행위 기관(FCA)에 등록되었으며 암호화폐 거래 활동에 참여할 수 있는 허가를 받았다고 합니다.

  • 트럼프 대통령의 디지털 자산 서밋 연설이 마무리됐다.

    트럼프 미국 대통령의 디지털 자산 서밋 연설이 끝났습니다.

  • 다중 엔진 Web3 게임 플랫폼 PlaysOut, Kenetic Capital 주도로 7억 달러 시드 라운드 자금 조달 완료

    다중 엔진 Web3 게임 플랫폼인 PlaysOut은 Kenetic Capital, KBW Ventures 등이 주도하고 Gam3Girl Ventures, Oak Grove Ventures, Aptos, Yugana Labs, Sentor Investments, Longling Capital 등이 참여한 7억 달러 규모의 시드 라운드 자금 조달을 완료했다고 발표했습니다. 기업의 가치는 7,000만 달러입니다. 새로운 자금은 Web2와 Web3 간의 격차를 해소하기 위한 노력을 진전시키는 데 사용될 예정입니다. 이를 통해 개발자들은 온체인에서 자산을 구축하고 토큰 기반 인센티브, NFT 통합, 블록체인 기반 경제를 탐구하여 수익화 모델을 활용할 수 있습니다.