예를 들어 계층의 키와 몸무게, 회사의 Double Eleven 비즈니스 상황, 국가의 GDP 및 추세 등 모든 사람에게 물어보고 싶다면 "데이터"란 무엇입니까?
아마도 모든 사람이 빠르게 정의를 내리고 일련의 이해하기 쉬운 예를 생각해 낼 수 있을 것입니다. 그러므로 '데이터'는 우리에게 매우 가깝고, 우리가 생성하거나 전송하는 만큼 가깝고, 우리 삶의 지침으로 삼을 수 있을 만큼 가깝다고 할 수 있습니다.
하지만 그것은 우리와는 너무 먼 것 같습니다 개인에 대한 많은 양의 데이터가 휴대폰과 컴퓨터를 통해 수집되거나, 이해할 수 없는 0과 1로 가득 찬 화면으로 단순화되어 알려지지 않은 서버에 분산되어 저장됩니다. 또는 차단되었습니다. 구조화된 용어의 눈부신 배열이 다채로운 차트로 만들어집니다.
생산자로서 데이터를 이해하고 제어하는 것이 점점 더 어려워지고 있습니다.
이미지 출처: swyftx
독자들이 이 개념에 대해 더 깊이 이해할 수 있도록 NetEase 블록체인은 Web 3.0 시대의 "데이터"를 파악하는 방법과 미래 동향에 대한 연재 칼럼을 시작할 예정입니다. 데이터 논리를 다각도로 깊이 탐구하고 분석할 것입니다. 기술 변화 시대에 데이터의 중요성, 성능 향상의 이유, 가장 가치 있는 데이터의 모습을 설명하고 데이터의 가치를 포착하기 위한 다양한 시나리오를 탐색합니다.
데이터는 유동적이며, 불확실성 속에서 확실성을 찾는 것이 첫 번째 연재물의 목표입니다. "데이터"를 여는 올바른 방법에 대한 첫 번째 기사에서는 웹 3.0 시대의 도래와 그것이 데이터의 가치를 보호하고 이해하며 심지어 재구성할 수 있는지에 대해 논의할 것입니다.
나선은 여전히 남아 있고 데이터 문제는 계속해서 논의되고 있습니다.
- 데이터 전송 제한
데이터 저장 및 사용자 정보 보호는 항상 사용자가 해결하기 어려운 문제였습니다. 최근 몇 년 동안 데이터 유출 사고는 데이터 수집 및 저장에 대한 사용자의 신뢰를 지속적으로 약화시켰습니다. 사용자가 개인 정보를 중앙 집중식 저장 시설에 업로드하는 경우 이는 정보에 대한 통제력을 상실한다는 의미입니다. 이러한 개인정보가 분실, 유출, 도난당하게 되면 이는 개인에게 있어 '사회적 죽음'이 됩니다.
페이스북은 2013년 이후 최소 5번의 데이터 유출 사건을 겪었습니다. 2019년 유출은 심지어 5억 4천만 개의 계정에 영향을 미쳤습니다. 페이스북은 유출이 "오래된 데이터"이며 이 사건과 관련하여 사용자에게 어떠한 조언도 제공하지 않을 것이라고 설명했습니다.
2016년 12월 14일, 야후는 2013년에 회사의 10억 개 이상의 사용자 계정이 해커에 의해 도난당했다고 발표했습니다. 도난당한 정보에는 이름, 연락처 정보, 비밀번호, 보안 질문 및 답변이 포함될 수 있으며, 이듬해 야후는 30억 명의 야후 사용자 전원의 개인정보가 유출되었다고 밝혔는데, 이는 2016년 발표된 수치의 3배에 달하는 수치입니다.
2016년 12월 14일, 야후는 2013년에 회사의 10억 개 이상의 사용자 계정이 해커에 의해 도난당했다고 발표했습니다. 도난당한 정보에는 이름, 연락처 정보, 비밀번호, 보안 질문 및 답변이 포함될 수 있으며, 이듬해 야후는 30억 명의 야후 사용자 전원의 개인정보가 유출되었다고 밝혔는데, 이는 2016년 발표된 수치의 3배에 달하는 수치입니다.
데이터 보안법 및 개인 정보 보호법이 시행된 이후 당사는 데이터 보안 및 개인 정보 보호에 대한 보다 엄격한 요구 사항을 제시했습니다. Web2.0은 데이터 거버넌스에 관해 만족스러운 답변을 제시하지 못했다고 할 수 있습니다.
- 데이터 활용의 어려움
빅데이터와 사물인터넷 시대에는 모든 것이 걸어다니는 '데이터' 소스라고 할 수 있다. 이로 인해 2010년부터 2020년까지 전 세계가 생성, 복사, 소비하는 데이터 저장량의 증가율도 엄청나다. 데이터/정보의 총량은 64.2ZB이며, 이 숫자는 계속 증가하고 있습니다.
Statista에 따르면 2025년에는 180ZB를 초과할 것으로 예상됩니다. 이렇게 놀라울 정도로 증가하는 데이터 양을 보면 앞으로 데이터를 정리하고 검사하는 것이 얼마나 어려울지 짐작할 수 있습니다.
이는 Web2.0 데이터 섬으로 인한 부정적인 영향 중 하나이기도 합니다. 앱이 열릴 때마다 사용자는 등록을 완료하는 수고를 거쳐야 하며, 자신도 모르게 앱에 다른 정보를 얻을 수 있는 권한을 부여할 수 있습니다. 각 애플리케이션은 서로 독립적이며 서로 통신하지 않는 자체 사용자 데이터베이스를 제어합니다.
반복적인 데이터 수집은 많은 시간, 네트워크 대역폭, 컴퓨팅 리소스를 소비할 뿐만 아니라, 단편화된 수집 상태로 인해 데이터의 포괄적인 분석 및 마이닝이 제한되어 데이터에서 잠재적인 가치와 통찰력을 발견하기가 어렵습니다. 다양한 데이터 소스 간의 효율적인 비교 및 검증을 통해 대용량 데이터의 고유성과 정확성이 처리를 기다리고 있습니다.
데이터 사용자는 완료하기 위해 많은 시간과 자원을 소비해야 하며, 제공자는 자체 입증할 수 없는 전통적인 복권 및 복권 메커니즘과 같은 자세한 데이터 수집 방법, 처리 절차 또는 추적성 정보를 제공할 수 없거나 제공하기를 꺼릴 수 있습니다. 사용자가 데이터의 신뢰성과 신뢰성을 확인하는 것이 더욱 어려워지고 있습니다.
분명히, 데이터 순환 제한에 따른 검사는 사용자가 우회할 수 없는 문제가 되었습니다.
- 데이터 값 매칭
Web2.0을 사용하면 더 많은 사용자가 웹 콘텐츠 생성에 상호 작용하고 참여할 수 있지만 모든 사용자가 일치 권한을 얻은 것은 아닙니다. 사용자 생성 콘텐츠는 사용자 충성도를 높이는 데 사용될 뿐만 아니라 플랫폼이 소유하거나 상업적 목적으로 사용될 수도 있습니다.
많은 플랫폼에서는 광고 타겟팅이나 제3자에 대한 데이터 판매 등을 통해 상업적 가치를 얻기 위해 사용자 데이터를 수집하고 분석할 수 있습니다.
이미지 출처: swyftx
트위터(현재 리셀링)는 이 과정에서 사용자를 '데이터 작업자'로 간주하여 사용자 계약을 마음대로 변경하는 플랫폼과 기업을 지속적으로 육성합니다. 이때 사용자는 제품 그 자체입니다.
트위터(현재 리셀링)는 이 과정에서 사용자를 '데이터 작업자'로 간주하여 사용자 계약을 마음대로 변경하는 플랫폼과 기업을 지속적으로 육성합니다. 이때 사용자는 제품 그 자체입니다.
비전의 수준을 더욱 높이고 데이터의 가치에 대해 논의해보자. 결국 그것은 복잡하고 다차원적인 과정이다. 그것이 실용적인지, 희소한지, 올바른지, 중요한지, 사회적, 집단적 가치를 포함하는지, 그리고 그것이 가능한지 여부 여전히 데이터로 활용되고 있으며, 사용자 등이 가져올 잠재적인 비즈니스 기회도 모두 데이터 가치 분포에 영향을 미치는 요소에 포함될 수 있습니다.
산업, 기관, 개인마다 데이터의 가치에 대한 인식과 평가 기준이 다를 수 있으므로 사용자가 데이터를 제공한 후 그에 상응하는 가치 분포를 얻을 수 있다고 하더라도 그 가치를 평가하는 것은 극히 어렵습니다.
또한, 디지털 환경에서는 데이터가 쉽게 복사되고 유포될 수 있고, 다른 참여자들이 동일한 데이터에 접근할 수 있기 때문에, 사용자가 데이터의 내용에 노출되면 데이터의 고유한 가치는 크게 감소합니다.
데이터 공급자의 경우 추가 서비스, 분석 통찰력 또는 다른 데이터 세트와의 결합을 제공하여 데이터의 가치를 높이려고 할 수 있으며, 이 시점에서 데이터 가치 할당은 메타데이터 공급자를 우회하여 데이터 분산이 발생합니다. 가치는 더욱 복잡해진다.
웹 3.0은 파괴 없이 데이터의 가치를 재구성합니다.
- 데이터 거버넌스: 데이터를 안전하고 제어 가능하게 만들기
Web3.0 프로젝트는 백엔드와 메타데이터를 분산형 저장소와 연결하는 것의 중요성을 점차적으로 발견했습니다 Web3.0 체인의 데이터는 일반적으로 단일 중앙 서버에 저장되지 않고 여러 노드에 분산됩니다.
일부 노드가 공격을 받거나 오작동하더라도 다른 노드는 계속해서 데이터를 제공할 수 있습니다. 특히 사용자의 개인 정보, 금융 데이터 및 민감한 비즈니스 데이터의 경우 분산형 저장소를 사용하면 중앙 집중식 저장소의 단일 실패 지점과 잠재적인 보안 위험을 방지하고 사용자 데이터의 손상을 방지할 수 있습니다.
또한, 최신 AI 기술을 활용해 데이터 저장 및 유통 과정에서 발생하는 보안 문제를 신속하게 조사할 수도 있습니다.
AI 기반 침입탐지 시스템은 행동 모델과 룰 엔진을 구축해 자동으로 취약점 스캔을 수행하고, 무차별 로그인 시도, 기타 악성 활동 등 온라인 데이터의 이상 행위에 대해 실시간 모니터링과 조기 경고를 제공한다. 그리고 AI는 지속적인 머신러닝을 통해 네트워크 위협에 대한 방어 능력을 향상시키고, 공격 패턴, 새로운 위협, 취약점 정보를 분석하고, 지속적인 자가 학습과 방어 전략 업데이트를 통해 변화하는 위협 환경에 적시에 적응합니다.
이미지 출처: swyftx
프라이버시를 완벽하게 보호하는 기반에서 데이터를 심층적으로 채굴하는 것은 디지털 경제 발전의 필수적인 부분입니다. "더 나은 플레이를 위한 데이터 기본 시스템 구축에 대한 중국 공산당 중앙위원회 및 국무원의 의견"에서 2022년 말 공개된 데이터 요소의 역할'에서는 데이터를 '사용할 수 없음'이 법적 요구사항이 되었습니다.
데이터 순환의 보안 문제를 해결하기 위해 개인 정보 보호 컴퓨팅 기술을 사용하는 것은 필수 기술이자 솔루션이 되었습니다.
프라이빗 컴퓨팅 기술을 사용하면 원본 데이터를 노출하지 않고 계산 및 분석이 가능하므로 민감한 데이터의 개인정보가 보호됩니다. 유럽연합 사이버보안국(ENISA)은 "개인정보 보호 강화 기술"을 다른 핵심 개인정보 보호 및 데이터 보호 원칙 중에서 데이터 최소화, 익명화, 가명화를 지원하도록 설계된 기술로 정의합니다.
주요 기술 라인 중 하나인 영지식증명(ZKP)을 예로 들면, 증명자는 정보의 실제 내용을 공개하지 않고도 자신이 특정 정보를 소유하고 있음을 검증자에게 보여줄 수 있습니다. 증명 과정에서 데이터의 접근 및 사용 권한은 필요에 따라 정밀하게 제어될 수 있으며, 검증자는 영지식 증명으로부터 증명자에 대한 실제 정보를 얻을 수 없습니다.
주요 기술 라인 중 하나인 영지식증명(ZKP)을 예로 들면, 증명자는 정보의 실제 내용을 공개하지 않고도 자신이 특정 정보를 소유하고 있음을 검증자에게 보여줄 수 있습니다. 증명 과정에서 데이터에 대한 접근 및 사용 권한은 필요에 따라 정밀하게 제어될 수 있으며, 검증자는 영지식 증명으로부터 증명자에 대한 실제 정보를 얻을 수 없습니다.
따라서 데이터 주체는 개인 정보를 공개하지 않고도 영지식 증명을 통해 특정 속성이나 자격을 보유하고 있음을 애플리케이션에 증명할 수 있습니다. 애플리케이션은 특정 데이터를 알지 못해도 증명의 유효성을 확인할 수 있습니다.
이 속성은 영지식 증명을 사용자 개인 정보 보호 및 인증을 보호하고 사용자와 애플리케이션 간의 데이터 신뢰를 연결하는 강력한 도구로 만듭니다. 동시에 개인 정보 보호 컴퓨팅 기술은 안전한 데이터 공유 및 협력을 달성하고 데이터 순환 장벽을 허물 수 있는 가능성도 창출합니다.
보안 컴퓨팅 프로토콜을 통해 다양한 조직은 원본 데이터를 공유하지 않고도 분산 모델 추론 또는 훈련을 수행할 수 있으며, 동시에 데이터 제공자의 지적 재산권을 보호하고, 신뢰를 기반으로 데이터 요소가 완전히 유통될 수 있도록 하며, 조직 간 데이터 협력 및 제공이 가능합니다. 규정 준수는 더 많은 기회와 유연성을 제공하여 국가 규정을 준수하면서 동일 업계 및 업계 전반의 기업 간 데이터 제휴를 촉진합니다.
실제 비즈니스 시나리오에 적용되는 개인 정보 보호 컴퓨팅 기술은 반복 비용 및 안정성 등의 문제에 직면해 있지만, 지속적인 기술 개발로 인해 데이터 시장의 인프라는 점차 개선되고 성숙되어 데이터 독점 및 개인 정보 보호 보안이 해결될 것입니다. 코너.
- 데이터 가치: 사용자가 함께 만들고 공유할 수 있음
Web3.0의 핵심 개념 중 하나는 데이터 소유권과 가치 귀속의 전환입니다.
축적된 모든 온체인 상호작용 행위 데이터에 대해 사용자는 이를 기반으로 창출된 가치를 정당하게 누릴 수 있습니다. 데이터는 자원에서 확인되고 유동적이며 혜택을 제공하는 개인 자산으로 진화했습니다. 인센티브 모델은 창의성을 자극하고 보상하는 것을 목표로 합니다. Web1.0, Web2.0 단계에서는 전혀 상상할 수 없었던 일입니다.
데이터 가치가 실제로 흐르게 하려면 우선 각 체인에 있는 데이터의 재산권을 확인할 수 있습니다. 블록체인상의 데이터 거래 및 소유권 이전은 완전히 공개적으로 볼 수 있으며 플랫폼 전반에 걸쳐 흐를 수 있으며 원본 데이터 생산자의 권리와 이익이 완전히 보호될 수 있습니다.
이로 인해 생산자는 스마트 계약을 통해 데이터 사용 및 공유 규칙을 정의하고 데이터의 부가가치 및 사용 시나리오를 기반으로 다양한 라이센스 계약을 공식화하여 추가 서비스 및 데이터 세트 조합의 사용으로 인한 합리적인 이익을 보장할 수 있습니다.
둘째, 데이터 자산의 원활한 유통을 위한 전제조건은 데이터 요소 시장의 육성을 완성하는 것이다. 이를 위해 Shanghai Data Exchange는 데이터 제공자 시스템 출시, 데이터 거래 주체, 데이터 규정 준수 컨설팅, 품질 평가, 자산 평가, 배달 및 기타 분야 새로운 비즈니스 형식은 어려운 데이터 가격 책정 문제를 해결하고 디지털 배당금을 완전히 실현합니다.
[NetEase Planet 5주년 기념 스페셜] 디지털 자산을 포함한 여러 디지털 컬렉션 시리즈가 상하이 데이터 거래소에 등록되었으며, 디지털 자산 관련 콘텐츠와 권리가 "중국 디지털 자산 네트워크"에 표시됩니다.
올해 초부터 Shanghai Data Exchange의 데이터 거래량은 지속적으로 증가해 월간 거래량이 1억 위안을 넘어섰고, 2023년에는 연간 거래량이 10억 위안을 넘어설 것으로 예상된다. 금융, 해운, 운송, 국제 등을 포함한 1,600개가 넘는 데이터 상품이 등록되어 있습니다. 다른 분야에서도 점점 더 활발해지는 시장 거래 생태계가 점차 형성되고 있습니다.
Web3.0은 또한 가치 인센티브 부분에 대한 새로운 탐색 경로를 제안합니다. 생산자와 사용자 모두 DAO를 통해 데이터 사용 및 배포에 대한 의사 결정 및 거버넌스에 참여할 수 있습니다.
Web3.0은 또한 가치 인센티브 부분에 대한 새로운 탐색 경로를 제안합니다. 생산자와 사용자 모두 DAO를 통해 데이터 사용 및 배포에 대한 의사 결정 및 거버넌스에 참여할 수 있습니다.
인센티브 메커니즘을 설정하여 데이터 참가자의 기여에 대해 보상합니다. 예를 들어, 데이터 기여, 데이터 품질, 데이터 검증 등에 대한 데이터 참여자의 기여도는 기여 알고리즘 또는 기타 메커니즘을 통해 평가되고 보상됩니다. 이는 데이터 참여자가 공정한 수익을 받도록 보장하면서 데이터 사이클 거버넌스에 참여하도록 장려합니다.
권리 보호, 규정 준수 및 지속 가능성 문제를 점진적으로 해결하는 동시에 새로운 생태학적 아키텍처 DAO를 통해 데이터 가치 분배에 대한 보다 폭넓은 참조와 합의를 제공할 수 있기를 기대합니다.
요약
웹 3.0은 다양한 기술 경로를 통합하는 혁명으로, 인공지능과 블록체인 기술 등 신기술의 결합을 통해 재구성된 투명하고 안전하며 가치를 창출하는 온라인 생태계는 미래에 흥미로운 새로운 비즈니스 모델을 탄생시킬 것입니다. 시나리오.
데이터라는 기본 기둥에서, 더 많은 일반 사용자들이 데이터를 생산 수단뿐만 아니라 생산성으로도 활용하여 사용자 경험에 질적인 변화를 가져올 것으로 기대합니다.
참조 소스:
[1] 하나의 기사에서 Web3 데이터 트랙을 이해합니다: 시장 구조, 대표 프로젝트 및 미래 동향.
[2] 프라이빗 컴퓨팅 퍼블릭 체인의 신뢰할 수 있는 미래에 대한 심층 논의, [3] 프라이버시 컴퓨팅 백서(2022),
[4] 10,000 단어의 긴 기사: Web3 데이터 시장 전망;
[5] 공정성 이론에 기초한 연합학습의 공정한 보상 분배 방법;
[6] 상하이 데이터 교환의 "비밀 공개": 데이터 요소 순환에 대한 "필수 질문".
모든 댓글