The Cryptonomist는 Vana’s의 CEO이자 공동 창립자인 Anna Kazlauskas를 인터뷰했으며, 그녀는 Reddit Data DAO를 설립했으며, 첫 주에 140,000명의 사용자가 인증된 Reddit 계정으로 가입했습니다. Anna는 현재 LinkedIn 및 ChatGPT와 같은 다른 플랫폼을 위한 Data DAO를 구축하기 위해 개발자들과 협력하고 있습니다.
DAO 외에도, 그들은 사용자가 데이터를 풀링하여 GenAI 모델 훈련에 사용할 수 있는 데이터셋으로 만들 수 있는 다른 출구를 가지고 있습니다. 예를 들어 초상화 또는 아바타를 만드는 것입니다.
Vana가 하고 있는 것 외에도, Anna와 함께 우리는 플랫폼이 사람들이 자신의 데이터를 새로운 애플리케이션에 사용하고 수익화할 수 있도록 돕는 탈중앙화된 AI 공간의 성장에 대해 이야기했습니다.
Summary
Vana와 그 미션에 대한 개요를 탈중앙화된 AI 공간에서 제공해 주시겠습니까?
Vana는 사용자 소유의 데이터로 구동되는 사용자 소유의 AI 플랫폼입니다. 우리의 사명은 사용자가 AI 모델을 통해 생성되는 데이터와 그 가치를 소유하는 것입니다. AI 모델의 성능을 향상시키기 위해 더 많은 훈련 데이터가 필요하며, 궁극적으로 AI 모델은 데이터만큼만 좋습니다.
예를 들어, LLaMA 3는 약 15조 단어로 훈련되었으며, 이는 대략적으로 공개된 인터넷에서 사용할 수 있는 데이터 양과 같습니다. 기업들은 이제 더 많은 데이터를 확보하려고 노력하고 있으며, 때로는 이를 위해 수억 달러를 지불하기도 합니다. 주요 기술 플랫폼들은 귀중한 사용자 데이터를 축적하고 사용자 허가를 고려하지 않은 채 새로운 기술을 구축하고 있으며, 이는 혁신을 저해하고 있습니다.
Vana에서 우리는 데이터를 사용자 제어 하에 두어 이러한 폐쇄된 환경에서 해방시키고 있습니다. 우리는 사용자가 AI 모델에 직접 기여하고, 자신의 데이터가 어떻게 사용되는지, AI가 어떻게 사용되는지 선택할 수 있도록 합니다. 우리는 최고의 데이터에 접근할 수 있다면 GPT-6와 같은 모델의 성능을 능가할 수 있다고 믿습니다. Vana는 개인 소유의 데이터를 위해 처음부터 설계된 레이어 1 블록체인으로 설계되었습니다.
Reddit Data DAO는 첫 주에 14만 명의 사용자가 가입했습니다. 이 빠른 채택을 이끈 요인은 무엇이라고 생각하며, 이 출시에서 어떤 교훈을 얻었습니까?
Reddit Data DAO는 채택 관점에서 엄청난 성공을 거두었으며, 첫 주에 140k 이상의 사용자가 가입했습니다. 이러한 수준의 채택은 DAO에서는 드문 일이며, 이제 역사상 가장 큰 데이터 DAO가 되었습니다.
빠른 채택을 이끈 요인 중 하나는 많은 이야기가 이미 설정되어 있었기 때문입니다. 사용자가 데이터 판매에 대한 언론 보도를 통해 자신의 데이터 가치에 대해 점점 더 인식하게 되면서입니다. Reddit이 당신의 데이터를 2억 달러에 판매하고 있거나 Apple이 데이터를 5천만 달러에 사들이고 있다는 사실을 깨닫게 되면 그 가치에 대해 훨씬 더 인식하게 됩니다.
사용자 소유 제품에 대한 강한 욕구가 있으며, 이는 친숙한 DeFi 제품을 넘어 새로운 소유권의 경계로 이동합니다. 우리는 Farcaster, DePIN 네트워크 및 Vana에 구축된 데이터 DAOs와 같은 프로젝트에서 이 트렌드를 보고 있으며, 이는 사용자 소유 제품의 새로운 물결을 나타냅니다.
중요한 교훈 중 하나는 기여 요구 사항의 증거가 필요하다는 것이었습니다. 백만 명이 넘는 사람들이 Reddit Data DAO에 가입하려고 했지만, 많은 사람들이 일정 기간 동안 존재한 Reddit 계정과 최소한의 데이터를 보유하고 있다는 기준을 충족하지 못했습니다. 이는 양질의 기여를 보장하기 위한 메커니즘의 중요성을 강조합니다.
LinkedIn과 Chat GPT와 같은 플랫폼을 위한 Data DAO를 만들 계획을 언급하셨습니다. 이러한 플랫폼으로 확장하는 데 있어 어떤 독특한 도전과 기회가 있다고 보십니까?
Vana는 사용자 소유 데이터에 대한 피어 투 피어 네트워크이며, 빌더들은 Reddit Data DAO, LinkedIn Data DAO, ChatGPT Data DAO와 같은 다양한 데이터 DAO를 만들었습니다.
이러한 다양한 데이터 소스는 AI 모델을 훈련시키는 데 매우 가치가 있지만, 현재는 폐쇄된 환경에 갇혀 있습니다. 이러한 각 플랫폼에서 데이터를 추출하는 것은 까다로울 수 있지만, 데이터 규제 덕분에 항상 가능합니다.
Vana는 사용자가 자신의 데이터를 수익화할 수 있도록 어떻게 지원하며, 사용자가 이를 통해 혜택을 본 몇 가지 예시는 무엇인가요?
우리의 목표는 사용자가 데이터를 동시에 수익화하고 보호할 수 있도록 돕는 것입니다. 예를 들어, Reddit Data DAO를 통해 그들은 이제 사용자 소유의 모델을 훈련시키고 있습니다 (현재는 주로 shitposting에 중점을 두고 있지만, 시작에 불과합니다). 사용자는 모델이 사용될 때마다 보상을 받으며, 이는 모델의 공동 소유에 대한 경제적 인센티브를 창출합니다.
그리고 사용자 데이터는 완전히 비공개로 유지됩니다 – 데이터를 판매하는 대신, 기본 데이터는 안전한 환경을 벗어나지 않고 단지 “rented”됩니다.
데이터 프라이버시에 대한 우려가 커짐에 따라, Vana는 데이터 DAO 내에서 사용자 데이터를 안전하고 윤리적으로 사용하도록 어떻게 보장합니까?
데이터 프라이버시는 단순히 이념적이거나 선호도의 문제가 아니라 경제적인 문제로 바뀌었습니다. 누군가가 당신의 데이터를 가지고 있다면, 그들은 경제적으로 가치가 있는 AI 버전을 만들어 수익을 창출하고 잠재적으로 당신과 경쟁할 수 있습니다. 그렇기 때문에 프라이버시는 매우 중요하며 Vana의 핵심입니다.
우리는 “non-custodial data”라는 개념을 발명했는데, 이는 개인 데이터에 대한 non-custodial wallet과 유사합니다. 이 개념은 개인 키에 의해 허가된 상태로 데이터를 완전히 제어할 수 있게 합니다. 이를 통해 데이터가 애플리케이션 간에 이동 가능하게 되며, 데이터 DAO와 같은 것을 구축할 수 있도록 상위에 네이티브 금융 계층을 추가합니다.
Vana의 Data DAO를 통해 생성된 데이터셋이 생성적 AI 모델의 훈련을 어떻게 향상시키며, 전통적인 데이터셋에 비해 어떤 이점을 제공합니까?
일반적으로 AI 모델은 공개 인터넷에서 수집된 데이터로 훈련됩니다 – 어디에도 로그인하지 않고 사용할 수 있는 데이터입니다. 하지만 아이에게 세상에 대해 가르치는 관점에서 생각해보면, 그들이 무작위로 공개 인터넷을 돌아다니게 하고 싶지 않을 것입니다. 고품질의 글쓰기, 사고 과정, 메시지와 같은 공개적으로 이용할 수 없는 고품질 정보를 제공하고 싶을 것입니다. AI는 주로 공개 데이터를 기반으로 훈련되지만, 실제로는 최첨단을 개척하기 위해서는 비공개 데이터가 필요합니다. 이것이 데이터 DAO가 가능하게 하는 것입니다: 사용자가 자신의 비공개 데이터를 기여하여 사용자 소유의 AI를 만드는 것입니다.
우리는 AI가 커뮤니티에 의해 오픈 소스 소프트웨어처럼 만들어져야 한다고 믿습니다. 우리의 목표는 연구자들에게 현재 벽으로 둘러싸인 정원 안에 갇혀 있는 최고의 데이터셋에 접근할 수 있도록 하여 AI 성능의 한계를 넓히는 것입니다.
향후 5-10년 동안 분산형 AI 분야에서 어떤 트렌드를 예상하며, Vana는 이 변화하는 환경에서 어떻게 선도적인 위치를 차지하고 있습니까?
탈중앙화된 AI 분야는 지난 한 해 동안 정말로 가속화되었습니다. 예를 들어, 올해 EthCC에서는 작년에는 없었던 탈중앙화된 AI 이벤트가 거의 매일 열렸습니다. 사람들은 금융에 잘 적용된 주권 기술을 AI 분야에 어떻게 적용할지 알아내고 있습니다. Vana에서 우리는 이 모든 것의 핵심 기초가 데이터라고 믿습니다. 사용자 소유의 AI와 주권 AI를 구축하려면 사용자 소유의 데이터가 필요하므로, 우리의 초점은 그 데이터 부분에 있습니다.
다음 5-10년 동안, 저는 몇 가지 중요한 이정표에 대해 기대하고 있습니다: 1) 1억 명이 공동으로 소유한 사용자 소유의 foundation model. 2) 스스로 수익을 창출할 수 있는 더 많은 자율 AI 에이전트, 그리고 그 에이전트들이 그들을 훈련시키는 데 기여한 사용자들에 의해 진정으로 소유되도록 보장하는 것.
AI가 점점 더 중요한 경제적 역할을 하면서, 기술적 및 사회적 관점에서 권력이 널리 분산되도록 보장하는 것이 중요합니다.
개발자들과 협력하여 Data DAOs를 구축하는 것에 대해 더 공유해 주실 수 있나요? 현재 진행 중인 혁신적인 프로젝트에는 어떤 것들이 있나요?
Vana는 허가가 필요 없는 네트워크로, 누구나 데이터 DAO를 구축할 수 있습니다. 이는 개인 소유의 데이터를 위해 처음부터 설계된 레이어 1 블록체인입니다. 오늘날 Satori 테스트넷에 배포된 데이터 DAO는 100개가 넘습니다. 많은 빌더들은 암호화폐와 AI의 교차점을 깊이 이해하는 Bittensor 생태계의 초기 참가자들입니다. 주목할 만한 프로젝트로는 Twitter Data DAO, LinkedIn Data DAO, GitHub Data DAO가 있습니다. 또한 데이터 DAO를 더욱 쉽게 생성하고 관리할 수 있도록 ZK 공간 및 DAO 도구 공간의 프로젝트와도 협력하고 있습니다.
분산형 AI 개발에서 가장 시급한 윤리적 고려 사항은 무엇이며, Vana는 이러한 문제를 어떻게 해결합니까?
오늘날 AI에서 가장 큰 질문 중 하나는 누가 모델을 소유하고 어떤 데이터가 들어가야 하는지를 결정해야 하는가에 관한 것입니다. 우리가 정보에 대해 AI에 점점 더 의존하게 되면서, AI는 우리의 진실의 원천이 됩니다. AI에 무엇이 들어가는지를 결정하는 사람은 본질적으로 진실을 결정하는 것입니다. 단일 엔터티가 이를 통제하는 것은 무섭습니다. Vana에서 우리의 견해는 단일 회사가 아닌 커뮤니티가 이러한 결정을 내려야 한다는 것입니다.
분산형 AI에서 제기되는 또 다른 질문은: AI가 완전히 분산되어 있다면, AI가 제멋대로 행동하고 종료 버튼이 없으면 어떻게 될까? Vana에서 이 문제를 해결하는 방법은 AI 모델이 궁극적으로 그 모델에 기여한 사용자들이 소유하게 되어, 항상 완전한 통제권을 유지한다는 것입니다.
Vana와 Data DAOs와의 경험을 바탕으로, 분산형 AI 분야에 진출하려는 예비 기업가들에게 어떤 조언을 해주시겠습니까?
탈중앙화된 AI 공간에서 구축을 시작하기에 좋은 시기입니다. DeFi에서 잘 작동한 일부 암호 경제 원시 개념을 탈중앙화된 데이터 및 AI의 새로운 부문에 적용할 수 있는 많은 기회가 있습니다. 또한 암호화폐 맥락 외부에서 사람들이 취하고 있는 접근 방식을 배우기 위해 비암호화, 오픈 소스 AI 공간에 시간을 투자하는 것도 추천합니다. 기존 프로젝트 중 일부를 직접 체험하여 구축할 수 있는 원시 개념이 어떤 것이 있는지 확인하고, Vana에서 데이터 DAO를 시작해보는 것도 포함됩니다.