Web3數據分析師

簡介
Web3數據分析師的本質都是【數據分析師】,關於【數據分析師】的詳情可以參照此連結。本文重點介紹在web3領域做數據分析的特點。
Web3 能夠讓用戶對自己的數據擁有所有權和自主權,而這也是推動 Web2 向 Web3 進化的關鍵因素。在這種開放數據的體系下,Web3 的數據賽道會成為新秩序下最重要的組成部分,擁有廣闊的發展空間,而站在創業者的角度來講,由區塊鏈技術驅動的去中心化網絡,其本質是一個開放、無許可的分布式數據庫,數據方向天然存在許多需要被服務的場景,選擇它大概率能夠在正確的科技樹上進化和生長。
Web3數據分析與Web2的不同
最大的不同之處在於Web3很多都開源,意味著對數據的獲取比Web2更加透明,亦有很多鏈上數據是公開的。下圖概括了Web3開放數據模式的不同(對比Web2)。
Web3數據體系
Web3 數據體系的結構可以被劃分為四個層次,分別是最底層的數據來源,第二層的數據獲取,第三層的數據查詢與索引,還有最頂層的數據分析與應用。
第一層,數據來源
數據來源整體分為鏈上(on-chain)和鏈下(off-chain)數據。鏈上數據,顧名思義就是區塊鏈上的數據,主要包括:鏈相關數據(如哈希hash、時間戳timestamp等)、轉賬交易、錢包地址、智能合約事件、以及一些保存在緩存中的數據(比如以太坊 mempool 裏面的排隊數據),這類數據被去中心化的數據庫所維護,可靠性由區塊鏈的共識來保證。另外,存儲也是鏈上數據的主要來源,目前集中在 IPFS, Arweave, Storj 等協議。鏈下數據則主要包括中心化交易所的數據,社交媒體數據,GitHub 數據,以及一些典型的 Web2 數據,比如 PV、UV、日活、月活、下載、搜索指數等等。
第二層,數據獲取
這一層最主要的玩家就是節點服務商。如果選擇通過自己搭建節點的方式來獲取鏈上數據,需要較高的時間、金錢和技術成本,還可能會面臨內存泄露、磁盤空間不夠等問題,而節點服務商則大大優化了這個流程。作為整個數據賽道的基礎設施,節點服務商是最早參與進來的玩家,也誕生了估值百億美金的獨角獸。
目前比較有名的服務商有 Infura,Quicknode,Alchemy 和 Pocket,開發者和創業者在選擇的時候主要會考慮覆蓋鏈的數量、是否去中心化、商業模式(收費模式)以及附加服務的多樣性。
今年 2 月 8 日,Alchemy 以 102 億美元估值完成了 2 億美元融資;Infura 母公司 ConsenSys 在去年也完成 2 億美元融資,估值 32 億美元;截至 2022 年 3 月,Pocket 的流通市值達到了 32.8 億美元。
第三層,數據查詢與索引
在直接與各類公鏈進行交互的節點服務商之上,就是提供數據查詢和索引服務的市場參與者。他們通過對數據的解析和格式化,讓原始數據變得更容易被訪問和使用。以下是一些例子:
The Graph:The Graph 是一個去中心化的鏈上數據索引協議。2020 年 12 月主網上線,到目前為止可以支持對 30 多個不同網絡的數據進行索引,包括 Ethereum、NEAR、Arbitrum、Optimism、Polygon、Avalanche、Celo、Fantom、Moonbeam、Arweave 等。
Covalent:Covalent 提供了一個數據查詢層,讓它的用戶可以快速地以 API 的形式調用數據,目前支持 Ethereum、BNB Chain、Avalanche、Ronin、Fantom、Moonbeam、Klayth、HECO、SHIDEN 及主流 Layer2 網絡。
Dune Analytics(既提供數據查詢與索引的服務,又有屬於數據應用與分析層的產品):Dune Analytics 是一個綜合型的 Web3 數據平臺,可以對海量的鏈上數據進行查詢,分析,以及可視化。它把以鍵值數據庫保存的鏈上數據進行解析,然後錄入集合到一個 PostgreSQQL 的關系型數據庫中,用戶無需寫腳本,只要會使用簡單的 SQL 語句就可以進行查詢。Dune Analytics 可以提供的數據表有原始交易數據表,項目級數據表,以及聚合型數據表三類。Dune Analytics 現階段支持 Ethereum、Polygon、Binance Smart Chain、Optimism 和 Gnosis Chain 的數據查詢。今年 2 月完成了 B 輪 6942 萬美元的融資,估值 10 億美元,正式邁入獨角獸行列。
Flipside Crypto:與 Dune Analytics 一樣,也是通過可視化的工具以及自動生成的 API 借口,讓用戶能夠通過簡單的 SQL 語句進行復雜數據的查詢,也可以復制和編輯別人已經生成的 SQL 查詢。Flipside 積極地與領先的加密項目合作,通過結構化的賞金計劃和指導,激勵按需分析,幫助項目快速獲取他們需要的數據洞察力以實現增長。
第四層,數據分析與應用
這一層是直接面向 C 端用戶(廣義上的 C 端,不僅僅指個人用戶),交付拿來即用的數據產品。它們幫用戶完成了所有繁重負責的工作,直接呈現從自己的數據方法論角度出發,為用戶提供數據價值。這一層的參與者,可以按照數據的類型大致劃分為針對鏈上交易的,針對代幣價格的,針對 DEFI 協議的,針對 DAO 的,針對 NFT 的,針對安全的,針對社交的等等,當然也有越來越多的項目部聚焦於某一類數據,旨在成為一個更加綜合型的數據分析平臺。以下是一些例子
Glassnode & Messari & CoinMetrics.io:區塊鏈數據和信息提供商,從不同角度 & 指標為投資者提供鏈上數據和交易情報,輸出市場分析洞察和研究報告。
CoinGecko & CoinMarketCap:代幣分析工具,用於觀察和追蹤代幣價格、交易量、市值等。
Token Terminal:用傳統的金融指標,比如 P/S 比率、P/E 比率和協議收入等分析 DeFi 項目。目前也支持對 NFT 交易市場的分析。
NFTSCan & NFTGO:專註於 NFT 市場的數據平臺,提供數據分析和巨鯨錢包監控等服務,旨在幫助用戶更好地追蹤和評估 NFT 項目和資產的價值,幫助做出明智的投資決策。
Nansen:如果用一個詞來概括 Nansen,那一定是「標簽」。Nansen 已累計分析了 5 千萬 + 的以太坊錢包地址和它們的活動,將鏈上數據與包含數百萬個標簽的數據庫相結合,幫助用戶更好地尋找信號和新的投資機會。Nansen 目前是 Web3 數據分析和應用層的最明星的項目之一,去年 12 月以 7.5 億估值完成了 7500 萬美元的融資。
Chainalysis:被稱為「鏈上 FBI」的 Chainalysis 成立於 2014 年,是一個企業數據解決方案公司,通過鏈上數據監控和分析,以幫助政府、加密貨幣交易所、國際執法機構、銀行等客戶遵守合規要求,評估風險,並識別非法活動。去年六月,Chainalysis 宣布獲得 1 億美元 E 系列融資,估值達到 42 億美元。
Footprint Analytics:是一個綜合型的數據分析平臺,用於發現和可視化區塊鏈數據。與其他應用相比,Footprint 使用門檻更低,對新手用戶非常友好。平臺上提供豐富的數據分析模板,支持一鍵分叉,幫助用戶輕松創建和管理個性化的儀表板,同時 Footprint 也有對鏈上其他錢包地址及其活動的標記,用戶可以通過維度豐富的指標來進行投資決策。
Zerion & Zapper: 最早出現的 DeFi 投資組合追蹤和管理器,目前同樣都新增了對 NFT 資產的支持。
DeepDao:DeepDAO 是聚焦於各類 DAO 組織的綜合數據平臺,用戶可以輕松查看國庫金額及變化、國庫代幣分布、治理代幣的持幣情況、組織活躍成員、提案及投票情況等。DeepDAO 還同時提供了數十種用於創建和管理 DAO 的工具。
如何入行
掌握數據分析的基礎是必須的,譬如SQL,分析框架等等(詳情可以參照此連結),而web3是一種應用這些的數據分析能力的情境。
另外,上手親自試驗是入行的最好方法,譬如嘗試搭建一些數據洞察,類似這個opensea市場分析。
參考來源