在之前的这篇文章中:
- 来来来,给大家分享点有意思的数据 / Share some interesting data
我给大家分享了一些有意思的数据,全网信用最高的用户、SP最多的、粉丝最多的、到处粉人的…..
有朋友看后私下和我表示这些数据挺有意思,问我咋弄出来的。我回答说使用steemdata.com 筛选出来的,他对此表示很好奇,希望我能介绍一下steemdata.com所以,今天我在这里给大家简要介绍一下。
SteemData 是什么?
SteemData 简单的来讲,就是Steem区块链的数据库(MongoDB)镜像版本。
这个定义可能不甚准确,但是我自己觉得还算恰当。
Steem是去中心化的区块链,我们可以通过STEEMIT.com 或者Esteem、Busy.org、ChainBB工具或者站点与之交互,比如说发表帖子或者给别人的帖子投票等等。而如果我们要查找一些内容,则相对比较麻烦,比如在steemit上逐页翻阅、或者通过google.com 等工具的站点搜索,或者使用工具直接调用Steem API来查找。
以上无论是哪种方式,使用其它都有极大的局限性,尤其是在复杂的情况下。比如使用API我们可以查看@oflyhigh 的账户数据、看看他有多少SP。但是如果我们想看看所有持有SP数量大于1万个的,API就会无能为力了。所以SteemData 应运而生。
SteemData 由 @furion 发起并维护。
详情见发表于六个月之前的帖子
大致原理就是实时随时同步steem区块链的新数据,并存储到MongoDB中。没错,用的是MongoDB, NoSQL数据库类型的代表之一。至于NoSQL数据库有何优点等等话题本文就不做探讨啦。
SteemData 连接信息以及Collections
@furion 的上述帖子中列出了数据库的连接信息,但是有些老旧
欲获得最新的连接信息可以访问SteemData官方网站: https://steemdata.com/
撰写本文时,连接信息如下:
SteemData有如下collections
(可以近似理解成MySQL中的表格)
- Accounts
- Operations
- Account Operations
- Posts
- Comments
其中 Accounts 包含用户信息、Operations包含所有操作信息、Account Operations包含个账户相关的操作、Posts包含主贴信息、Comments包含回复信息。
如何操作SteemData
首先SteemData给用户开放的是只读的权限,这很正常,如果大家胡乱写,那就没法用了。SteemData的作者推荐大家使用 RoboMongo 一款MongoDB的图形界面工具来了解SteemData.
另外,SteemData 直接封装了一个Python 库: steemdata, 可以通过pip 安装pip install -U steemdata
欲了解如何使用steemdata Python 库来访问SteemData,可以访问官网的入门向导页面
我使用的是pymongo
如果你还没有安装过它,你需要使用pip安装pip install pymongo
使用下列命令连接并登陆
看一下都有哪些collections
咦,居然还有几个collections
官网页面上没有列出来
现在我们就开始我们的探索之旅啦。
查询声望分最高的10个用户
有了上述基础,你就可以做一些复杂的查询啦,比如说,查一下全网声望分最高的10个用户
是不是很简单的啦?
顺便恭喜一下这些获奖用户:
参考连接
- Introducing SteemData - A Database Layer for STEEM
- Roadmap for SteemData 2.0 ∙ Crowdfunding
- SteemData 1.2 is here ∙ Raised $5,120 of $5,000 ∙ Now on GitHub
- Getting started with SteemData
- What is happening to SteemData?
- SteemData 1.3
Thanks @furion for providing steemdata service!
好了,今天就先介绍这些啦。
如果大家感兴趣,以后在介绍更多内容。
感谢阅读 / Thank you for reading.
欢迎upvote、resteem以及 following me @oflyhigh 😎
This page is synchronized from the post: 简单介绍一下SteemData