提示:即将开启机器人踩中文区搬砖(Plagiarism)内容

最近中文区( #cn) 垃圾内容泛滥,尤其是大量的从娱乐网站、诗词网站等或机器人或人工的搬砖内容。原本想浏览一下中文区的新帖子,结果即便有些好帖子也淹没在海量的垃圾中了。


(图源 :pixabay)

为了净化中文区环境,让大家有一个良好的交流场所,决定从北京时间 5月18日 8:00起,启动 @anti-spam 机器人,踩搬砖内容,同时 @anti-phishing @oflyhigh 会已一定的权重跟踩。后期可能会联系一些SP大户,以便于以更大的能量去踩搬砖内容。

FAQs:

Q:何为搬砖内容?
A:搬砖是指人工或者机器人从其它网站搬运内容到STEEM区块链上来。

Q:搬砖和剽窃(Plagiarism)有和区别?
A:搬砖即剽窃,都是窃取别人的劳动成果来发到STEEMIT上来。

Q: 为什么要踩搬砖内容?
A:一则搬砖这种行为侵犯了原来作者的权利;第二搬砖内容并没有给STEEM网络增加任何价值,相反地会极大浪费STEEM网络的各种资源;第三大量垃圾内容充斥STEEM,导致我们没法阅读正常的帖子。

Q:已经有 @steemcleaners @spaminator @cheetah 等清理垃圾的机器人, @anti-spam 的意义何在?
A:上述机器人对中文识别不友好,好多搬砖帖子都被漏掉。所以清理还是我们自己做。

Q:如何识别搬砖内容?
A:人眼智能识别 + 搜索引擎搜索对比。

Q:采取什么策略踩?
A:黑名单策略,一旦识别出某个ID 搬砖,然后加入黑名单,之后此用户每贴必踩

Q:用户发搬砖帖,之后正常帖子也被踩?
A:犯错误是要付出代价的(实际上是我没精力挨个甄别)

Q:黑名单用户是否可以移除?
A:都被列黑名单了,还移除干啥?

Q:为啥不马上开始踩,要等到明天?
A:给搬砖用户一个改正的机会,勿谓言之不预也


(图源 :pixabay)

其它

因为精力有限,所以暂时采取手工黑名单操作,以后可能增加动态更新黑名单,以及用户举报等功能。

踩搬砖内容不是目的,目的是恢复CN区的良好环境,希望各位搬砖的作者放弃这种毫无意义的操作,好好发帖。也希望CN区各位朋友对类似内容不要姑息,CN区是大家的CN区,大家一起维护她,她才会越来越好。


This page is synchronized from the post: 提示:即将开启机器人踩中文区搬砖(Plagiarism)内容

每天进步一点点:向Access数据库中插入数据重复的问题

之前的文章中说到我计划在程序中使用Access作为数据库,哎,我现在才意识到这是个多么愚蠢的做法。不过开弓没有回头箭,继续用上了,我怎么的也得等用明白了在换诸如sqlite等数据库管理系统。


(图源 :pixabay)

避免重复数据

于是今天继续踩坑。话说,我计划在数据库里插入数据,比如说我在STEEM上的文章数据,之前的帖子中我提到踩过俩坑以后已经插入成功了,我拥有了一个我在STEEM区块链上文章的本地库。

但是插入成功之后,有一个问题,我时不时地在steemit.com上发布新文章,那么这时候我的文章库就不完整了,缺失了新发表的文章。所以除了之前的导入文章的功能,加入一个更新功能是很有必要的。

为了实现这个功能,我修改了数据表的结构,加入了id这个字段,ID亦即文章的ID,在steem区块链上,是文章的唯一标识(还可以用author以及permlink唯一标识文章,貌似url字段也能胜任)。我将ID的属性设置为不可重复(No Duplicates)

因为ID不可重复,并且新文章的ID总是大于旧文章的,所以我基本可以确定更新时,发现已经存在的文章ID,就证明已经完成更新了。

CDBException Class

原本我计划的逻辑是直接插入数据,然后捕获异常,判断是字段值重复异常,就认为更新成功,然而实际操作时我却发现找不到字段值重复异常的定义。

CDBException Class文章中找了半天,也没找到相关定义,在各种头文件中查了半天也没查到,跟踪了一下m_nRetCode,居然值是:-1。好吧,貌似CDBException::m_strError以及CDBException::m_strStateNativeOrigin中能找到一些端倪,然而实在不想在查下去了。(我的VC自动提示失灵了,哎)

SELECT 语句

既然没法从异常这直接下手(或者说我没研究明白咋下手),那就换个方式吧,每次更新之前我先读数据库,获取数据库中以有的id最大值,然后插入数据过程中,判断一下待插入的文章数据的id是否和这个最大id重复。如果重复,证明更新完毕,主要用到的SQL语句示例如下:

SELECT top 1 id from posts where author = 'oflyhigh' order by id desc;

突然间我觉得我有点像小猪佩奇中的佩奇和乔治,这么喜欢踩泥坑呢?!不过据说小猪佩奇最近火爆了,小猪佩奇身上纹,掌声送给社会人,看来我也有必要纹个佩奇了。

参考链接


This page is synchronized from the post: 每天进步一点点:向Access数据库中插入数据重复的问题

梦里不知身是客

继续刷QQ说说,发现这个QQ上的说说内容还是挺少的,然后感慨一下自己是一个自律的人,并没有把时间浪费在发QQ说说、发微博之类的事情上。好吧,刚感慨没多久,才想起来这个QQ上的内容之所以少,是因为这个是我工作用的QQ,我不会告诉你我平时常用的还有十几个QQ的,可惜好多QQ被腾讯打劫回去了。


(图源 :pixabay)

然后发现这条梦里不知身是客,仔细回想了一下,八九年前的事情,实在是想不起来了,我想发说说的时候,大概是我刚睡醒,迷迷糊糊搞不清梦境与现实,所以引用一下用来感慨。

这首词的作者是李煜(南唐后主)

《浪淘沙令·帘外雨潺潺》
帘外雨潺潺,春意阑珊。罗衾不耐五更寒。梦里不知身是客,一晌贪欢。
独自莫凭栏,无限江山,别时容易见时难。流水落花春去也,天上人间。

咳咳,李煜是一个很失败的皇帝,兵败降宋、被俘至汴京。你说你要学人家阿斗,管着真开心假开心,先整个此间乐、不思蜀,估摸也能混下去。可是总整些独自莫凭栏,无限江山,别时容易见时难,要不就是 春花秋月何时了?往事知多少。小楼昨夜又东风,故国不堪回首月明中。宋太宗一看,这贼心不死啊,赐杯毒酒灭了吧,于是李煜卒。

所以李煜这句梦里不知身是客,实则指的是在梦里不知道自己是俘虏,还挺高兴的,对比下来更加让人伤感和绝望。


(图源 :pixabay)

不过我想我在QQ说说上写下这句词的时候,肯定和俘虏不俘虏没啥关系,大概想表达的是自己睡懵了吧。就像庄子睡懵了,搞不清是自己做梦变成了蝴蝶,还是梦里的蝴蝶做梦变成了自己呢?

昔者庄周梦为胡蝶,栩栩然胡蝶也,自喻适志与,不知周也。俄然觉,则蘧蘧然周也。不知周之梦为胡蝶与,胡蝶之梦为周与?周与胡蝶,则必有分矣。此之谓物化。

其实不光庄子和我,睡懵的还有挺多呢,比如苏轼就说过:

世事一场大梦,人生几度秋凉。

李白也曾说过:

夫天地者万物之逆旅也;光阴者百代之过客也。而浮生若梦,为欢几何?

曹雪芹也曾说过:

乱哄哄你方唱罢我登场,反认他乡是故乡;甚荒唐,到头来都是为他人作嫁衣裳。

看到大家都睡懵了,我就放心了。但是搞不清自己自己现在是在梦里梦外,搞不清自己是在他乡还是故乡,也挺郁闷的。比如许多年后,我在微信朋友圈发了一条消息:

梦见自己醒来后想起梦里的事情倍感伤心放声痛哭,醒来后倍感伤心😭

大概想表达的就是这样一种心情吧。


(图源 :pixabay)

好吧,这样写太酸了,其实就是我也睡懵了。


This page is synchronized from the post: 梦里不知身是客

踩了Access数据库的两个坑,吐血中

之前学习了MFC中使用Access数据库,以及MFC中向Access 数据库插入数据,想着总要学以致用嘛,就打算把自己在STEEM区块链上的所有文章插入到数据库中。


(图源 :pixabay)

变长文本

原本以为应该是很简单的事情,先用Access建好数据表,然后从steem区块链读数据,再逐条插入即可。因为我关心的只有Title以及文章内容,所以只插入这些数据就好,为了方便定位到文章在steemit.com上的链接,我还插入了URL,当然了,还有文章的创建时间。

为了方便测试,先插入3、5条数据,插入很成功,然而为啥文章数据没插全呢?找了半天,才想起来我建表就是随便点点创建的,没做啥详细设置。一看body字段,我设置的是text类型,默认的长度限制255个字符,难怪被截短了。

因为文章长度很长,又不确定多长,所以我打算设置为变长类型,可是找了半天也没发现什么变长类型,只有一个Memo类型看起来貌似能满足需求。试着将字段类型改成Memo,果然OK了。搜了一下微软的相关网页:The Memo data type is now called “Long Text”,我这还是Memo应该是我Office版本太旧的缘故(2010)。

单引号替换

解决了文章内容被截短的问题,我又开始了插数据,这次使劲插吧。结果程序噼里啪啦的报错,尽管数据大部分都插入成功,但是丢了大概几十篇文章的样子。这让我有些不爽。调试了一下发现是文章内容中的'和SQL语句中的'冲突。大概类似这样:

insert into posts(title) values('ddd'ddd')

Microsoft站点上找到一个和我问题类似的帖子,SQL Statement to insert a single quote i.e., ‘ into a column of the into MSAccess table,别人回复中给的解决方法是字符串替换大法。把'替换成''(两个单引号)。试着重新跑一遍程序,这次只少插入十几篇文章。

那里又出错了呢?让我再查查,晕,原来我有的帖子标题里也用到了',真是郁闷,就不能好好的起标题,愉快地插数据吗?哎,继续我的替换大法,搞定之。

总结

说了这么多,其实就俩坑

  • 变长文本用Memo类型(新版本变成Long Text)否则会被截短。
  • 文本中的'要转义或者替换,否则和SQL语法冲突。

当然了,这两个坑或许有其它更好的解决方法,不过对我而言,好用就好啦,不去深究咯,回头大不了删库跑路。

相关链接


This page is synchronized from the post: 踩了Access数据库的两个坑,吐血中

弄个访客专用电脑给客人

家里时常来客人,客人们时不时的有使用电脑的需求。这些年IPad、IPhone以及安卓机的普及,客人们对聊QQ、看网页或者打游戏的需求都可以用手机、IPad之类的完成了,看视频追剧啥的用移动设备可以也可以直接用电视盒。

但是呢,电脑还是免不了的。比如说,我的邻居时常来我家用网银,问她为啥不在自己家的电脑用,答曰:自己家的电脑不安全。我晕,你觉得你在自己家用网银不安全,可是我觉得让你用我家电脑之后,我家电脑就不安全了呢😵。

我这不是危言耸听哦,有一次邻居上来用网银,和我说她的工行的U盾过期了要重新激活。一般来讲,她用网银操作时我都离的远远的,毕竟涉及到金钱,万一她的密码泄露了,我又看过,岂不是有很大嫌疑。

但是听到网银、U盾、过期、激活,几个关键字,我的大脑立即反馈给我一个信号:诈骗。于是我看了一眼她的短信,看了一下里边的网址:1cbc,而工行的网址是:icbc。据她说,她的卡里刚刚收到几笔客户汇款,有数百万的余额。如果她按照对方的要求去激活U盾,后果不堪设想。

除了网银,我另外一个朋友,还经常来我这里运行一些乱七八糟的程序(就是我那个玩四轴、电动车的朋友),我问他为啥不在自己家弄,他说这些程序他弄不懂,要我帮他来操作。额,其实就是一些调电机参数、PID设定等乱七八糟的工具,哎,被求到了,我总不好拒绝😔。

除了网银、一些乱七八糟的工具软件,还被时常用到的就是Office啦。朋友们有不少业务繁忙的,本来小聚的时候都不想工作的事情,但是偶尔总有一两个电话过来,然后被告知有文件要处理,已经发到QQ信箱云云。于是乎,拿我家电脑登陆一下QQ信箱,再用Office打开一下信箱里的附件。每次他们这样操作,我都在暗暗安慰自己:没事的、没事的、现在网络上很安全、宏病毒啥的并不多。

还有就是一些小朋友了,来了之后,要么去网上找一些页游,要么给我装一些乱七八糟的游戏,对此我深表无奈也没法吐槽。否则就可能被家人和朋友谴责:你这么大的人,怎么和小孩子计较,丢人不丢人?

哎,其实我不是一个小气的人(谁信?不管你信不信,反正我是不信的!)但是,对电脑,我是有一些洁癖的,我从不在自己的电脑上运行乱七八糟的程序、登陆乱七八糟的网站,当然更不喜欢别人在我的电脑上这样操作。

我工作用的电脑我保护得很好,任何人都不许碰。但是客厅里的电脑,虽然没放很多重要的东西,但是被装了乱七八糟的软件或者打开来路不明的文件,还是很让我纠结的。

于是,今天我想了个一劳永逸的办法,拿一个笔记本电脑,清空了重要的数据,然后当作访客专用机好了。ThindPad X61的本子(T8100 CPU、4G内存、XP Pro SP3系统),老虽老矣,但是用起来还是十分流畅的,至少聊QQ、看网页、登网银、用Office一点问题都没有。至于熊孩子们想打游戏,呵呵,他们不嫌卡,就随便折腾喽。

(拍了两张照片,觉得看起来有点脏,还是网上找个干净的图吧,哈哈哈)


This page is synchronized from the post: 弄个访客专用电脑给客人

身是菩提树

在佛教相关的典籍和故事中,有两个著名的佛偈,其中之一我一直很喜欢。

这个偈子的内容如下:

身是菩提树,心如明镜台,时时勤拂拭,勿使惹尘埃。


(图源 :pixabay)

这个偈子的作者是佛教禅宗五祖弘忍的大神秀禅师所做。传说中释迦牟尼(乔达摩·悉达多)就是在菩提树下悟道,明镜台,就是梳妆台,梳妆台嘛,一般都清理的干干净净,而且古人常常用照镜子来比喻发现自身的缺点等等。

所以这个偈子表面意思是说:“身体就是菩提树,心灵就像明镜台,我们要时常打扫擦拭,不要让它们沾染了灰尘。”,实际表达的意思却是:“身心才是修行的根本,我们要明心见性,才会觉悟。”

当然了,我喜欢这个偈子并非是我想出家当和尚,自己蠢笨,也从来没有指望能够大彻大悟之类的。之所以喜欢,只是因为这个偈子提到的时时勤拂拭这种修心养性的方法,具备很大的可操作性。或者就这就是曾子所说的吾日三省吾身的意思吧。(注,吾日三省吾身原指每日从三个方面检查自己,后指多次自觉地检查自己)


(图源 :pixabay)

说到神秀的偈子,不得不提一提六祖慧能的偈子了。

菩提本无树,明镜亦非台,本来无一物,何处惹尘埃。

这个我也很喜欢,但是相对于神秀偈,这个可操作性就太差了,这也是我喜欢的排行榜中把它排在神秀偈之后的缘故。另外,有记载传闻说,慧能其实没啥文化,连字都不认识,这首神秀偈还是别人念给他听的,他听了之后做出了慧能偈。但是这又何尝不是站在神秀的肩膀上,所以我一直为神秀禅师没能得到五祖的真传,没能成为禅宗六祖而感到可惜。

当然了,神秀也是这样觉得。机智的五祖弘忍已经料想到了神秀会不服,于是提前将衣钵传给了慧能,被安排慧能快跑。慧能跑得够快,但是神秀追的也很猛,很快神秀就追上了慧能,然后要求慧能放下师傅的衣钵。慧能一看神秀人多势众,当然不能死磕,于是放下了弘忍的衣钵说,师傅传我衣钵,我放这了,你能拿就拿去吧(有没感觉像小说中的:天下宝物,有德者得之。)

神秀上来伸手去拿,结果楞是没拿起来,当即明白天意如此,于是率众尊慧能为六祖。咦,这些乱七八糟的事,我是听谁说的,还是小说看多了记串了,怎么没找到记载呢?咳咳,你就当我编故事好了,另外神秀、慧能,如有得罪勿怪勿怪,想必你们这种得道高僧不会和我计较的,“阿弥陀佛”。


(图源 :pixabay)

咳咳,其实我想起这两个偈子,想起这段故事,不过是因为我在朋友圈又看到我之前转发的神秀偈的神翻译:

菩提本无树 Puti is not a tree
明镜亦非台 Mirror is not a table
本来无一物 It is empty at all here
何处惹尘埃 Why PM2.5 is so TMD high

好吧,其实最后边这段才是我想贴的😀


This page is synchronized from the post: 身是菩提树

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×