[返回] [最新] [最热门] [最高评价]

守『鸽』如玉

记得之前有某个创业公司的CEO加我微信,
刚聊了没几句推荐系统相关的事情,
然后一开口就问我要全中国搞推荐系统最牛逼的人才。
我当时简直受惊了。。。『好大的口气』。。。
你以为你是谁,居然这么狮子大开口。
(你以为我是谁,我就一屌丝,哪来给你找全中国推荐系统最牛逼的人。)
紧接着还约我吃饭,我口头上说好啊!但
是心想,这哥们有点创业走火入魔了吧,动不动就要全中国最牛逼的。
我就一屌丝,和这种人吃饭
...

yanyiwu 1970-01-01 08:00 | 查看: 3117

中文simhash算法库的Golang版本

感觉好像没什么好说的,就是发现自己写的『simhash』似乎还挺受欢迎的,
虽然 star 数其实也才刚过百,但是在 GitHub 上面搜 simhash 后出来的结果上已经排到了首位,
而且也老有人咨询 simhash 的一些问题。

有时候想看看某个句子的 simhash 值是多少,在之前写的『simhash』库没有可通过参数调试的命令行程序。
但是呢,想在 C++ 版本的 simhash 上
...

yanyiwu 2015-10-19 00:00 | 查看: 1185

区块链开源项目Asch源码初探

Asch 这个名字是 App Side Chain 的缩写。
是一种基于区块链跨链技术的应用开发平台,目前全部核心代码已经在 GitHub 上开源。

区块链是比特币的底层技术,但是名气低于比特币,但是个人认为潜力远远大于比特币。是最值得技术人员关注的技术之一。

我一般研究一门新技术,倾向于研究更新更早期的代码。
因为非常成熟有名的代码往往已经过度设计,对于阅读代码入门不一定是好的选择。
而一些
...

yanyiwu 2017-07-29 00:00 | 查看: 1078

MySQL中文分词插件SqlJieba

『关键词』

MySQL, 插件(Plugin), 中文分词, 结巴分词(Jieba), 全文检索(Full-Text), SqlJieba

『需求背景』

之前也老有人问我啥时候能搞一个MySQL中文分词插件。

无奈自己对MySQL插件开发实在不熟悉,再加上感觉这种插件的需求量并不大,所以迟迟没有抽出时间开发。

直到十来天前的 cppjieba 一个 issue-58 把MySQL插件
...

yanyiwu 2016-03-27 00:00 | 查看: 905

bleve中文分词插件之gojieba

『Go语言开发的搜索引擎bleve』

先安利一个Go语言开发的搜索引擎 bleve ,

目前看来这应该是 Go语言开发的搜索引擎里面最有潜力,

或者说最不像玩具的搜索引擎。

简单试用了一下体验还可以,

并试探性的提了一个关于打版本标签的 issue ,

作者的回复响应速度也很快。

网上搜的资料上显示 bleve 是由 CouchBase 团队打造出来的。

但是我比较不理解的
...

yanyiwu 2016-04-04 00:00 | 查看: 896

单元测试之gmock使用『指北』

单元测试往往需要借助 Mock 出一些对象,才能进行完整的单元测试。

比如当一个 Engine 类里面有个函数需要调用一个 MysqlClient 去查询 MySQL,
但是我们在单元测试中想测试这个引擎类,总不能每次单元测试前都打开对应需要的数据库吧?那就不叫单元测试了。
所以需要 Mock,搞出一个 MockMysqlClient 类去在单元测试中替代 MysqlClient 进行测试。

...

yanyiwu 2015-10-18 00:00 | 查看: 806

那些值得期待的创业项目

这几天发现我的一篇旧博文『那些年追过的创业团队』又被分享了,
想起现在也有几个比较值得期待的创业项目,所以就有了这篇博文,
就当成是在博客里埋下一壶老酒,或许过几年之后再挖出来品位,会更有滋味。

『懒投资』

刚听说懒投资的时候,是因为发现 @ideawu 跳槽去了懒投资当CTO。
我很好奇什么样的创业公司能吸引了 @ideawu 加盟。
所以不仅在网上搜了相关的介绍,也下载了对应的APP体验。
...

yanyiwu 2015-11-27 00:00 | 查看: 756

『面向用户编程』

入职新公司也差不多三个月了,说实话很庆幸当时选择了这里。

其实同时也很后悔没有早点来这里。

现在想想很多东西确实并不是钱的问题,

我也见过不少拿着很高薪水的人在公司里面养尊处优,

无所事事,无忧无虑的生活。

很多人羡慕这样的生活,但是我不觉得这有什么值得羡慕。

人最累的时候是有特别多工作需要做的时候,

人最幸福的时候也是有特别多工作想做和能做的时候。

来了新的公司,可能很多
...

yanyiwu 2016-08-05 00:00 | 查看: 736

只增不减的互联网恶习

【删除一个臃肿的鸡肋功能为何如此之难】

昨天做了一个很艰难的决定,把 cppjieba 的源码进行了大刀阔斧的删减,

把和 Server 相关的代码通杀掉,六亲不认,即使那都是自己一行行辛苦码下的。

核心原因只有一个问题:

『作为一个分词库,有必要在核心代码仓库里面把HTTP分词服务的功能加进去吗?』

我想了很久,『没有必要』,真的没有必要,首先分词本身是高频基础性的操作,


...

yanyiwu 2016-01-21 00:00 | 查看: 637

放弃screen,拥抱tmux

『故事背景』

screen/tmux 是远程ssh session的管理工具。

可以在server端帮你保存工作现场和恢复工作现场。

最典型的应用场景就是,你每天下班关机器的时候,先保存现场(session)。

然后第二天上班的时候再登录上去恢复现场(session) ,可以一下子就进入到之前的工作状态,

比如当时正使用vim编写代码编写到第N行的状态。

说起screen我是感
...

yanyiwu 2016-03-24 00:00 | 查看: 636

C/C++/Go混合编程实践之GoJieba

最近想在团队中推动Go在项目中更多场景的应用,提高开发效率。
但是遇到了一个顾虑,就是有些功能库是 C++ 写的,
切换到 Go 开发之后如果需要这些功能的话,
完全重写一个短期内不现实。
所以就产生了探究 C/C++/Go 混合编程的想法。

很早之前就听说 Go 语言对 C 语言非常友好,
几乎可以无缝使用 C 的一些丰富遗产。
刚学 Go 的时候尝试了一下,应该是因为参考的资料的问题,
没有
...

yanyiwu 2015-09-14 00:00 | 查看: 630

C++线程池实现原理

『背景』

多线程编程是C++开发者的一个基本功,
但是很多开发者都是直接使用公司给包装好的线程池库,
没有去了解具体实现,有些实现也都因为高度优化而写得讳莫如深,让初学者看得吃力。

所以写这篇文章主要是想以非常简单的方式讲讲实现原理,
希望初学者看完之后不是觉得「不明觉厉」,而是觉得「原来如此」。

『面朝代码』

首先先来一段超级简单(注释丰富)的代码展示多线程编程的经典写法。

注: 该段
...

yanyiwu 2015-12-16 00:00 | 查看: 617

...更多...