[返回] [最新] [最热门] [最高评价]

实战Guzzle抓取

虽然早就知道很多人用 Guzzle 爬数据,但是从来没有真正实践过,在我的潜意识里,抓取是 Python 的地盘。不过前段时间,在我抓汽车之家数据的时候,有人跟我提起 Goutte 搭配 Guzzle 是最好的爬虫,让我一直记挂在心上,加上最近打算更新一下车型数据,所以我打算重写抓取汽车之家数据的脚本。

因为我是通过接口抓取,而不是网页,所以暂时用不上 Goutte,只用 Guzzle 就可以了
...

老王 2017-08-23 20:30 | 查看: 34

[转]设计一个容错的微服务架构

原文: Designing a Microservices Architecture for Failure
翻译: 设计一个容错的微服务架构 by Jason Geng

微服务架构使得可以通过明确定义的服务边界来隔离故障。但是像在每个分布式系统中一样,发生网络、硬件、应用级别的错误都是很常见的。由于服务依赖关系,任何组件可能暂时无法提供服务。为了尽量减少部分中断的影响,我们需要构建容错服务,来
...

鸟窝 2017-08-23 13:52 | 查看: 78

你的鞋都比你聪明

1、

2017年2月,世界移动通讯大会(MWC)在巴塞罗那召开,今年的演讲嘉宾是日本首富软银集团 CEO 孙正义。

他的演讲主题是《为什么人工智能肯定会超越人类?》。他提到,人类的智能是一个正态分布,IQ 测试假设平均智能是100,标准差是15,因此95%的人的智商在正负两个标准差范围内(即70~130)。爱因斯坦的智商可以达到190,也就是六个标准差,这意味着他比99.99966%的人都要聪
...

阮一峰 2017-08-22 07:28 | 查看: 161

711 的成功之道 - 读《零售的哲学》

这周读完了 711 创始人铃木敏文的自述图书《零售的哲学》,分享一下我的读书心得。

我发现铃木敏文做生意的方法论特别简单,整本书其实讲的道理就几个,只不过反复讲。读完整个总结下来,作者想表达的就只有几点:

搞明白问题的本质。

执行上做到极致。

把心理学融入到商业中。

主动寻求变化。

遵循“假设->执行->检验”的步骤来做尝试。

下面我就分别总结书中的以上观点。

搞明白问
...

唐巧 2017-08-20 09:38 | 查看: 238

全文搜索引擎 Elasticsearch 入门教程

全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选。

它可以快速地储存、搜索和分析海量数据。维基百科、Stack Overflow、Github 都采用它。

Elastic 的底层是开源库 Lucene。但是,你没法直接用 Lucene,必须自己写代码去调用它的接口。Elastic 是 Lucene 的封装,提供了 REST AP
...

阮一峰 2017-08-17 07:36 | 查看: 370

Lua 5.3.4 的一个 bug

昨天我们一个项目发现了一处死循环的 bug ,经过一整晚的排查,终于确认是 lua 5.3.4 的问题。

起因是最近项目中接入了我前段时间写的一个库,用来给客户端加载大量配置表格数据 。它的原理是将数据表先转换为 C 结构,放在一块连续内存里。在运行时,可以根据需要提取出其中用到的部分加载都虚拟机中。这样做可以极大的提高加载速度。项目在用的时候还做了一点点小修改,把数据表都设置成 weaktab
...

云风 2017-08-16 10:18 | 查看: 349

CUDA 8 on Amazon Linux 2017.03.1 HVM

I was able to install CUDA 8 on the EC2 instance with the following steps. It should be noted that the EC2 instance was created with a root EBS volume of 100 GB to avoid running into storage space iss
...

qyjohn 2017-08-16 08:06 | 查看: 300

最近在用 grpc1 ,发现 grpc 的 Python server 目前还没有像 Flask 那样的修改后自动 reload ,开发不是很方便。

所以就看看有什么比较好的实现,发现 werkzeug2 已经有个比较好的实现,而且 Flask 用的就是它。就不用重复发明轮子了。

假设我们的启动 server 的代码写在了 run_server 里面,我们可以将其传入到 werkzeug 的
...

EverET 2017-08-15 21:20 | 查看: 294

净推荐值(NPS):用户忠诚度测量的基本原理及方法

初识NPS

作为互联网行业的用户体验从业者,我们都或多或少会接触一些衡量用户与产品或服务之间关系的指标,常见的指标如活跃度、留存率、用户满意度等。近几年,NPS(Net Promoter Score净推荐值)在国内流行起来,越来越多的行业及企业开始使用NPS指标作为衡量用户口碑的工具,如通信服务行业的中国移动、金融保险行业的中国平安、互联网行业的天猫和腾讯、家电企业海信等。中国平安从2013年开
...

UXC 2017-08-15 20:27 | 查看: 509

移动 H5 首屏秒开优化方案探讨

随着移动设备性能不断增强,web 页面的性能体验逐渐变得可以接受,又因为 web 开发模式的诸多好处(跨平台,动态更新,减体积,无限扩展),APP 客户端里出现越来越多内嵌 web 页面(为了配上当前流行的说法,以下把所有网页都称为 H5 页面,虽然可能跟 H5 没关系),很多 APP 把一些功能模块改成用 H5 实现。

虽然说 H5 页面性能变好了,但如果没针对性地做一些优化,体验还是很糟糕的
...

bang 2017-08-14 19:35 | 查看: 372

SYN和RTO

前两天,我在微博上推荐了一篇朝花夕拾的文章:The story of one latency spike,文章中介绍了 cloudflare 工程师如何一步一步 debug 网络延迟问题,细细读来受益良多,不过我并不打算详细介绍那篇文章的细枝末节, 本文只摘录一个点:

When debugging network problems the delays of 1s, 30s are very c
...

老王 2017-08-13 15:21 | 查看: 382

基于办公的 IM 的基础设计

现在的 IM 在设计上是基于会话的,多个人可以组成一个会话,相当于一个聊天室,当一个人加入到一个会话后,就可以看到从加入开始之后这个聊天室里所有参与人的发言。有的 IM 会把两人对话也抽象成同一个东西,也可能出于优化的考虑把双人对话特殊处理。

所以,这些 IM 在操作界面上会有一个会话列表:表现出来会是联系人名单、聊天群列表等等。选中会话列表中的项目,进入会话查看聊天记录、发言,就是这类 IM
...

云风 2017-08-11 15:46 | 查看: 437

...更多...