Rye

Chord-A Scalable Peer-to-peer Lookup Service for Internt Application

这篇文章是2001年SIGCOMM上面的,是2000年之后系统类文章引用数最高的一篇文章。Chord是一种在P2P网络中快速定位资源的算法,它并不关心资源的存储,所以Chord提供的接口非常简单,只有set和get两个接口。我想这篇论文之所以引用数这么高,和它提供的简单接口,可扩展性,高效率,查找正确性等特点是分不开的。

BitTorrent

我们常用的P2P协议是BitTorrent,原理......

Dynamo:Amazon's Highly Available Key-value Store SOSP'07

这篇文章是07年的SOSP上的,虽然在技术上没有什么特别的创新,但是这篇文章却是利用各种分布式系统的技术组合在一起来满足特定的业务需求的典范。

Amazon主要业务是电子商务,所以对系统的可靠性(Reliability)和可扩展性(Scalability)要求非常高。要达到这两点要求,Amazon采用了去中心化(Decentralized),低耦合(Loosely Coupled)和面向服......

Sparrow:Distributed,Low Latency Scheduling SOSP'13

这篇论文是UC Berkeley AMPLab出的一系列论文之中的一个,AMPLab实验室有一整套大数据处理和分析框架,称为BDAS(the Berkeley Data Analytics Stack),其中比较出名的是Spark。Spark是一个高效的分布式计算系统,性能上要比Hadoop高出100倍。这篇论文主要实现的是一个分布式的,低延迟的调度系统。

大规模的数据分析框架都在朝着小规......