HY Blog

New post every day (with probability 0.03).

YesOS实现一个简易但五脏俱全的操作系统

A Tiny Operating System

写一个简易操作系统的想法源于大二的DSP张老师的建议,不过由于当时基础薄弱而且没有大块的时间(其实就是太菜=_=),也就作罢。好在大四这段时间相对清闲,便找了这本已经几乎绝版的书(值得参考的书实在不多),头铁开始边看边写。 有了之前看《x86汇编语言:从实模式到保护模式》的基础,并得益于作者详略得当的写作,内容理解起来还算顺利,不过毕竟是十多年前的书了,很多编译和运行环境都有了变化,导致实践...

Dapper

a Large-Scale Distributed Systems Tracing Infrastructure

Dapper, a Large-Scale Distributed Systems Tracing Infrastructure 原文:https://ai.google/research/pubs/pub36356 译文:http://alphawang.com/blog/google-dapper-translation 摘要 现代互联网服务通常都是复杂的大规模分布式...

基于DDS的SOA服务成框架的研究

DDS与SOA

概述 提出了基于DDS的SOA服务集成框架,为分布式实时应用系统提供通用的服务集成和管理,实现资源的共享和重用。 DDS说OMG组织制定的分布式实时通信中间件规范,具有同步解耦、多对多通信和丰富的QoS等优点,同时兼顾搞笑实时的传输性能。 分布式实时系统->应用规模增大->应用交互需求增大->应用之间缺乏有效的资源共享和系统管理途径,导致功能冗余,运维低效->提出S...

C++Primer-C++基础

C++Primer阅读笔记

基本内置类型 算数类型 bool的最小尺寸是未定义的,根据具体平台的实现决定 wchar_t:类型用于确保可以存放机器最大扩展字符集中的任意一个字符 char16_t和char32_t则为Unicode(用于表示所有自然语言字符的标准)服务 long long 是C++11才有的,另外还有一个long double一般是3到4个字表示,但是很少用,一般被用于有特殊浮点需...

Blackbox Prediction NSDI 2021

On the Use of ML for Blackbox System Performance Prediction

Does ML make prediction simpler (i.e., allowing us to treat systems as blackboxes) and general (i.e., across a range of applications and use-cases)? The answer is NO. Core idea 实验探究机器学习对黑盒系统性能预测 ...

OnRamp NSDI 2021

Breaking the Transience Equilibrium Nexus A New Approach to Datacenter Packet Transport

(未完待续) 云数据中心拥塞控制算法 Core idea 解耦 Transience-Equilibrium (笔者理解为瞬态拥塞和持久/稳态拥塞): 传统 Congestion Cntrol 处理 Equilibrium congestion 增加基于端到端延时的pause机制处理 Transience congestion Motivation Transi...

Annulus SIGCOMM 2020

A Dual Congestion Control Loop for Datacenter and WAN Traffic Aggregates

针对广域网流量和数据中心流量在数据中心内部共享bottleneck带来的性能问题 Core idea 两个control loop,主要目的是让广域网的流量能够及时获知带宽变化,进行速率调节: congestion at nearby datacenter switches (e.g. ToRs) configured to send direct feedback; 借助于Q...

Swift SIGCOMM 2020

Delay is Simple and Effective for Congestion Control in the Datacenter

Swift是谷歌提出的数据中心拥塞控制协议, 继承Timely的思想, 使用delay作为拥塞信号. Core idea 区分 fabric congestion 和 endpoint congestion: 细粒度delay测量 endpoint delay: remote-queuing (echoed in the ACK) + Local NIC Rx Delay ...

ADS SIGCOMM CCR 2019

Datacenter Congestion Control Identifying what is essential and making it practical

Core idea - two questions: What factors (i.e., which particular design decisions) are the most essential to achieving good performance? Can we deploy such designs easily? Ke...

Aeolus SIGCOMM 2020

A Building Block for Proactive Transport in Datacenters

Aeolus针对近年数据中心较热的主动拥塞控制协议一个普遍没有解决好的问题:第一个RTT内unscheduled的数据包直接发送造成丢包, 延时不可控。 主动拥塞控制思想:request and allocation, 显式分配带宽,提前避免拥塞发生 主动拥塞控制实现方式:基于集中控制器(Fastpass)、基于交换机(TFC PDQ)、基于接收端(ExpressPass pHo...