Skip to content

Latest commit

 

History

History
586 lines (400 loc) · 42.1 KB

WeChat_Blog.md

File metadata and controls

586 lines (400 loc) · 42.1 KB

微信公众号高质量技术贴

  • 过滤掉对自己感觉没有技术相关性的,或者是那种水贴
  • 对内容进行归类整理
  • 阅读完写下自己的读后感

LINUX

从无盘启动看 Linux 启动原理

"只读内存"(ROM)----"基本输入输出系统"(BIOS)----"硬件自检"(POST)----"启动顺序"(Boot Sequence)
上电自检----UEFI 固件被加载----加载 UEFI 应用----启动内核及 initramfs
/sbin/init----/etc/inittab----etc/rcN.d

Linux 机器 CPU 毛刺问题排查

Linux Agent 每分钟会采集 4 次 15 秒内的 CPU 平均使用率。为了避免漏采集 CPU 峰值,网管 Agent 取这一分钟内四次采集的最大值上报。
gcore {pid}的命令,可以保留堆栈信息,明确具体高负载的位置
spp 的cost_stat_tool工具/tcpdump抓包确认

Linux 入门必看:如何60秒内分析Linux性能

uptime 系统启动时间
dmesg | tail 系统的错误日志,eg:杀死 OOM 问题的进程,丢弃 TCP 请求的问题
vmstat 1 查看CPU、内存、磁盘IO等待
mpstat -P ALL 1 打印各个 CPU 的时间统计,eg:一个使用率明显较高的 CPU 就可以明显看出来这是一个单线程应用
pidstat 1 pidstat 命令有点像 top 命令中的为每个 CPU 统计信息功能,但是它是以不断滚动更新的方式打印信息,而不是每次清屏打印
iostat -xz 1 这个工具对于理解块设备(比如磁盘)很有用,展示了请求负载和性能数据
free -m 显示了系统内存不足
sar -n DEV 1 使用这个工具是可以检测网络接口的吞吐
sar -n TCP,ETCP 每秒本地发起的 TCP 连接数;每秒远程发起的连接数;每秒 TCP 重传数(重传是网络或者服务器有问题的一个信号) top

​Linux CPU 性能优化指南

工具帖

Linux I/O 原理和 Zero-copy 技术全面揭秘

内核从本质上看是一种软件 —— 控制计算机的硬件资源,并提供上层应用程序 (进程) 运行的环境
用户态即上层应用程序 (进程) 的运行空间,应用程序 (进程) 的执行必须依托于内核提供的资源,这其中包括但不限于 CPU 资源、存储资源、I/O 资源等等
用户进程如何切换到内核态去使用那些内核资源呢?答案是:1) 系统调用(trap),2) 异常(exception)和 3) 中断(interrupt)
利用 DMA 而非 CPU 来完成硬件接口和内核缓冲区之间的数据拷贝,从而解放 CPU,使之能去执行其他的任务,提升系统性能
后面的就看不懂了

Linux 网络层收发包流程及 Netfilter 框架浅析

传输层负责创建 sk_buff,并将用户数据(应用层数据)填充到缓冲区,做合法性检查后,添加传输层头部,并通过网络层注册的接口将数据包交给网络层处理
网络层收到传输层数据包后,会查询路由表,决定数据包去向,如果是需要发出的数据包,会填充网络层头部,并交到内核虚拟网络接口设备的发送队列中
Linux 内核中,Netfiler 在网络层设置了多个 Hook 点

如何写出让 CPU 跑得更快的代码?

进程可能在不同 CPU 核心来回切换执行,这对 CPU Cache 不是有利的,虽然 L3 Cache 是多核心之间共享的,但是 L1 和 L2 Cache 都是每个核心独有的,如果一个进程在不同核心来回切换,各个核心的缓存命中率就会受到影响
在 Linux 上提供了 sched_setaffinity 方法,来实现将线程绑定到某个 CPU 核心这一功能

彻底搞懂 IO 底层原理

BIO 一个线程大约占用1M的空间;如果线程数量庞大,会造成线程做上下文切换的时间甚至大于线程执行的时间,CPU负载变高
NIO 用户进程需要不断去主动询问内核数据准备好了没有;用户进程不断切换到内核态 IO多路复用
select():复杂度O(n)fd_set不可重用,fd_set有大小的限制,目前被硬编码成了1024;每次操作完都必须重置,数据取出后也需要轮询哪个fd上发生了变动 poll():通过event变量注册感兴趣的可读可写事件(POLLIN、POLLOUT),最后把 pollfd 交给内核。当有读写事件触发的时候,我们可以通过轮询 pollfd,判断revent确定该fd是否发生了可读可写事件
epoll():O(1)复杂度,返回的"nfds"是一个确定的可读写的数量,相比于之前循环n次来确认,复杂度降低了不少

深入理解计算机系统:进程

Linux 内核使用 Lockdep 工具来检测和特别是预测锁的死锁场景

JVM GC JAVA

为什么我们选择 Java 语言开发高频交易系统

高度定制的 Linux 内核,带有操作系统旁路,这样数据就可以直接从网卡 "跳转" 到应用程序、基于 IPC 进程间通信,甚至使用 FPGA
Zing虚拟机 解决了 GC 暂停和 JIT 编译问题。

Java内存泄漏、性能优化、宕机死锁的N种姿势

内存管理:
0.堆内:老年代PS Old Generation使用率占99.99%,再结合gc log,如果老年代回收不掉,基本确认为堆上内存泄露;堆外:Java使用堆外内存导致的内存泄露、Java程序使用C++导致的内存泄露
1.堆上内存泄漏:首先用jdk/bin/jmap -dump:live,format=b,file=heap.hprof {pid},导出堆里所有活着的对象,然后用工具分析heap.hprof
2.对象被静态对象引用:右键RaftServerMetrics->Merge shortest path to GC Roots ->with all references查找所有引用RaftServerMetrics的地方
3.RPC连接使用完后未关闭:
4.堆外内存泄露:首先开启-XX:NativeMemoryTracking=detail显示的内存不包含C++分配的内存(为了快速验证是否DirectByteBuffer导致内存泄露,可使用参数-XX:MaxDirectMemorySize限制ectByteBuffer分配的堆外内存大小,如果堆外内存仍然大于MaxDirectMemorySize,可基本排除DirectByteBuffer导致的内存泄露)
5.Java调用C++组件:
性能优化:
1.arthas:开始perf: profiler start,采样一段时间后,停止perf: profiler stop。热点函数避免使用lambda表达式如stream.collect等
2.jaeger:
3.tcpdump:tcpdump -i eth0 -s 0 -A 'tcp dst port 9878 and tcp[((tcp[12:1] & 0xf0) >> 2):4] = 0x47455420' -w read.cap,该命令在读200M文件时会将所有GET请求导出到read.cap件,然后用wireshark打开read.cap
4.jstack:top -Hp pid命令打出进程pid的所有线程及每个线程的CPU消耗;然后计算出使用CPU最高的线程号的十六进制表示0x417,再用jstack -l pid > jstack.txt命令打出所有线程状态
宕机:
1.被其他进程杀:排查工具有两个:linux自带的auditd和systemtap
2.调用System的exit:可以用arthas排查:nohup ./as.sh -f system_exit.as 69001 -b > system_exit.out 2>&1 &,即可监控进程69001调用
3.Java调用的C++发生Crash:
4.Java内Crash:-XX:ErrorFile -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath
死锁:
1.jstack打出的死锁信息

Java中9种常见的CMS GC问题分析与解决

java线程池(newFixedThreadPool)线程消失疑问?

线程池的异常线程会被销毁,然后重新创建新的线程来补位

分享近期社区的几个经典的JVM问题

字节码增强:原理与实战

ARM环境下Java应用卡顿优化案例

Java ConcurrentHashMap 高并发安全实现原理解析

java.util.ConcurrentModificationException详解

迭代ArrayList的Iterator中有一个变量expectedModCount
该变量会初始化和modCount相等,但如果接下来如果集合进行修改modCount改变,就会造成expectedModCount!=modCount
Iterator的remove会修改expectedModCount,对单线程有用多线程无用

Java并发编程:并发容器之CopyOnWriteArrayList

CopyOnWrite容器也是一种读写分离的思想,读和写不同的容器
写操作复制出一个新的容器,然后新的容器里添加元素(加锁),读还是会读到旧的数据(不加锁)

深入分析ConcurrentHashMap

get方法里将要使用的共享变量都定义成volatile,java内存模型的happen before原则,对volatile字段的写入操作先于读操作
put方法里需要对共享变量进行写入操作,所以为了线程安全,在操作共享变量时必须得加锁
count方法先尝试两次不行再加锁,modCount变量,在put, remove和clean方法里操作元素前都会将变量modCount进行加1
那么在统计size前后比较modCount是否发生变化,从而得知容器的大小是否发生变化

Java 语言中锁的设计与应用

上篇 | 说说无锁(Lock-Free)编程那些事

下篇 | 说说无锁(Lock-Free)编程那些事(下)

Oracle JDK7 bug 发现、分析与解决实战

OKHttp Protobuf GRPC TOMCAT

OkHttp3线程池相关之Dispatcher中的ExecutorService

奇怪的知识: okhttp 是如何支持 Http2 的?

  • Grpc协议

gRPC 协议,简单来说就是 http2 协议的基础之上,增加了特定的协议 header:“grpc-” 开头的 header 字段,采用特定的打解包工具(protobuf)对数据进行序列化,从而实现 RPC 调用。
在 gRPC 的 stream 调用中,可在 server 端回传的过程中发送多次 Data,调用结束后再发送 Header 终止 RPC 过程,并汇报状态信息。

gRPC客户端详解

Thrift的客户端是线程不安全的——这意味着在Spring中无法以单例形式注入到Bean中
gRPC服务端的Response都是异步形式
gRPC的客户端有同步阻塞客户端(blockingStub) 和异步非阻塞客户端(Stub)两种

grpc原理

gRPC 基础概念详解

无论是 Client 还是 Server,在以异步方式进行处理时,都要预先分配好一定的内存 / 对象,以存储异步的请求或返回。
其实,回调方式的异步调用属于实验性质的,不建议直接在生产环境使用,这里也只做简单的介绍:
Notice: This API is EXPERIMENTAL and may be changed or removed at any time.
Client 发送流,是通过 Writer->WritesDone() 函数结束流
Server 发送流,是通过结束 RPC 函数并返回状态码的方式来结束流
流接受者,都是通过 Reader->Read() 返回的 bool 型状态,来判断流是否结束
Server 并没有像 Client 一样调用 WriteDone(),而是在消息之后,将 status code、可选的 status message、可选的 trailing metadata 追加进行发送,这就意味着流结束了
End-Of-Stream 并没有单独的数据去描述,而是通过 HTTP2 的数据帧上带一个 END_STREAM 的 flag 来标识的

深入了解 gRPC:协议

程序员如何用gRPC谈一场恋爱

A client-to-server streaming RPC :1.agent上报CPU,内存等数据到server;2.客户端心跳;3.客户端并发调用细小粒度的接口。
A server-to-client streaming RPC :1.股票app。客户端向服务端发送一个股票代码,服务端就把该股票的实时数据源源不断的返回给客户端;2.app的在线push。 A Bidirectional streaming RPC 1.聊天机器人;2.有状态的游戏服务器进行数据交换。

巧用 Protobuf 反射来优化代码,拒做 PB Boy

获取 PB 中所有非空字段:bool has_field = reflection->HasField(message, field)
将字段校验规则放置在 Proto 中:optional string name =1 [(field_rule) .length_min = 5, (field_rule) .id = 1]
基于 PB 反射的前端页面自动生成方案
通用存储系统(根据反射取出K/V)

一文讲懂进程间通信的几种方式

Tomcat 优雅关闭之路

Tomcat 9.0.26 高并发场景下DeadLock问题排查与修复

Tomcat 应用中并行流带来的类加载问题

Hystrix Seata Sentinel

分钟简述熔断器使用方法

Sentinel 是如何做限流的

Seata是什么?一文了解其实现原理

Canal 组件简介与 vivo 帐号实践

Hystrix 如何解决 ThreadLocal 信息丢失

分布式事务:Saga模式

logging tracing metrics

vivo 调用链 Agent 原理及实践

构建 Netflix 分布式追踪(tracing)体系

报警的哲学

基于Prometheus来做微服务监控,有多吃香?

Prometheus远程写入InfluxDB,遇到OOM引发的错误怎么解?

深入浅出开源监控系统Prometheus(上)

OpenTSDB 数据存储详解

美图全链路监控实战,成本低还能直接落地

CI CD UnitTest

如何有效地进行代码 Review?

这才是真正的Git——Git实用技巧

万字详文告诉你如何做 Code Review

如何有效地进行代码 Review?

TCP HTTP STOCKET

爱奇艺网络协程编写高并发应用实践

彻底弄懂TCP协议:从三次握手说起

​TCP 拥塞控制详解

一个有关tcp的非常有意思的问题

客户端在第一次write之前,服务端的socket收到fin包,进入到CLOSE_WAIT状态
此时,其实并不能说明服务端已经完全关闭了连接,它还有可能是发送fin包,只是为了关闭其send端,但它还是可以读的,所以客户端理应也可以继续写。

【TCP】CONNECTION RESET BY PEER 原因分析定位

客户端recev-Q阻塞,表明客户端处理不过来,操作系统接收缓冲区阻塞,程序没有及时消费掉;
nginx服务端send-Q阻塞,不能及时发出去,表明下游程序收不过来,和上述客户端现象表现一致;
查看客户端处理代码逻辑,发现单线程处理,效率低下,改成异步线程池提交处理的方式,问题解决。
linux操作系统的三个参数,跟此次现象有关:net.ipv4.tcp_keepalive_time;net.ipv4.tcp_keepalive_intvl;net.ipv4.tcp_keepalive_probes

JAVA.IO.IOEXCEPTION: CONNECTION RESET BY PEER问题解决

当并发请求超过服务器的承载量时,服务器会停掉一些请求。
客户端关闭了
防火墙/nginx影响了,1>高并发的处理;2>防DDOS攻击;3>爬虫扫描等等

https连接的前几毫秒发生了什么
https解决什么问题:1.域名污染/2.APR欺骗
https是应对中间人攻击的唯一方式
RSA加密和解密,密钥交换Key Exchange(证书被偷也没事)
怎样绕过https:使用ssltrip,这个工具它的实现原理是先使用arp欺骗和用户建立连接,然后强制将用户访问的https替换成http。即中间人和用户之间是http,而和服务器还是用的https

一文读懂 HTTP/1HTTP/2HTTP/3

白话http2的多路复用

移动端APM网络监控与优化方案

网络状况较好时,HTTP2.0多路复用,带来了性能上的优势,但在网络不稳定时,HTTP1.1错误率低于HTTP2.0。

  1. 多域名连接共享,实现0RTT多路复用
  2. 避免了DNS解析,防止DNS劫持
  3. protobuf编码私有协议,节省流量

深入理解web协议(二) :DNS、WebSocket

深入理解 web 协议(一) - http 包体传输

REDIS ES MYSQL MongoDB

Redis 进阶笔记

Redis 里的 List 设计非常牛,当数据量比较小的时候,数据结构是压缩链表,而当数据量比较多的时候就成为了快速链表。
hash 的扩容 rehash 过程就是维护了两个 hash 结构,如果需要扩容的时候,就把新的数据写入新字典中,然后后端起一个线程来逐步迁移,总体上来说就是采用了空间换时间的思想。
对于上游的客户端请求,采用了多路复用的原理。Redis 会给每一个客户端套接字都关联一个指令队列,客户端的指令队列通过队列排队来进行顺序处理,同时 Reids 给每一个客户端的套件字关联一个响应队列,Redis 服务器通过响应队列来将指令的接口返回给客户端
在 Redis 4.0 之后,支持了混合持久化 RDB + 增量的 AOF 文件

这篇Redis文章,Antirez看了都说好

mem_fragmentation_ratio一般大于1,且该值越大,内存碎片比例越大。如果mem_fragmentation_ratio<1,说明Redis使用了虚拟内存,由于虚拟内存的媒介是磁盘,比内存速度要慢很多,当这种情况出现时,应该及时排查,如果内存不足应该及时处理

Redis小功能大用处(1) -stat_expired_time_cap_reached_count

Redis常见客户端异常汇总(Jedis篇)

Redis在Linux系统的配置优化

Redis module功能介绍

Redis 6.2 RC发布新特性一览

败家玩意儿!Redis 竟然浪费了这么多内存!

从1到3分布式Redis电商实战&缓存穿透&缓存雪崩&缓存失效终极解决

替你踩过Redis缓存的坑,奉上使用规范和监控方法

Redis为什么变慢了?Redis性能问题排查详述

超级实用,建议看原文

运维:终于不用再背着数万实例的Redis集群了

一万字详解 Redis Cluster Gossip 协议

Codis VS Redis Cluster:我该选择哪一个集群方案

codis提供了
1.dashboard的fe界面运维简单
2.基于zookeeper的proxy代理slot-mapping映射
3.基于sentinel的主从切换高可用
codis提供了异步的数据迁移方案(其中对大key拆分迁移的原子性方案),对比redis-cluster来说相对应用较早

Redis 缓存性能实践及总结

Redis小功能大用处-total_net_output_bytes

Redis速度快的原因:几点图解总结

深入浅出百亿请求高可用Redis(codis)分布式集群揭秘

干货 | 数万实例数百TB数据量,携程Redis治理演进之路

干货 | 携程Redis治理演进之路(二)

pika集群水平扩展——让性能容量不再受限

Spark-Redis入门到解决执行海量数据插入、查询作业时碰到的问题

超全的数据库建表/SQL/索引规范,适合贴在工位上!

MySQL 5.6.35 索引优化导致的死锁案例解析

原因是:index_merge是MySQL 5.1后引入的一项索引合并优化技术,它允许对同一个表同时使用多个索引进行查询,并对多个索引的查询结果进行合并(取交集(intersect)、并集(union)等)后返回。
死锁的本质原因还是由加锁顺序不同所导致,是由于Index Merge同时使用2个索引方向加锁所导致,解决方法也比较简单,就是消除因index merge带来的多个索引同时执行的情况。

让MySQL飞起来!别小看这21种写SQL的好习惯

操作delete或者update语句,加个limit
SQL命令行修改数据,养成begin + commit 事务的习惯
写完SQL先explain查看执行计划
如果修改/更新数据过多,考虑批量进行

我在MySQL原厂的那些年都经历了什么?

高并发场景下,百万级订单量系统的分库分表重构经历

3年部署3000套PG实例的架构设计与踩坑经验

简述3种CQRS架构模式

InnoDB 事务加锁分析

MySQL 的 crash-safe 原理解析

MySQL 8 新特性之Clone Plugin

MySQL 索引知识点总结

API 分页设计与实现

在数据库中有一个游标(cursor)的概念,它是一个指向行的指针,然后可以告诉数据库:"在这个游标之后返回 100 行"。
使用游标的另一个原因是避免由于并发编辑而导致元素重复或跳过的问题,而不用担心新的记录进来扰乱你的分页。

一次看完28个关于ES的性能调优技巧

ElasticSearch使用规范beta版

非日志型(搜索型、线上业务型) 的shard容量在1030GB(建议在10G)
日志型的shard容量在30
100GB(建议30G)
单个shard的文档个数不能超过21亿左右(Integer.MAX_VALUE - 128)
一个节点管理的shard数不要超过200个
routing id不均衡:集群容量和访问不均衡,对于分布式存储是致命的
拒绝大聚合 :ES计算都在JVM内存中完成
拒绝模糊查询:es一大杀手
拒绝深度分页
禁止查询 indexName-*

干货 | 携程Elasticsearch数据同步实践

Elasticsearch调优实践

cluster.routing.allocation.enable: "none",实际上影响的是已有索引(local存在)的replica,以及新创建索引的primary和replica。

分布式搜索引擎Elasticsearch的架构分析

连环触发!MongoDB核心集群雪崩故障背后竟是……

KAFKA MQ ZOOKEEPER CONSUL

运维必备:Zookeeper集群“脑裂”问题处理大全

深入浅出 ZooKeeper

基于Consul服务注册中心:一次故障分析及优化

首先网络抖动,导致大量PreparedQuery请求积压在Server中,同时也造成了大量的goroutine和内存使用
在网络恢复之后,积压的PreparedQuery继续执行,这些goroutine在执行时都会更新metrics从而去获取全局的sync.Mutex,此时切换到starvation模式并且性能下降,> 大量时间都在等待sync.Mutex,请求阻塞超时;除了积压的goroutine,新的PreparedQuery还在不停接收,获取锁时同样被阻塞,结果是sync.Mutex保持在starvation模式无法自动恢复;
另一方面raft代码运行会依赖定时器、超时、节点间消息的及时传递与处理,并且这些超时通常是秒、毫秒级别的,但metrics代码阻塞过久,直接导致时序相关的逻辑无法正常运行。

这样做RabbitMQ高可用,业务流量猛增10倍也不怂

vivo 基于原生 RabbitMQ 的高可用架构实践

简单理解 Kafka 的消息可靠性策略

ISR : leader 副本保持一定同步的 follower 副本, 包括 leader 副本自己,叫 In Sync Replica
HW: Highwater, 俗称高水位,它表示了一个特定的消息偏移量(offset)在一个 parttion 中 consumer 只能拉取这个 offset 之前的消息(此 offset 跟 consumer offset 不是一个概念)
LEO: LogEndOffset, 日志末端偏移量, 用来表示当前日志文件中下一条写入消息的 offset
leader HW: 该 Partititon 所有副本的 LEO 最小值
follower HW: min(follower 自身 LEO 和 leader HW)
Leader HW = 所有副本 LEO 最小值
Follower HW = min(follower 自身 LEO 和 leader HW)
Leader 不仅保存了自己的 HW &LEO 还保存了远端副本的 HW &LEO
在kafka配置为AP系统的情况下发生截断发生的概率会大大提升
Kafka Broker 会在内存中为每个分区都缓存 Leader Epoch 数据,同时它还会定期地将这些信息持久化到一个 checkpoint 文件中

从演进式角度看消息队列

redis实现的话:热key的问题/数据会被删除;topic在kafka中更多是一个逻辑上的概念,实际存储单元都是partition;kafka用游标(cursor)
kafka在实际存储partition时又进行了一个拆分。topicA-partition-0的数据并不是写到一个文件里,而是写到多个segment文件里,当segment中所有消息都过期时,可以很容易地直接删除整个文件。
为了防止kafka的index过大,权衡之下kafka选择了使用”稀疏索引“。

总结 Kafka 背后的优秀设计

利用了 Page cache 来存储,这样躲开了数据在 JVM 因为 GC 而发生的 STW
为了保证性能,Kafka 不会采用强一致性的方式来同步主从的数据。而是维护了一个:in-sync Replica 的列表,Leader 不需要等待所有 Follower 都完成同步

Linux Page Cache调优在Kafka中的应用

Kafka Exactly-Once 之事务性实现

支持百万级TPS,Kafka是怎么做到的?

知乎基于Kubernetes的kafka平台的设计和实现

HIVE HBASE FLINK KYLIN

万亿数据下的多维实时分析系统,如何做到亚秒级响应

高效大数据开发之 bitmap 思想的应用

滴滴实时数仓逐层剖解:实时与离线数据误差<0.5%

数仓引入ClickHouse之后,性能提升了400%!

pache Kylin的实践与优化

美团之前没有好好的看kylin的源码和配置参数,导致线上的CPU、内存、文件数没有规划
引擎升级至:spark(最近是flink了) 数据源采用hive 全局字典依赖配置

应对万亿数据上亿并发!字节跳动的图数据库研发实践

自研的图数据库:解决了热点无问题,性能单节点R:200k W:10k
不支持ACID事务、总之还在发展中

基于Kafka+Flink平台化设计,实时数仓还能这样建

网易云音乐将实时计算的多个sink下kafkasource的重复消费问题:增加了一个data update标记同一个表计算合并
多个kafka集群部署在一个交换机下,离线计算和实时计算等其他情况造成的交换机带宽问题:拆分机房规划

HBase数据迁移到Kafka?这种逆向操作你懵逼了吗?

知乎 HBase 实践

两小时搞定PB级HDFS数据迁移,挪走日均近5亿RPC

serviceMesh K8S Docker Envoy Nginx

Service Mesh在腾讯云中间件团队的实践与思考

后分布式时代: 多数派读写的「少数派」实现

你真的知道怎么实现一个延迟队列吗 ?

微信研发体系下的分布式配置系统设计概要

Docker 底层原理浅析

越来越复杂,为什么是中台?

Kubernetes Ingress 基于内容的路由

Kubernetes 入门&进阶实战

从监控告警到部署服务,中间需要人力介入!那么,有没有办法自动完成服务的部署、更新、卸载和扩容、缩容呢?
K8S 的 Master Node 具备:请求入口管理(API Server),Worker Node 调度(Scheduler),监控和自动调节(Controller Manager),以及存储功能(etcd);而 K8S 的 Worker Node 具备:状态和监控收集(Kubelet),网络和负载均衡(Kube-Proxy)、保障容器化运行环境(Container Runtime)、以及定制化功能(Add-Ons)
所有 Master Node 和 Worker Node 组成了 K8S 集群,同一个集群可能存在多个 Master Node 和 Worker Node。
Pod 就是 K8S 中一个服务的闭包:Pod 可以被理解成一群可以共享网络、存储和计算资源的容器化服务的集合。
volume 是 K8S 的对象,对应一个实体的数据卷;而 volumeMounts 只是 container 的挂载点,对应 container 的其中一个参数
一个 Pod 内可以有多个容器 container。
Deployment 的作用是管理和控制 Pod 和 ReplicaSet,管控它们运行在用户期望的状态中。哎,打个形象的比喻,Deployment 就是包工头,ReplicaSet 就是总包工头手下的小包工头。
Service 是 K8S 服务的核心,屏蔽了服务细节,统一对外暴露服务接口,真正做到了“微服务”
Service 主要负责 K8S 集群内部的网络拓扑。那么集群外部怎么访问集群内部呢?这个时候就需要 Ingress 了
namespace 是为了把一个 K8S 集群划分为若干个资源不可共享的虚拟集群而诞生的。
Kubectl 是一个命令行接口,用于对 Kubernetes 集群运行命令:kubectl 部署服务;kubectl 查看、更新/编辑、删除服务;kubectl 排查服务问题

高可用架构怎么选?常见多活建设这么一对比就懂了

谷歌可靠性工程的“封神”之路:从大规模分布式系统高效故障响应说起

Envoy

基于类库模式的痛点是做了大量的重复开发,如果在容器里面跑,不仅重,修改起来也麻烦,并且一旦把限流限速的逻辑修改了,那么每个服务都要修改。

复杂环境下落地Service Mesh的挑战与实践

gRPC 统一了底层通信层;protobuf 统一了序列化协议;以 envoy + istio 为代表的 service mesh 逐渐统一了服务的控制面与数据面

vivo 微服务 API 网关架构实践

Envoy 架构及其在网易轻舟的落地实践

Listener(监听器)/Cluster(集群)/Filter(过滤器)/Route(路由)
Listener Filter 处理连接、Network Filter 处理二进制数据、L7 Filter 处理解析后结构化数据
相比于数据面纯粹的代理,API 网关更强调流量的治理。详细的日志、丰富的监控、及时的报警、准确的链路分析,这些才能撑起一个 API 网关所必须的可观察性
Envoy 提供了全局/本地限流、黑白名单、服务/路由熔断、动静态降级、流量染色等等流量治理
你的工作不是“使用服务网络”或“采用Envoy”,甚至“只使用CNCF技术”。你的工作是清楚地了解你要解决的问题,然后选择最能解决它的解决方案。无论你选择什么,你都将不得不接受它--所以确保你的决策是基于具体的

Nginx

一文看懂Nginx架构

master进程主要用来管理worker进程,具体包括如下4个主要功能:
1)接受来自外界的信号。其中master循环中的各项标志位就对应着各种信号,如:ngx_quit代表QUIT信号,表示优雅的关闭整个服务。
2)向各个worker进程发送信。比如ngx_noaccept代表WINCH信号,表示所有子进程不再接受处理新的连接,由master向所有的子进程发送QUIT信号量。
3)监控worker进程的运行状态。比如ngx_reap代表CHILD信号,表示有子进程意外结束,这时需要监控所有子进程的运行状态,主要由ngx_reap_children完成。
4)当woker进程退出后(异常情况下),会自动重新启动新的woker进程。主要也是在ngx_reap_children。
Nginx热更配置,具体流程:master使用新配置启动新的worker,旧的worker不再接受新的请求。
Nginx热更配置,具体流程:新旧master和worker共存。向老master发送WINCH信号,关闭旧worker进程,观察新worker进程工作情况。若升级成功,则向老master进程发送QUIT信号,关闭老master进程 epoll利用红黑树高效的增删查效率来管理连接,利用一个双向链表来维护活跃连接
多个worker来出来accept事件冲突:设置ngx_accept_mutex锁,只有获得锁的进程,才可以处理连接事件
为什么不采用多线程模型管理连接/处理逻辑业务? 无状态服务,无需共享进程内存;一个进程异常崩溃,其他进程的服务不会中断,提升了架构的可靠性;作为接入层,基本上都是数据转发业务,网络IO任务的等待耗时部分,已经被处理为非阻塞/全异步/事件驱动模式,在没有更多CPU的情况下,再利用多线程处理,意义不大

delete later

漫画:什么是一致性哈希?

漫画:三种 “奇葩” 的排序算法

原创 | 手把手刷二叉搜索树(第二期)

读者问:到底怎么学操作系统和计算机网络呀?

双指针技巧秒杀四道数组/链表题目

只能用分布式锁,也能搞定每秒上千订单的高并发优化?

万字详文阐释程序员修炼之道

SpringBoot 配置类解析

SpringBoot 2.0 中 HikariCP 数据库连接池原理解析

FastList 适用于逆序删除场景;而 ConcurrentBag 本质上是通过 ThreadLocal 将连接池中的连接按照线程做一次预分配,避免直接竞争共享资源,减少并发CAS带来的CPU CACHE的频繁失效,从而提高性能,非常适合池化资源的分配

分布式定时任务调度框架实践

一文了解 Consistent Hash

哪种一致性哈希算法才是解决分布式缓存问题的王者?

看不懂

分布式一致性算法 Raft

首先选出 leader,leader 节点负责接收外部的数据更新 / 删除请求; 然后日志复制到其他 follower 节点,同时通过安全性的准则来保证整个日志复制的一致性; 如果遇到 leader 故障,followers 会重新发起选举出新的 leader; 为了解决数据不一致性,Raft 算法规定 follower 强制复制 leader 节日的日志,即 follower 不一致日志都会被 leader 的日志覆盖,最终 follower 和 leader 保持一致 只有当前任期且复制超过半数的日志才可以提交

分布式高并发服务三种常用限流方案简介

领域驱动设计框架Axon实践

Dubbo 3.0 前瞻系列:服务发现支持百万集群,带来可伸缩微服务架构

vivo 互联网业务就近路由技术实战

被数据库读写分离坑了,数据不一致怎么解

搞了个中间件:做从库同步状态的标记,很鸡肋

vivo 全球商城:订单中心架构设计与实践

说的挺多,但是看这句话:考虑到不停机方案的改造成本较高,而夜间停机方案的业务损失并不大,最终选用的是停机迁移方案。

高级架构师用10年历练出的一份缓存使用总结

就是个缓存的简单应用,适合小白

怎么用Redis分布式锁才能确保万无一失?

SET key val NX EX expireTime
目前互联网公司在生产环境用的比较广泛的开源框架 Redisson
Redis 的作者 antirez 提供了 RedLock 的算法来实现一个分布式锁 https://redis.io/topics/distlock

唯一ID生成算法剖析

批量生成一批ID
雪花算法:在分布式环境下,如果发生时钟回拨,很可能会引起id冲突的问题(有若干解决方案)

蓄水池抽样算法(Reservoir Sampling)

分布式之系统底层原理

API设计最佳实践

低代码在爱奇艺鹊桥数据同步平台的实践

高性能缓存 Caffeine 原理及实战

W-TinyLFU 算法

一文掌握开发利器:正则表达式

正则表达式帮助文档
正则回溯:NFA 速度较 DFA 更慢,并且实现复杂,但是它又有着比 DFA 强大的多的功能,比如支持反向引用等。像 javaScript、java、php、python、c#等语言的正则引擎都是 NFA 型,NFA 正则引擎的实现过程中使用了回溯
RegexBuddy:正则分析工具

https://mp.weixin.qq.com/s/sRFmW57KUY3yyyRkyw0L4A https://mp.weixin.qq.com/s/h3CBZt2KEA-ScXFSKHaRBg https://mp.weixin.qq.com/s/xO2dkyZqKnUcaEXn_B39rw https://mp.weixin.qq.com/s/gd59U50tlJPa4B4avXRG1Q https://mp.weixin.qq.com/s/vzvmOXGcsX7rwY4J_--onw https://mp.weixin.qq.com/s/uuHeK9wJvo5hCxhQTpEVvQ https://mp.weixin.qq.com/s/4_TIWXgQDdCaRs3SqWCPlg https://mp.weixin.qq.com/s/8i8WDxqCZnv1s8W8V1YmXg