只需要90分钟,醍醐灌顶,读透Nginx源码
前言
总结有福利
如何快速的把Nginx读明白,更加深入的了解Nginx,
有很多朋友就想我能用Nginx就可以了,搞那么明白干嘛,
学Nginx我们到底是先用,还是了解源码,
在这里我觉的当然还是先用起来,在去阅读源码,这是成正常的一种想法,
1、我肯定是先把Nginx跑起来明先会用,在深入。《用到什么是才算会用 到什么程度算深入才可以了解源码》如果在你不了解Nginx的情况下直接去用,我很负责人的告诉你,你阅读的会很痛苦真的,
什么时候算会用Nginx
(1)会编译安装
(2)能根据Nginx一些需求去配置使用《推荐大家一本书深入了解Nginx架构:模块开发》
Nginx该了解那些
(1)内存池,线程池,,共享内存,原子操作,日志处理,epoII,多进程模型,红黑树,《了解这些在去读Nginx源码就容易很多了》
先和大家讲一下线程池吧
线程池如何设计一下高性能服务器
a、cpu
b、内存
c、网卡
d、磁盘
线程池的优势:
(1)、创建的进程或者线程是有限的,服务器的系统代价比较小,一般不会到达系统限制的值。
(2)、服务器不需要频繁的创建、销毁进程或者线程,只在服务器启动时创建,结束时销毁。
(3)、创建的进程或者线程不是为一个客户端服务,可以串行为多个客户端服务。
(4)、客户端连接上以后,不需要再去创建进程或者线程,只需要分配进程池或者线程池中的进程或线程,减少了客户端等待的时间。
线程池的逻辑(伪代码):
int listenfd = socket();
int res = bind();
listen();
//创建线程池中所有的线程
while(1)
{
int c = accept();
//在线程池分配一个线程为C服务
}
- 在代码实现时需要注意的问题:
(1)、线程如何阻塞在线程池中 ;
信号量P操作
(2)、如何分配一个线程为客户端服务;
主线程接受一个客户端连接执行V操作
(3)、主线程如何传递客户端连接的文件描述符;
全局维护一个数组或者链表
(4)、再插入数据和获取数据时,每个线程都是互斥的,必须加锁。 - 具体代码:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <assert.h>
#include <unistd.h>
#include <sys/socket.h>
#include <sys/types.h>
#include <arpa/inet.h>
#include <netinet/in.h>
#include <pthread.h>
#include <semaphore.h>
#define THREADNUM 3
#define CLIENTNUM 10
sem_t sem;
pthread_mutex_t mutex;
int ClientFds[CLIENTNUM];
void Init_ClientFds()
{
int i = 0;
for(; i < CLIENTNUM; ++i)
{
ClientFds[i] = -1;
}
}
void Insert_Client(int fd)
{
pthread_mutex_lock(&mutex);
int i = 0;
for(; i < CLIENTNUM; ++i)
{
if(ClientFds[i] == -1)
{
ClientFds[i] = fd;
break;
}
}
pthread_mutex_unlock(&mutex);
}
int Get_Client()
{
pthread_mutex_lock(&mutex);
int i = 0, c = -1;
for(; i < CLIENTNUM; ++i)
{
if(ClientFds[i] != -1)
{
c = ClientFds[i];
ClientFds[i] = -1;
break;
}
}
pthread_mutex_unlock(&mutex);
return c;
}
void * DealClient(void * arg)
{
while(1)
{
sem_wait(&sem);
int c = Get_Client();
while(1)
{
char data[128] = {0};
int n = recv(c, data, 127, 0);
if(n <= 0)
{
close(c);
break;
}
printf("%s\n", data);
send(c, "OK", 2, 0);
}
}
}
int main()
{
int listenfd = socket(AF_INET, SOCK_STREAM, 0);
assert(listenfd != -1);
struct sockaddr_in ser;
memset(&ser, 0, sizeof(ser));
ser.sin_family = AF_INET;
ser.sin_port = htons(6000);
ser.sin_addr.s_addr = inet_addr("127.0.0.1");
int res = bind(listenfd, (struct sockaddr*)&ser, sizeof(ser));
assert(res != -1);
listen(listenfd, 5);
sem_init(&sem, 0, 0);
pthread_mutex_init(&mutex, NULL);
Init_ClientFds();
// 创建线程池
int i = 0;
for(; i < THREADNUM; ++i)
{
pthread_t id;
int res = pthread_create(&id, NULL, DealClient, NULL);
assert(res == 0);
}
while(1)
{
struct sockaddr_in cli;
int len = sizeof(cli);
int c = accept(listenfd, (struct sockaddr*)&cli, &len);
assert(c != -1);
Insert_Client(c); // 将c传递给函数线程
sem_post(&sem); // V操作
}
}
代码优化:
我们为了保存文件描述符维护了一个数组,在代码中插入获取时都是从[0]遍历获取,加入56789,再取出56,此时又插入了10,那么下一次就会对10先进行操作,使后面的fd等待太久,因此对于代码中的GetClientFds()做了优化。

int GetClientFds() //只需将每次获取时整体向前挪一个单元格 { pthread_mutex_lock(&mutex); int i = 0; int c = ClientFds[0]; for(; i < CLIENTNUM-1 || ClientFds[i] != -1 ; i++) { ClientFds[i] = ClientFds[i +1]; } ClientFds[i] = -1; pthread_mutex_unlock(&mutex); return c; }
- 维护文件描述符数组的方式:
第①种方式:

优点:只要数组中有fd就能立即处理
缺点:当fd插入不是很频繁的时候,会出现一直只调用第一个函数线程的情况,其他的函数线程一直未使用,造成资源的浪费。
第②种方式:

优点:只要分配合理,每一条线程都能得到利用
缺点:当其中的一个子线程fd处理比较麻烦时,后面分配给他的fd会滞留在数组中得不到及时的处理
相对比①②来说,②的处理方法更合理一些,这种方法可以做到负载均衡
- 总结:
进程池和线程池相比于多进程多线程有所改善,但当一个线程为一个客户端服务时,只能等客户端退出,才能服务下一个客户端,有可能出现客户端占着资源不使用,阻塞在recv函数的情况,对线程也是一种浪费,进程池同理,这种情况是之前提到服务器的通病,在select,poll,epoll,这三种方法建立的服务器会将这个问题解决。