只需要90分钟，醍醐灌顶，读透Nginx源码

100人浏览 2024-08-14 13:16:58

前言

总结有福利

如何快速的把Nginx读明白，更加深入的了解Nginx，

有很多朋友就想我能用Nginx就可以了，搞那么明白干嘛，

学Nginx我们到底是先用，还是了解源码，

在这里我觉的当然还是先用起来，在去阅读源码，这是成正常的一种想法，

1、我肯定是先把Nginx跑起来明先会用，在深入。《用到什么是才算会用到什么程度算深入才可以了解源码》如果在你不了解Nginx的情况下直接去用，我很负责人的告诉你，你阅读的会很痛苦真的，

什么时候算会用Nginx

（1）会编译安装

（2）能根据Nginx一些需求去配置使用《推荐大家一本书深入了解Nginx架构：模块开发》

Nginx该了解那些

（1）内存池，线程池，，共享内存，原子操作，日志处理，epoII，多进程模型，红黑树，《了解这些在去读Nginx源码就容易很多了》

先和大家讲一下线程池吧

线程池如何设计一下高性能服务器

a、cpu

b、内存

c、网卡

d、磁盘

线程池的优势：

（1）、创建的进程或者线程是有限的，服务器的系统代价比较小，一般不会到达系统限制的值。
（2）、服务器不需要频繁的创建、销毁进程或者线程，只在服务器启动时创建，结束时销毁。
（3）、创建的进程或者线程不是为一个客户端服务，可以串行为多个客户端服务。
（4）、客户端连接上以后，不需要再去创建进程或者线程，只需要分配进程池或者线程池中的进程或线程，减少了客户端等待的时间。

线程池的逻辑（伪代码）：

int listenfd = socket();
int res = bind();
listen();

//创建线程池中所有的线程
while(1)
{
int c = accept();
//在线程池分配一个线程为C服务
}

在代码实现时需要注意的问题：
（1）、线程如何阻塞在线程池中；
信号量P操作
（2）、如何分配一个线程为客户端服务；
主线程接受一个客户端连接执行V操作
（3）、主线程如何传递客户端连接的文件描述符；
全局维护一个数组或者链表
（4）、再插入数据和获取数据时，每个线程都是互斥的，必须加锁。
具体代码：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <assert.h>
#include <unistd.h>

#include <sys/socket.h>
#include <sys/types.h>
#include <arpa/inet.h>
#include <netinet/in.h>
#include <pthread.h>
#include <semaphore.h>

#define THREADNUM  3
#define CLIENTNUM  10
sem_t sem;
pthread_mutex_t  mutex;

int ClientFds[CLIENTNUM];

void Init_ClientFds()
{
	int i = 0;
	for(; i < CLIENTNUM; ++i)
	{
		ClientFds[i] = -1;
	}
}

void Insert_Client(int fd)
{
	pthread_mutex_lock(&mutex);

	int i = 0;
	for(; i < CLIENTNUM; ++i)
	{
		if(ClientFds[i] == -1)
		{
			ClientFds[i] = fd;
			break;
		}
	}

	pthread_mutex_unlock(&mutex);
}

int Get_Client()
{
	pthread_mutex_lock(&mutex);

	int i = 0, c = -1;
	for(; i < CLIENTNUM; ++i)
	{
		if(ClientFds[i] != -1)
		{
			c = ClientFds[i];
			ClientFds[i] = -1;
			break;
		}
	}

	pthread_mutex_unlock(&mutex);

	return c;
}

void * DealClient(void * arg)
{
	while(1)
	{
		sem_wait(&sem);
		int  c = Get_Client();
		while(1)
		{
			char data[128] = {0};
			int n = recv(c, data, 127, 0);
			if(n <= 0)
			{
				close(c);
				break;
			}

			printf("%s\n", data);

			send(c, "OK", 2, 0);
		}
	}
}

int main()
{
	int listenfd = socket(AF_INET, SOCK_STREAM, 0);
	assert(listenfd != -1);

	struct sockaddr_in ser;
	memset(&ser, 0, sizeof(ser));
	ser.sin_family = AF_INET;
	ser.sin_port = htons(6000);
	ser.sin_addr.s_addr = inet_addr("127.0.0.1");

	int res = bind(listenfd, (struct sockaddr*)&ser, sizeof(ser));
	assert(res != -1);

	listen(listenfd, 5);

	sem_init(&sem, 0, 0);
	pthread_mutex_init(&mutex, NULL);
	Init_ClientFds();

	//  创建线程池
	int i = 0;
	for(; i < THREADNUM; ++i)
	{
		pthread_t id;
		int res = pthread_create(&id, NULL, DealClient, NULL);
		assert(res  == 0);
	}

	while(1)
	{
		struct sockaddr_in cli;
		int len = sizeof(cli);

		int c = accept(listenfd, (struct sockaddr*)&cli, &len);
		assert(c != -1);

		Insert_Client(c);  //  将c传递给函数线程
		sem_post(&sem);   //  V操作
	}
}

代码优化：
我们为了保存文件描述符维护了一个数组，在代码中插入获取时都是从[0]遍历获取，加入56789，再取出56，此时又插入了10，那么下一次就会对10先进行操作，使后面的fd等待太久，因此对于代码中的GetClientFds()做了优化。

int GetClientFds() //只需将每次获取时整体向前挪一个单元格 { pthread_mutex_lock(&mutex); int i = 0; int c = ClientFds[0]; for(; i < CLIENTNUM-1 || ClientFds[i] != -1 ; i++) { ClientFds[i] = ClientFds[i +1]; } ClientFds[i] = -1; pthread_mutex_unlock(&mutex); return c; }

维护文件描述符数组的方式：

第①种方式：

优点：只要数组中有fd就能立即处理
缺点：当fd插入不是很频繁的时候，会出现一直只调用第一个函数线程的情况，其他的函数线程一直未使用，造成资源的浪费。

第②种方式：

优点：只要分配合理，每一条线程都能得到利用
缺点：当其中的一个子线程fd处理比较麻烦时，后面分配给他的fd会滞留在数组中得不到及时的处理
相对比①②来说，②的处理方法更合理一些，这种方法可以做到负载均衡

总结：
进程池和线程池相比于多进程多线程有所改善，但当一个线程为一个客户端服务时，只能等客户端退出，才能服务下一个客户端，有可能出现客户端占着资源不使用，阻塞在recv函数的情况，对线程也是一种浪费，进程池同理，这种情况是之前提到服务器的通病，在select，poll，epoll，这三种方法建立的服务器会将这个问题解决。

本文分类：nginx
本文链接：https://m.fuwuqi.cn/nginx/Xnkqm1EkOb.html

上一篇 > 清除Cookies头解决Nginx 431 Request Header Too Large错误
下一篇 > 基于 Nginx+lua+Memcache 实现灰度发布

导航栏目

服务器系统

服务器技术

编程语言

数据库

只需要90分钟，醍醐灌顶，读透Nginx源码

前言

相关推荐