访问一个网站的全过程

2018年8月20日16:01:27 12 22,162 views
摘要

本文主要介绍:用户访问我的网站都经过了哪些步骤,网站访问原理,并且用到了哪些技术,只有完成了解原理,才能在出错的时候,快速定位,急速处理。

广告也精彩

访问一个网站的全过程

一、用户访问网站的基本流程(6个阶段)

DNS解析
tcp三次握手
http请求报文
网站集群内部处理数据的一个过程
http响应报文
tcp四次挥手断开的过程

二、下面我们就对这6个阶段一一解析:

DNS解析过程

1) DNS解析2种查询方式:递归查询->迭代查询(见上图DNS部分)

当用户在浏览器地址栏敲入域名地址回车后客户端首先检查本地DNS缓存和hosts文件,
如果是第一次访问的话,本地DNS缓存是没有缓存记录的,而hosts文件是用来做测试使用
的也是没有结果的,此时客户端会请求local DNS,local DNS是客户端在本地网卡中配置的
DNS服务器,local DNS首先会检测DNS缓存,DNS缓存中如果有结果,会将结果返回给客户端,
如果没有结果local DNS会负责域名解析,local DNS首先访问请求全球13台根服务器(据说美国有8台,日本2台,中国没有)根服务器会根据local DNS请求域名地址,
将此域名地址的顶级域名服务器返回给local DNS,local DNS在继续访问顶级域名服务器,顶级域名服务器根据local DNS请求的地址将此地址的二级域名服务器返回给local DNS,
local DNS又访问二级域名服务器,二级域名服务器我们又叫做授权DNS服务器,授权服务器检查自己的A记录将结果返回给local DNS,local DNS进行本地缓存并发给客户端。

三次握手原理

访问一个网站的全过程
2) 客户端接到结果后与服务端建立TCP三次握手连接

首先客户端发送syn seq序列给服务端,客户端从close的状态进入syn send状态,服务端接收到syn请求的时候,
从closed状态进入listen,服务端同时发送ack和syn请求,此时服务端从listen状态进入到syn received
客户端接收到ack确认和syn请求后进行返回ack确认,此时客户端进入establised状态,
服务端接收到ack确认也进入establised状态。

四次挥手原理


第一次就是主动端断开,发送FIN信号,变成FIN-WAIT-1状态; 第二次是被动方收到FIN信号,就变成CLOSE-WAIT状态,然后赶紧发送ACK信号给主动方确认,这是时候主动方变为FIN-WAIT-2状态; 第三次还是被动方等自己的应用断开连接的时候,发送FIN信号给主动方,被动方的状态变成LAST-ACK; 第四次是主动方收到被动方的FIN信号,然后发送的ACK信号,瞬间自己变成TIME-WAIT状态,然后等待回收。

《TCP连接11种状态详解》

访问一个网站的全过程

LISTEN: 侦听来自远方的TCP端口的连接请求
SYN-SENT: 再发送连接请求后等待匹配的连接请求
SYN-RECEIVED:再收到和发送一个连接请求后等待对方对连接请求的确认
ESTABLISHED: 代表一个打开的连接
FIN-WAIT-1: 等待远程TCP连接中断请求,或先前的连接中断请求的确认
FIN-WAIT-2: 从远程TCP等待连接中断请求
CLOSE-WAIT: 等待从本地用户发来的连接中断请求
CLOSING: 等待远程TCP对连接中断的确认
LAST-ACK: 等待原来的发向远程TCP的连接中断请求的确认
TIME-WAIT: 等待足够的时间以确保远程TCP接收到连接中断请求的确认
CLOSED: 没有任何连接状态

服务器产生大量 TIME_WAIT 案例

HTTP请求解释

3) 客户端发送http请求报文,http请求又分为四部分

第一部分:请求行

请求行又分为三块,第一块是请求方法,第二块是请求URL,第三块是请求的http协议版本,我们常用的方法有GET head POST等,
get就是用来客户端向服务端获取资料的时候就是使用get方式,
post是用来客户端向服务端注册一些信息等使用的是post方式,
而我们使用curl -I 是使用服务端的响应头部信息head。

第二部分:请求头部信息,包含媒体类型、语言类型、压缩方式、客户端类型主机名等

媒体类型包含image/gif、jpeg图片类型,音频类型,这些类型起初是为了解决邮件系统的传输搬移数据,现在广泛应用于http协议当中

第三部分是空行

空行表示请求头部与请求主体的分隔行

第四部分:请求主体

常用的get方式是没有请求主体的,post方式才有请求主体,
这个请求发送到服务端,

负载均衡

4) 《负载均衡》首先接收请求

负载均衡器:有软硬件2种
1)企业常用的有硬件F5;
2)软件应用层的nginx、haproxy 传输层的lvs等;
   然后负载均衡器会根据自己特殊的算法轮询阿,最小连接数将这些请求一一发送给web服务器,
到了web服务器,这些请求又分为动态请求和静态请求,静态请求一般就是静态页面一般是用html css xml等语言编写的网页,静态网页的特点性能高速度快,
在客户端的浏览器解析,不需要数据库的支持,容易被搜索引擎收录,缺点用户交互性比较差,不易于维护,常用的处理静态页面的软件有apache nginx等
国内最为主流的就是nginx,动态网页一般是与aspx php jsp等结尾的,动态网页的url中,会有一些特殊字符,像= &符号等,动态网页的特点,
与用户的交互性比较强,容易维护,但是在服务端进行解析,并不容易被搜索引擎收录,因此性能会比较差,
常用处理动态页面的软件有php引擎,tomcat resin等,php配合apache nginx使用,解析php编程语言开发的程序,
配合apache是以php模块的方式来进行对接,跟nginx是fastCGI守护进程来进行解析,还有一些tomcat resin这些是
解析java语言开发的程序,这些状态程序会请求一些结构化的数据,结构化的数据我们会存放在后端的数据库中,目前互联网最主流的关系型数据库就是mysql,
类似于二维表,但是性能会比较低,因此有些企业会使用memcached redis非关系型数据库进行做mysql的缓存数据库来提高访问速度,
还有一些非结构化的数据,像图片、视频、音频等这些数据我们会存放在存储服务器上,常用的存储服务器有nfs、mfs、glusterfs等,
这些非结构化的数据属于静态数据,很多公司会选择把这些静态数据推送到CDN节点上来提高用户的体验。

5) http响应报文又分为四部分
第一部分 响应起始行

起始行分为三块
第一块是http协议版本
第二块是状态码
第三块是状态码描述,一般我们常见的状态码像200正常,301永久跳转,302是临时跳转
"状态码详细介绍见下面链接"

状态码详细介绍
第二部分:响应头部信息

一般是在内容服务器的一些参数,比如说处理请求的是哪个软件

第三部分:响应空行

表示响应头部与主体的分隔行。

第四部分:响应主体

响应主体信息就是客户端真正在浏览器中的数据会在响应主体中返回给客户端。
此时客户端返回完之后:在常链接超时后

四次挥手原理

6) 客户端会进行tcp断开链接

首先客户端会发送FIN请求给服务端,此时客户端从established状态进入到FINWAIT-1状态,服务端接收到请求后从established状态进入closewait状态
服务端在进行ack确认,先返回给客户端,客户端进入finwait2状态,此时已经进入了一个半链接状态,所谓的半链接状态就是客户端向服务端发送数据完毕了,
但是服务端向客户端发送的数据还没有发送过来,当服务端向客户端发送完数据之后,继续发送fin请求,此时客户端接到fin请求进行返回ack确认,
此时客户端进入timewait状态,客户端接到ack,ack接着发送给服务端,此时服务端进入closed状态,断开链接。此时客户端会
等待2倍的MSL值。(2倍的MSL值就是linux的生存周期,2MSL值就是一般默认是30秒)就是1分钟后客户端会进入closed状态,就是从timewait状态自动进入closed状态。
"查看上面TCP11种状态中,包含三次握手和四次断开"

7) 通过上面的6步,用户基本就可以打开我的博客
如果还是存在问题,可以直接加我微信,或者留言,随时帮您解答问题,就算我目前无法处理,但我会利用身边一切资源,为您服务,如果此文对您有所帮助,请点赞,或打赏一下,抱拳了。

最后感谢,老男孩老师的指导。

  • QQ精品交流群
  • weinxin
  • 微信公众号
  • weinxin
广告也精彩
admin

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前评论:12   其中:访客  6   博主  6

    • avatar 嫡女 1

      牛b

      • avatar 婆婆家 1

        学习了 :oops:

        • avatar 巨幅震荡 0

          拜读感谢 :idea: :idea:

          • avatar 撕心 1

            我的网站每天初次访问的时候总是502错误,在刷新就好了,怎么回事,博主帮忙分一下,谢谢啦

              • avatar admin Admin

                @撕心 502报错有很多种情况,一般常见的是没有拿到后台反馈的数据,您可以加QQ讨论群,将日志上传到群,我会立刻为您解决。QQ:895107198

                • avatar admin Admin

                  @撕心 另外可以看下:LNMP运行原理(502/504报错举例) 这篇文章。

                • avatar 明快乐 1

                  细致

                  • avatar 请输入您的QQ号 0

                    其实中间还有更细的过程,根据TCP/IP模型,数据的封装与解封装过程

                      • avatar admin Admin

                        @请输入您的QQ号 确实,涉及OSI 7层模型和TCP/IP 4层模型以及socket 五元组信息,会在其它文章补充,感谢评论