HTTP协议详解-程序员宅基地

技术标签: Web开发  java  网络  http  


提示:以下是本篇文章正文内容,Java系列学习将会持续更新

一、HTTP工作过程

HTTP (全称为 “超文本传输协议”) 是一种应用非常广泛的应用层协议。

1.基于某个特定的传输层协议(TCP)之上
2.描述业务
3.非OS系统

当我们在浏览器中输入一个 “网址”, 此时浏览器就会给对应的服务器发送一个 HTTP 请求. 对方服务器收到这个请求之后, 经过计算处理, 就会返回一个 HTTP 响应。
在这里插入图片描述
事实上, 当我们访问一个网站的时候, 可能涉及不止一次的 HTTP 请求/响应 的交互过程。

回到目录…

二、HTTP 协议格式

请添加图片描述
注意: 为什么 HTTP 报文中要存在空行呢?

  • 因为 HTTP 协议并没有规定报头部分的键值对有多少个,使用空行就相当于是报文的结束标记或报文和正文之间的分隔符
  • HTTP 在传输层依赖 TCP 协议,TCP 是面向字节流的。如果没有这个空行,就会出现”粘包问题“

回到目录…

2-1 请求(Request)格式

在这里插入图片描述

2-1-1 URL格式

URL (Uniform Resource Locator 统一资源定位符),互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。
请添加图片描述
URL的具体格式:

  1. 资源在哪台主机上——域名 (domain) 或者ip来体现一主机 (host)
  2. 和主机上的哪个进程去获取资源——端口 (port)
  3. 具体定位到是该进程管理的哪个资源——资源路径/路径 (path)
  4. URL设计之处,不仅仅为HTTP协议使用。所以需要标识出本次资源对应的协议(protocol / schema)
  5. 针对本次请求,除了资源本身之外的特殊要求。(查询字符串 query string、文档片段 fragment)

回到目录…

2-1-2 方法(method)

方法 说明 适用版本号
GET 获取资源 HTTP 1.0、HTTP 1.1
POST 传输实体主体 HTTP 1.0、HTTP 1.1
PUT 传输文件 HTTP 1.0、HTTP 1.1
HEAD 获得报文首部 HTTP 1.0、HTTP 1.1
DELETE 删除文件 HTTP 1.0、HTTP 1.1
OPTIONS 访问支持的方法 HTTP 1.1
TRACE 追踪路径 HTTP 1.1
CONNECT 要求用隧道协议连接代理 HTTP 1.1
LINK 建立和资源之间的联系 HTTP 1.1
UNLINE 断开连接关系 HTTP 1.1
2-1-2-1 GET 方法

GET 是最常用的 HTTP 方法,常用于获取服务器上的某个资源。

GET 请求的特点:

  • 首行里面的第一个部分就是 GET
  • URL 里面的 query string 可以为空,也可以不为空 %E8%9B%8B%E7%B3%95
  • GET 请求的 header 有若干个键值对结构
  • GET 请求的 body 一般是空的

GET 请求示例: 搜狗首页请求
在这里插入图片描述

2-1-2-2 POST 方法

POST 方法也是一种常见的方法,多用于提交用户输入的数据给服务器(如登录页面)。

POST 请求的特点:

  • 首行第一个部分就是 POST
  • URL 里面的 query string 一般是空的
  • POST 请求的 header 里面有若干个键值对
  • POST 请求的 body 一般不为空(body 的具体数据格式,由 header 中的 Content-Type 来描述; body 的具体数据长度,由 header 中的 Content-Length 来描述

POST 请求示例: QQ 邮箱登录请求
在这里插入图片描述
回到目录…

2-1-2-3 GET vs POST

我们平时构建发送的 GET/POST请求:

请求方法 构建方式
GET 1.地址栏输入url回车
2. 通过一些标签<img>;、<script><link>
3.还有一些标签<a><form>
4. ajax
5. 重定向(redirect)
POST 1. <form method="post">
2. ajax
3. 重定向(redirect)

面试题:GET 和 POST 的区别

  • GET 和 POST 其实没有本质区别,使用 GET 的场景完全可以使用 POST 代替,使用 POST 的场景一样可以使用 GET 代替。但是在具体的使用上,还是存在一些细节的区别

  • GET 习惯上会把客户端的数据通过 query string 来传输(body 部分是空的);POST 习惯上会把客户端的数据通过 body 来传输(query string 部分是空的)

  • GET 习惯上用于从服务器获取数据;POST 习惯上是客户端给服务器提交数据

  • 一般情况,程序员会把 GET 请求的处理,实现成“幂等”的;对于 POST 请求的处理,不要求实现成“幂等”

  • GET 请求可以被缓存,可以被浏览器保存到收藏夹中;POST 请求不能被缓存

回到目录…

2-1-3 协议头(header)

header 的整体格式是键值对结构,每个键值对占一行,键和值之间使用 冒号+空格 进行分割

key value
Host 表示服务器主机的地址和端口
Content-Length 表示 body 的数据长度,长度单位是字节
Content-Type 表示 body 的数据格式
User-Agent 表示浏览器或者操作系统的属性
Referer 表示这个页面是从哪个页面跳转过来的
Cookie 是浏览器提供的一种让程序员在本地存储数据的能力

Content-Type 有以下三种请求中的数据格式:

  • application/x-www-form-urlencoded

这是 form 表单提交的数据格式,此时 body 的格式就类似于 query string(是键值对的结构,键值对之间使用 & 分割,键与值之间使用 = 分割

  • multipart/form-data

这是 form 表单提交的数据格式(需要在 from 标签上加上 enctyped="multipart/form-data"),通常用于 HTML 提交图片或者文件

  • application/json

此时 body 数据为 json 格式,json 格式就是源自 js 的对象的格式。用一个 { } 括住,里面有多个键值对,键值对之间使用逗号分割,键和值之间使用冒号分割

回到目录…

2-2 响应(Response)格式

在这里插入图片描述

2-2-1 状态码

常见的状态码

常见状态码 说明
200 OK 这是一个最常见的状态码, 表示访问成功。抓包抓到的大部分结果都是 200
404 Not Found 没有找到资源。URL 标识的资源不存在, 那么就会出现 404
403 Forbidden 表示访问被拒绝。有的页面通常需要用户具有一定的权限才能访问(登陆后才能访问).。如果用户没有登陆直接访问, 就容易见到 403
405 Method Not Allowed 我们学习了 HTTP 中所支持的方法, 有 GET, POST, PUT, DELETE 等。但是对方的服务器不一定都支持所有的方法(或者不允许用户使用一些其他的方法).
500 Internal Server Error 服务器出现内部错误. 一般是服务器的代码执行过程中遇到了一些特殊情况(服务器异常崩溃)会产生这个状态码,一般很少见
504 Gateway Timeout 当服务器负载比较大的时候, 服务器处理单条请求的时候消耗的时间就会很长, 就可能会导致出现超时的情况
302 Move temporarily 临时重定向。在登陆页面中经常会见到 302. 用于实现登陆成功后自动跳转到主页
301 Moved Permanently 永久重定向。当浏览器收到这种响应时, 后续的请求都会被自动改成新的地址。301 也是通过 Location 字段来表示要重定向到的新地址

总结

类别 原因短语
1XX Informational (信息性状态码) 接受的请求正在处理
2XX Success (成功状态码) 请求正常处理完毕
3XX Redirection (重定向状态码) 需要进行附加操作以完成请求
4XX Client Error (客户端错误状态码) 服务器无法处理请求
5XX Server Error (服务器错误状态码) 服务器处理请求出错

回到目录…

2-2-2 协议头(header)

响应报头的基本格式和请求报头的格式基本一致。

下面介绍下响应报头的 Content-Type 参数

  • text/html

表示数据格式是 HTML

  • text/css

表示数据格式是 CSS

  • application/javascript

表示数据各式是 JavaScript

  • application/json

表示数据格式是 JSON

回到目录…

三、手写HTTP

3-1 HTTP客户端

import java.io.*;
import java.net.Socket;
// HTTP 客户端
public class HTTPClient {
    
    public static void main(String[] args) throws IOException {
    
        // 1. HTTP 客户端,要发送 HTTP 请求,先建立 TCP 连接
        // 我们当前进程和www.baidu.com主机上绑定 8080 端口的进程使用 TCP 通信(要求 建立 TCP 连接)
        Socket socket = new Socket("localhost", 80);

        OutputStream os = socket.getOutputStream();
        PrintWriter writer = new PrintWriter(new OutputStreamWriter(os, "UTF-8"));

        // 只有请求行,请求头为空,没有请求体
        String request = "GET / HTTP/1.0\r\n\r\n";
        writer.print(request);
        // 冲刷缓冲区
        writer.flush();

        // 读取百度返回的 HTTP 响应
        InputStream is = socket.getInputStream();
        byte[] buf = new byte[10240];    // 我们知道响应不会超过 1024 字节的
        int n = is.read(buf);
        String response = new String(buf, 0, n, "UTF-8");
        System.out.println(response);
    }
}

3-2 HTTP服务端

import java.io.IOException;
import java.io.OutputStream;
import java.io.OutputStreamWriter;
import java.io.PrintWriter;
import java.net.ServerSocket;
import java.net.Socket;
// HTTP 服务端
public class HTTPServer {
    
    public static void main(String[] args) throws IOException {
    
        // 我们使用短连接
        ServerSocket serverSocket = new ServerSocket(80);
        while (true) {
    
            try {
    
                Socket socket = serverSocket.accept();
                // 不管对方发给我们的 请求 是什么,一律使用统一的响应回复对方
                OutputStream os = socket.getOutputStream();
                PrintWriter writer = new PrintWriter(new OutputStreamWriter(os, "UTF-8"));
                String html = "<a href='https://www.baidu.com/'>百度一下</a>";   // 我们的响应体
                byte[] bytes = html.getBytes("UTF-8");
                int contentLength = bytes.length;
                String response = "HTTP/1.0 200 OK\r\n" +
                        "Content-Type: application/octet-stream; charset=utf-8\r\n" +
                        "Content-Length: 49\r\n" +
                        "\r\n" +
                        html;

                writer.print(response);
                writer.flush();

                socket.close();
            } catch (IOException exc) {
    
                exc.printStackTrace();
            }
        }
    }
}

回到目录…


总结:
提示:这里对文章进行总结:
以上就是今天的学习内容,本文是HTTP协议的学习,了解HTTP协议的工作过程,HTTP的请求和响应格式,以及如何手写HTTP服务器。之后的学习内容将持续更新!!!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq15035899256/article/details/126103840

智能推荐

XML文档存取技术(DOM, SAX)(转)_xml存取-程序员宅基地

文章浏览阅读924次。为什么SAX|DOM同时存在?--------------------------------------------------------------------------------SAX (Simple API for XML) 和 DOM (Document Object Model) 都是为了让程序员不用写一个解析器就可以访问他们的资料信息。通过利用XML 1.0格式保存信息,以及使_xml存取

线程数设置多少合适-程序员宅基地

文章浏览阅读4.2k次,点赞9次,收藏37次。线程数设置多少合适为什么要使用多线程使用多线程本质上是提升性能,性能可能直接理解为快!快就完事了,但是这样的说法太笼统,那应该如何度量性能呢?度量性能最常用的指标为吞吐量和延迟,延迟指一个请求从发送到收到响应这个过程的时间,延迟越短意味着程序处理得越快,性能就越好,而吞吐量指的是单位时间内能处理的请求数量,吞吐量越大表示性能越好,但是需要注意的是这两个指标属于不同维度(延迟是时间维度,吞吐量是空间维度)并不能互换。所以使用多线程的目的就是降低延迟、提升吞吐量,那多线程如何去做呢?这就要从多线_线程数设置多少合适

configure时,Cannot find install-sh, install.sh, or shtool in ac-aux解决办法_centos报错configure: error: cannot find install-sh, -程序员宅基地

文章浏览阅读7.5k次,点赞3次,收藏3次。在集群上面安装软件,./configure报错如下:Cannot find install-sh, install.sh, or shtool in ac-aux解决方法:执行如下操作(Ubuntu)sudo apt-get install automake autoconf libtool./configure, make all, make install或者,加$ autor..._centos报错configure: error: cannot find install-sh, install.sh, or shtool in

数字工业 弹性安全丨2022 Fortinet工业互联网安全发展峰会成功举办_2022全球工控安全解决方案-程序员宅基地

文章浏览阅读128次。汇集了来自中国工业互联网行业的专家、IT商业领袖以及第三方研究机构,深度探讨在新的数字工业OT安全常态下的行业趋势洞察、前沿技术探索、弹性安全策略以及最佳实践分享。_2022全球工控安全解决方案

一次php访问sql server 2008的API接口的采坑-程序员宅基地

文章浏览阅读280次。2018年6月21日17:17:09,注意:不是详细文档,新手可能会看不懂windows下安装项目是sql server 2008的k3,php连接数据库写的API,因为是买的时候是别人的程序,测试环境用的windows 2008,首先需要需要下载对应的php版本的DLL和驱动,好多人只下载的DLL,但是没有ODBC安装驱动,还得根据版本下载,https://docs.microsof..._sql2008api接口

flutter boost_flutter_boost 性能-程序员宅基地

文章浏览阅读4.9k次。# 第二章、构建基于flutter的混合应用## 2.2常见的原生解决方案##### 2.2.1 flutter boost演进''0.0 双引擎利用AB两个引擎,对界面进行预加载解决flutterVC切换时,加载时间长的问题1.0 共享视图将页面通过key:value的形式进行存储,减少放回页面时的视图构建时间内存只存两个截图,其余存磁盘解决平级flutterVC页面切换,(会被栈顶丢出去)状态丢失的问题2.0 共享引擎将VC与引擎相关联,使flutterVC与app生命周期捆_flutter_boost 性能

随便推点

mysql8.0出现启动失败Can‘t connect to server on ‘127.0.0.1‘ (10061)问题轻松解决_can't connect to mysql server on '127.0.0.1-程序员宅基地

文章浏览阅读3.1k次。1.进入mysql所在目录删除data文件,原因是在mysql5.7以上版本中没有一个data目录,即没有初始化服务。所以需要先初始化mysql才可以启动服务,否则会报 “服务没有报告任何错误”,启动失败。我出现的问题:如果启动服务失败,则很有可能就是这个data文件夹有问题。2.使用初始化mysql命令。3.启动mysql服务。_can't connect to mysql server on '127.0.0.1

MFC多线程各种线程用法_mfc单文档多线程-程序员宅基地

文章浏览阅读136次。一、目的1、二、参考1、MFC多线程各种线程用法https://blog.csdn.net/weixin_41931548/article/details/80802340①总结:带查看三、操作1、_mfc单文档多线程

C++智能指针4——唯一指针unique_ptr详解-程序员宅基地

文章浏览阅读6.4k次。C++11标准库提供的唯一指针unique_ptr有助于避免发生异常时的资源泄漏。它实现了专有所有权的概念,这意味着它可以确保一个对象及其关联资源一次只能由一个指针"拥有''。当此所有者被销毁或变空或开始拥有另一个对象时,先前拥有的对象也将被销毁,所有相关资源都将被释放。唯一指针unique_ptr继承了自动指针auto_ptr(该类最初是C++ 98引入的,但现在已弃用)。 唯一指针unique_ptr提供了一个简单明了的接口,与自动指针auto_ptr相比,它更不容易出错。_unique_ptr

Playrix Codescapes Cup (Codeforces Round #413, rated, Div. 1 + Div. 2) C. Fountains 【树状数组维护区间最大值】...-程序员宅基地

文章浏览阅读105次。题目传送门:http://codeforces.com/contest/799/problem/CC. Fountainstime limit per test2 secondsmemory limit per test256 megabytesinputstandard inputoutputstandard outputArkady plays ..._playrix codescapes cup (codeforces round #413, rated, div. 1 + div. 2) e

解决MySQL数据库导入SQL报错 Unknown collation: ‘utf8mb4_0900_ai_ci‘问题-程序员宅基地

文章浏览阅读1.9k次。ERROR 1273 (HY000) at line 78: Unknown collation: 'utf8mb4_0900_ai_ci'

js中日期转字符串,字符串转日期,日期的用法_js日期转字符串年月日-程序员宅基地

文章浏览阅读683次。目录创建日期指定月最后一天当day为负数的时候,就表示的是指定月的最后一天的向前偏移量。当前日期加一天日期转字符串字符串转日期创建日期new Date(year, month, day)然后简单使用一下Date对象提供的构造函数。var newDate = new Date(2019, 10, 9).Format('yyyy-MM-dd'); // 2019-09-09指定月最后一天当day为0的时候,就表示的是指定月的最后一天。var new._js日期转字符串年月日

推荐文章

热门文章

相关标签