模拟浏览器请求Python结合html基本格式

用Python模拟一个客户端，结合打开一个HTML页面

创建客户端

#!/usr/bin/env python

# -*- coding:utf8 -*-

import socket #导入单线程通讯模块

def handle_request(client):

    buf = client.recv(1024)

    client.sendall(bytes("HTTP/1.1 201 OK\r\n\r\n","utf8")) #向客户端发送内容，以字节形式发送

    f = open("1.html", "r", encoding="utf-8")   #打开HTML文件

    f2 = f.read()   #读出HTML文件内容

    f.close()   #关闭打开的文件

    client.sendall(bytes(f2,"utf8")) #将读出HTML文件内容向客户端发送内容，以字节形式发送

def main():

    sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)     #创建服务端通讯对象

    sock.bind(('localhost',8082))   #在服务端设置服务端ip和端口8

    sock.listen(5)      #监听IP和端口，设置一个参数，表示最多连接排队数量

    while True:

        connection, address = sock.accept()     #等待接收客户端的请求，一旦有客户端请求连接，就会返回两个值，一个是连接对象，一个是客户端的地址信息，所以需要两个变量来接收

        handle_request(connection)  #执行handle_request函数，将客户端请求连接传入handle_request函数

        connection.close()  #关闭连接

if __name__ == '__main__':  #wds系统下if __name__ == "__main__"才能创建进程，我们调试没关系，以后在Linux系统没这个问题

    main() #执行main函数

HTML页面

将HTML页面放入客服端相同的目录里

<!DOCTYPE html>

<html lang="en">

<head>

    <meta charset="UTF-8">

    <title>Title</title>

</head>

<body>

<h1>你好</h1>

</body>

</html>

启动客户端后在浏览器输入http://127.0.0.1:8082/ 可以看到以下结果

你好

下面我们开始讲HTML知识

HTML基本格式

<!DOCTYPE html>                     //文档类型声明

<html lang="zh-cn">                 //表示HTML文档开始，属性lang,属性值=zh-cn（声明中文网页的意思）

<head>                              //包含文档元素开始

    <meta charset="UTF-8">          //声明字符编码

    <title>标题</title>             //设置文档标题

</head>                             //包含文档元素结束

<body>                              //表示HTML内容开始

</body>                             //表示HTML内容结束

</html>                             //表示HTML文档结束

<!DOCTYPE html>
它主要告诉浏览器所查看的文件类型，表示为HTML文档类型

<html lang="zh-cn"></html>
HTML元素是文档开始和结尾的元素，它是一个双标签，包含内容，这个元素有一个属性和属性值，lang="zh-cn"，表示文档语言为：简体中文，如果是英文网页为lang="en"

<head> </head>
用来包含元数据内容，元数据内容包括：<link>、<meta>、<noscript>、<scripy>、<style>、<title>,这些内容用来向浏览器提供信息，比如link提供css信息，这些类型都是页面不可见的

<meta>
这个元素可以用来设置字符编码，告诉浏览器页面采用什么编码，除了设置编码还有别的

<title></title>
这个元素是设置页面的标题的，标题会显示到浏览器上部，也会被搜索引擎识别

<body> </body>
用来包含文档内容的元素，也就是浏览器可见部分，所有的可见部分都应该写在这里

第五十九节，模拟浏览器请求Python结合html基本格式的更多相关文章

第三百五十九节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)介绍以及安装
第三百五十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)介绍以及安装 elasticsearch(搜索引擎)介绍 ElasticSearch是一个基于 ...
第一百五十九节，封装库--JavaScript，表单序列化结合ajax提交数据
封装库--JavaScript,表单序列化结合ajax提交数据封装库,表单序列化方法 /** xu_lie_biao_dan()方法,表单序列化方法,将自动获取指定表单里面的各项字段name值和va ...
第四十节，requests模拟浏览器请求模块初识
requests模拟浏览器请求模块初识 requests模拟浏览器请求模块属于第三方模块源码下载地址http://docs.python-requests.org/zh_CN/latest/use ...
第三百八十九节，Django+Xadmin打造上线标准的在线教育平台—列表筛选结合分页
第三百八十九节,Django+Xadmin打造上线标准的在线教育平台—列表筛选结合分页根据用户的筛选条件来结合分页实现原理就是,当用户点击一个筛选条件时,通过get请求方式传参将筛选的id或者值, ...
第三百六十九节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索功能
第三百六十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索功能 Django实现搜索功能 1.在Django配置搜索结果页的路由映 ...
第三百二十九节，web爬虫讲解2—urllib库爬虫—ip代理—用户代理和ip代理结合应用
第三百二十九节,web爬虫讲解2—urllib库爬虫—ip代理使用IP代理 ProxyHandler()格式化IP,第一个参数,请求目标可能是http或者https,对应设置build_opener ...
requests模拟浏览器请求模块初识
requests模拟浏览器请求模块初识一.下载 requests模拟浏览器请求模块属于第三方模块源码下载地址http://docs.python-requests.org/zh_CN/lates ...
第三百四十九节，Python分布式爬虫打造搜索引擎Scrapy精讲—cookie禁用、自动限速、自定义spider的settings，对抗反爬机制
第三百四十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—cookie禁用.自动限速.自定义spider的settings,对抗反爬机制 cookie禁用就是在Scrapy的配置文件set ...
第三百一十九节，Django框架，文件上传
第三百一十九节,Django框架,文件上传 1.自定义上传[推荐] 请求对象.FILES.get()获取上传文件的对象上传对象.name获取上传文件名称上传对象.chunks()获取上传数据包,字节码 ...

随机推荐

Python~切片Slice
[:] [:10] [-10:] [':10:2]
codeforces 734E（DFS,树的直径（最长路））
题目链接:http://codeforces.com/contest/734/problem/E 题意:有一棵黑白树,每次操作可以使一个同色连通块变色,问最少几次操作能使树变成全黑或全白. 思路:先进 ...
javascript百度地图添加一个普通标注点（2014-3-8 记）
1.导入jquery.js文件:<script type="text/javascript" src="js/jquery.js"></scr ...
Dean Edwards大神写的addEvent库
直接晒代码: // written by Dean Edwards, 2005 // with input from Tino Zijdel, Matthias Miller, Diego Perin ...
如何禁止DELETE、PUT、OPTIONS、TRACE、HEAD等协议访问应用程序 &period;
原文:http://linder.iteye.com/blog/735435 简介 WebDAV (Web-based Distributed Authoring and Versioning)是 ...
SCRUM，一个采用迭代，增量方法来优化可预见控制风险
Scrum是一个用于开发和维持复杂产品的框架,是一个增量的,迭代的开发过程.在这个框架中,整个开发过程是由若干个短的迭代周期组成,一个短的迭代周期称为一个Sprint,每个Sprint的建议长度是2到 ...
CentOS使用ufw的方法
ufwはファイアウォールの管理ツールで.Ubuntuで標準的に使われています.ufw allow 80/tcp のような簡単なコマンドでポートを開け閉めできます. CentOS用のパッケージは用意され ...
查看oracle数据库的大小和空间使用情况
查看oracle数据库的大小和空间使用情况 (2012-06-19 14:44:30) 转载▼ 标签: 杂谈分类: oracle 1.查看表空间的使用状况 SELECT upper(f.tables ...
Java初学者应该注意的学习问题
作为初学者,在刚开始学习的时候,一定会走很多弯路.但其实很多弯路是不必走的,会浪费很多时间,导致学习效率大打折扣.今天小编给大家讲述一下,作为一个Java初学者,在开始学习的时候应该注意的问题,应该从 ...
ES6知识整理（9）--class的基本语法
(总结完知识点,出去滑板刷街) promise的catch 上一节promise中漏了一个知识点: promise对象可以使用catch来避免每个then中都加error判断,让错误时都进到catch ...