第三方模块下载及requests和openpyxl模块使用

第三方模块的下载与使用
网络爬虫模块之requests模块
网络爬虫实战之爬取链家二手房数据
自动化办公领域之openpyxl模块

第三方模块的下载与使用

第三方模块：别人写的模块 一般情况下功能都特别强大
我们如果使用第三方模块 第一次必须先下载后面猜可以反复使用(等同于内置模块)

下载第三方模块的方式
    1.pip工具
        注意每个解释器都有pip工具 如果我们的电脑上有多个版本的解释器那么我们在使用pip的时候一定要注意到底用的是
        哪一个，否则极其容易出现使用的是A版本解释器然后用B版本的pip下载模块
        为了避免pip冲突 我们在使用的时候可以添加对应的版本号
        python27    pip2.7
        python36    pip3.6
        python38    pip3.8
        下载第三方模块的句式
            pip install 模块名
        下载第三方模块临时切换仓库
            pip install 模块名 -i 仓库地址
        下载第三方模块指定版本（不指定默认是最新版）
        pip install 模块名==版本号 -i 仓库地址
    2.pycharm提供快捷方式

"""
下载第三方模块可能会出现的问题
    1.报错并有警告信息
        WARNING: You are using pip version 20.2.1;
        原因在于pip版本过低 只需要拷贝后面的命令执行更新操作即可
        d:\python38\python.exe -m pip install --upgrade pip
        更新完成后再次执行下载第三方模块的命令即可
	2.报错并含有Timeout关键字
	    说明当前计算机网络不稳定 只需要更换网络或者重新执行几次即可
	3. 报错没有关键字
	    面向百度搜索：例如:pip下载xxx报错：拷贝错误信息
	    通常都是需要用户提前准备好一些一些环境才可以顺利下载，例如提前下载一些依赖包等
	4.下载速度很慢
	    pip默认下载的仓库地址是国外的 python.org
		我们可以切换下载的地址
		pip install 模块名 -i 仓库地址
		pip的仓库地址有很多 百度查询即可
		清华大学 ：https://pypi.tuna.tsinghua.edu.cn/simple/
		阿里云：http://mirrors.aliyun.com/pypi/simple/
		中国科学技术大学 ：http://pypi.mirrors.ustc.edu.cn/simple/
		华中科技大学：http://pypi.hustunique.com/
		豆瓣源：http://pypi.douban.com/simple/
		腾讯源：http://mirrors.cloud.tencent.com/pypi/simple
		华为镜像源：https://repo.huaweicloud.com/repository/pypi/simple/
"""

网络爬虫模块之requests模块

requests模块能够模拟浏览器发送网络请求

import requests

# 1.朝指定网址发送请求获取页面数据(等价于:浏览器地址栏输入网址回车访问)
res = requests.get('http://www.redbull.com.cn/about/branch')
print(res.content)  # 获取bytes类型的网页数据(二进制)
res.encoding = 'utf8'  # 指定编码
print(res.text)  # 获取字符串类型的网页数据(默认按照utf8)

网络爬虫实战之爬取链家二手房数据

import requests
import re

res = requests.get('https://sh.lianjia.com/ershoufang/pudong/')
# print(res.text)
data = res.text

home_title_list = re.findall(
    '<a class="" href=".*?" target="_blank" data-log_index=".*?"  data-el="ershoufang" data-housecode=".*?" data-is_focus="" data-sl="">(.*?)</a>',
    data)
# print(home_title_list)
home_name_list = re.findall('<a href=".*?" target="_blank" data-log_index=".*?" data-el="region">(.*?) </a>', data)
# print(home_name_list)
home_street_list = re.findall(
    '<div class="positionInfo"><span class="positionIcon"></span><a href=".*?" target="_blank" data-log_index=".*?" data-el="region">.*? </a>   -  <a href=".*?" target="_blank">(.*?)</a> </div>',
    data)
# print(home_street_list)
home_info_list = re.findall('<div class="houseInfo"><span class="houseIcon"></span>(.*?)</div>', data)
# print(home_info_list)
home_watch_list = re.findall('<div class="followInfo"><span class="starIcon"></span>(.*?)</div>', data)
# print(home_watch_list)
home_total_price_list = re.findall(
    '<div class="totalPrice totalPrice2"><i> </i><span class="">(.*?)</span><i>万</i></div>', data)
# print(home_total_price_list)
home_unit_price_list = re.findall(
    '<div class="unitPrice" data-hid=".*?" data-rid=".*?" data-price=".*?"><span>(.*?)</span></div>', data)
# print(home_unit_price_list)
home_data = zip(home_title_list, home_name_list, home_street_list, home_info_list, home_watch_list,
                home_total_price_list, home_unit_price_list)
with open(r'home_data.txt','w',encoding='utf8') as f:
    for data in home_data:
        print(
            """
            房屋标题:%s
            小区名称:%s
            街道名称:%s
            详细信息:%s
            关注程度:%s
            房屋总价:%s
            房屋单价:%s
            """%data
        )
        f.write("""
                房屋标题:%s
                小区名称:%s
                街道名称:%s
                详细信息:%s
                关注程度:%s
                房屋总价:%s
                房屋单价:%s\n
                """%data)

自动化办公领域之openpyxl模块

from openpyxl import Workbook
# 创建一个excel文件
wb = Workbook()
# 在一个excel文件内创建多个工作簿
wb1= wb.create_sheet('学生名单')
wb2= wb.create_sheet('舔狗名单')
wb3 = wb.create_sheet('海王名单')
# 还可以修改默认的工作簿位置
wb4 = wb.create_sheet('富婆名单',0)
# 还可以二次修改工作簿名称
wb4.title = '高富帅名单'
wb4.sheet_properties.tabColor="1072BA"

#填写数据的方式1
# wb4=['F4'] = 666
#填写数据方式2
# wb4.cell(row=3,column=1,value='jason')
#填写数据的方式3
wb4.append(['编号','姓名','年龄','爱好'])  # 表头字段
wb4.append([1,'jason',18,'read'])
wb4.append([2,'kevin',28,'music'])
wb4.append([3,'tony',38,'play'])
wb4.append([4,'oscar',48,'ball'])
wb4.append([5,'jerry','read'])
wb4.append([6,'tom',68,'read','heihei'])

# 填写数学公式
# wb4.cell(row=1, column=1, value=12321)
# wb4.cell(row=2, column=1, value=3424)
# wb4.cell(row=3, column=1, value=23423432)
# wb4.cell(row=4, column=1, value=2332)
# wb4['A5'] = '=sum(A1:A4)'
# wb4.cell(row=8, column=3, value='=sum(A1:A4)')

wb.save(r'111.xlsx')

"""
openpyxl主要用于数据的写入 至于后续的表单操作它并不是很擅长 如果想做需要更高级的模块pandas

import pandas

data_dict = {
    "公司名称": comp_title_list,
    "公司地址": comp_address_list,
    "公司邮编": comp_email_list,
    "公司电话": comp_phone_list
}
# 将字典转换成pandas里面的DataFrame数据结构
df = pandas.DataFrame(data_dict)
# 直接保存成excel文件
df.to_excel(r'pd_comp_info.xlsx')



excel软件正常可以打开操作的数据集在10万左右 一旦数据集过大 软件操作几乎无效
需要使用代码操作>>>:pandas模块
"""

原文地址：http://www.cnblogs.com/winter-yu1989/p/16829847.html

1. 本站所有资源来源于用户上传和网络，如有侵权请邮件联系站长！ 2. 分享目的仅供大家学习和交流，请务用于商业用途! 3. 如果你也有好源码或者教程，可以到用户中心发布，分享有积分奖励和额外收入！ 4. 本站提供的源码、模板、插件等等其他资源，都不包含技术服务请大家谅解！ 5. 如有链接无法下载、失效或广告，请联系管理员处理！ 6. 本站资源售价只是赞助，收取费用仅维持本站的日常运营所需！ 7. 如遇到加密压缩包，默认解压密码为"gltf",如遇到无法解压的请联系管理员！ 8. 因为资源和程序源码均为可复制品，所以不支持任何理由的退款兑现，请斟酌后支付下载声明：如果标题没有注明"已测试"或者"测试可用"等字样的资源源码均未经过站长测试.特别注意没有标注的源码不保证任何可用性

第三方模块下载及requests和openpyxl模块使用

第三方模块的下载与使用

网络爬虫模块之requests模块

网络爬虫实战之爬取链家二手房数据

自动化办公领域之openpyxl模块

排行榜展示

3D打印机glb模型下载-机械glb模型

树glb模型下载-树2

水稻glb模型下载-水稻1

变电箱1glb模型下载-机械glb模型

树glb模型下载-树3

模型

3D打印机glb模型下载-机械glb模型

水稻glb模型下载-水稻1

树glb模型下载-树2

树glb模型下载-树3

树glb模型下载-树1

变电箱1glb模型下载-机械glb模型

第三方模块下载及requests和openpyxl模块使用

第三方模块的下载与使用

网络爬虫模块之requests模块

网络爬虫实战之爬取链家二手房数据

自动化办公领域之openpyxl模块

排行榜展示

标签

模型