
requests抓取网站页面中的链接
- Python爬虫 - 阅 2引入request库和BeautifulSoup import requestsfrom bs4 import BeautifulSoup BeautifulSoup 负责处理抓到的文本和提取标签值 直接抓取: url = input('请输入您的url')res = requests.get(url) 提取链接值,并保存到列表中: global NUM_COUNTNUM_COUNT = …


修改docx文档的文字工具免费下载使用
- Python办公,python软件 - 阅 3免费下载免费使用,有问题大家留言 python实现修改docx文档的文字工具 用到的库有docx,tkinter,os,shutil tkinter的grid布局, docx实现替换字符串,没有忽略格式,有bug请在下面留言,谢谢! 下载地址:点击下载 软件是用pyinstaller打包成exe的。 …

tkinter中menu的用法简单示例
- python基础,python软件 - 阅 2python界面库tkinter中的menu组件,如何创建父菜单子下拉子菜单,以及如何获取菜单的label属性值: 首先安装tkinter库,并引入: import tkinter as tk 创建父菜单,然后把子菜单放进去: # 新建一个顶级menumenuTop = tk.Menu(root)menuSun = tk.Menu(menuTop, tea…

python库zipfile解压zip文件如何实现
- Python办公,python软件 - 阅 30用python实现解压一个zip文件到指定文件夹,使用zipfile库来实现,文件必须是zip格式的: 首先要引入os,zipfile两个包: import zipfileimport osfrom shutil import * 新建一个解压函数来实现解压的操作: def unzipFile(oriPath,goalPath): ''' 解决解压zip…

Python批量生成word文档python-docx
- Python办公 - 阅 75Python通过python-docx库能快速的创建同一个模板的大批量文件word文档,批量生成word文档能节约大量的时间和繁琐的工作量 首先需要安装python-docx 本文以一个公司调价通知为例,代码如下: from docx import Documentfrom docx.enum.text import WD_PARAGRAPH_ALI…

Python替换txt中字符串的代码
- Python办公 - 阅 46如何用python代码执行替换指定txt中的某个指定字符串呢?经常有用到txt中的文字需要全部改动的情况,可以用文本文字替换执行(一个一个手动来做),其实也可以用python来做(可以改成批量操作的),本文分享一个替换单个txt文件中文字的demo 代码如下: import os def …

Python把做好的python项目打包成exe的方法py2exe
- python软件 - 阅 59首先安装一下py2exe这个库,用pychram新建一个新项目,直接点开setting-project:python interpreter,拉开后在上面搜索py2exe,找到后直接点击install,截图如下 安装成功后我们可以随意写一个python执行文件,这里我们就做个输出命名为h2b.py(代码中的import os,os.syste…

Python扫描网站目录简单测试
- Python爬虫 - 阅 79新手尝试用Python写一个简单扫描网站的目录的脚本,扫出来的页面不是404的就把目录名称保存到txt中,404页面直接丢弃,就是不存在的,如果有防火墙,会出现很多误报的情况,或者直接卡死,大家再看着优化处理吧,简单代码如下: import requests import time def getstatus(…

python抓取js渲染的网页内容
- Python爬虫 - 阅 2经常看到一些网站,它的内容在直接查看源代码的里面是没有要爬的内容的,都是一些js代码,用javascript输出的。用requests的get方法,爬不到里面的内容。 这里介绍一种使用Selenium来实现。Selenium是用来实现动态渲染页面爬取的。 首先要做下准备工作: 在chrome使用命令…

抓取gbk网站,解决Python爬虫中文乱码
- Python爬虫 - 阅 2乱码问题是很常见的一种事情,记录一下解决python爬虫中的乱码问题 在相应的文本位置加入encode('ISO-8859-1')

Python中的sleep函数
- python基础 - 阅 1python执行延时操作, 本文用sleep实现: 引入time库 # 例1:输出休眠5秒import time 输出: i = 3print(i) # 输出ii += 1time.sleep(5) # 休眠1秒print(i)

soup.find_all()用法介绍
- Python爬虫 - 阅 1Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库。它通过转换器实现文档导航,查找,修改文档的方式。 soup.find_all()用法 1.查找标签 soup.find_all('tag') 2.查找文本 soup.find_all(text='text') 3.根据id查找 soup.find_all(id='tag id'…

Python 保留字符
- python基础 - 阅 0下面的列表显示了在Python中的保留字。这些保留字不能用作常数或变数,或任何其他标识符名称。 所有 Python 的关键字只包含小写字母。 andexecnotassertfinallyorbreakforpassclassfromprintcontinueglobalraisedefifreturndelimporttryelifinwhileelseiswithexceptlambda…

Python 标识符有哪些?
- python基础 - 阅 1在 Python 里,标识符由字母、数字、下划线组成。 在 Python 中,所有标识符可以包括英文、数字以及下划线(_),但不能以数字开头。 Python 中的标识符是区分大小写的。 以下划线开头的标识符是有特殊意义的。以单下划线开头 _foo 的代表不能直接访问的类属性,需通过类…

python去掉html中的a标签
- python软件 - 阅 0python使用BeautifulSoup清除抓到的html中的a链接标签: 关键代码: info = [s.extract() for s in soup('a')] 运行结果: 完整示例代码: #!/usr/bin/python # -*- coding: UTF-8 -*- from bs4 import BeautifulSoup soup = BeautifulSoup('<html><…

Python2.x 中使用 Python3.x 的 print 函数
- python基础 - 阅 0如果 Python2.x 版本想使用使用 Python3.x 的 print 函数,可以导入 __future__ 包,该包禁用 Python2.x 的 print 语句,采用 Python3.x 的 print 函数: 实例 >>> list =["a", "b", "c"]>>> print list …

