0

requests抓取网站页面中的链接

- Python爬虫 - 阅 2

引入request库和BeautifulSoup import requestsfrom bs4 import BeautifulSoup BeautifulSoup 负责处理抓到的文本和提取标签值 直接抓取: url = input('请输入您的url')res = requests.get(url) 提取链接值,并保存到列表中: global NUM_COUNTNUM_COUNT = …

0

Python是啥?

- python基础 - 阅 2

人生苦短,我用python!!! Python是一个通用的,动态的,面向对象的编程语言。 Python语言的设计目的强调程序员的生产率和代码可读性。Python最初是由Guido van Rossum在1991首次发布。Python的灵感来自于ABC,Haskell,java,Lisp,图标,和Perl编程语言。 Python是一…

0

修改docx文档的文字工具免费下载使用

- Python办公,python软件 - 阅 3

免费下载免费使用,有问题大家留言 python实现修改docx文档的文字工具 用到的库有docx,tkinter,os,shutil tkinter的grid布局, docx实现替换字符串,没有忽略格式,有bug请在下面留言,谢谢! 下载地址:点击下载 软件是用pyinstaller打包成exe的。 …

0

tkinter中menu的用法简单示例

- python基础,python软件 - 阅 2

python界面库tkinter中的menu组件,如何创建父菜单子下拉子菜单,以及如何获取菜单的label属性值: 首先安装tkinter库,并引入: import tkinter as tk 创建父菜单,然后把子菜单放进去: # 新建一个顶级menumenuTop = tk.Menu(root)menuSun = tk.Menu(menuTop, tea…

0

python库zipfile解压zip文件如何实现

- Python办公,python软件 - 阅 30

用python实现解压一个zip文件到指定文件夹,使用zipfile库来实现,文件必须是zip格式的: 首先要引入os,zipfile两个包: import zipfileimport osfrom shutil import * 新建一个解压函数来实现解压的操作: def unzipFile(oriPath,goalPath): ''' 解决解压zip…

0

Python批量生成word文档python-docx

- Python办公 - 阅 75

Python通过python-docx库能快速的创建同一个模板的大批量文件word文档,批量生成word文档能节约大量的时间和繁琐的工作量 首先需要安装python-docx 本文以一个公司调价通知为例,代码如下: from docx import Documentfrom docx.enum.text import WD_PARAGRAPH_ALI…

0

Python替换txt中字符串的代码

- Python办公 - 阅 46

如何用python代码执行替换指定txt中的某个指定字符串呢?经常有用到txt中的文字需要全部改动的情况,可以用文本文字替换执行(一个一个手动来做),其实也可以用python来做(可以改成批量操作的),本文分享一个替换单个txt文件中文字的demo 代码如下: import os def …

0

Python把做好的python项目打包成exe的方法py2exe

- python软件 - 阅 59

首先安装一下py2exe这个库,用pychram新建一个新项目,直接点开setting-project:python interpreter,拉开后在上面搜索py2exe,找到后直接点击install,截图如下 安装成功后我们可以随意写一个python执行文件,这里我们就做个输出命名为h2b.py(代码中的import os,os.syste…

0

Python扫描网站目录简单测试

- Python爬虫 - 阅 79

新手尝试用Python写一个简单扫描网站的目录的脚本,扫出来的页面不是404的就把目录名称保存到txt中,404页面直接丢弃,就是不存在的,如果有防火墙,会出现很多误报的情况,或者直接卡死,大家再看着优化处理吧,简单代码如下: import requests import time def getstatus(…

0

python抓取js渲染的网页内容

- Python爬虫 - 阅 2

经常看到一些网站,它的内容在直接查看源代码的里面是没有要爬的内容的,都是一些js代码,用javascript输出的。用requests的get方法,爬不到里面的内容。 这里介绍一种使用Selenium来实现。Selenium是用来实现动态渲染页面爬取的。 首先要做下准备工作: 在chrome使用命令…

0

抓取gbk网站,解决Python爬虫中文乱码

- Python爬虫 - 阅 2

乱码问题是很常见的一种事情,记录一下解决python爬虫中的乱码问题 在相应的文本位置加入encode('ISO-8859-1')

0

Python中的sleep函数

- python基础 - 阅 1

python执行延时操作, 本文用sleep实现: 引入time库 # 例1:输出休眠5秒import time 输出: i = 3print(i) # 输出ii += 1time.sleep(5) # 休眠1秒print(i)

0

soup.find_all()用法介绍

- Python爬虫 - 阅 1

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库。它通过转换器实现文档导航,查找,修改文档的方式。 soup.find_all()用法 1.查找标签 soup.find_all('tag') 2.查找文本 soup.find_all(text='text') 3.根据id查找 soup.find_all(id='tag id'…

0

Python 保留字符

- python基础 - 阅 0

下面的列表显示了在Python中的保留字。这些保留字不能用作常数或变数,或任何其他标识符名称。 所有 Python 的关键字只包含小写字母。 andexecnotassertfinallyorbreakforpassclassfromprintcontinueglobalraisedefifreturndelimporttryelifinwhileelseiswithexceptlambda…

0

Python 标识符有哪些?

- python基础 - 阅 1

在 Python 里,标识符由字母、数字、下划线组成。 在 Python 中,所有标识符可以包括英文、数字以及下划线(_),但不能以数字开头。 Python 中的标识符是区分大小写的。 以下划线开头的标识符是有特殊意义的。以单下划线开头 _foo 的代表不能直接访问的类属性,需通过类…

0

python去掉html中的a标签

- python软件 - 阅 0

python使用BeautifulSoup清除抓到的html中的a链接标签: 关键代码: info = [s.extract() for s in soup('a')] 运行结果: 完整示例代码: #!/usr/bin/python # -*- coding: UTF-8 -*- from bs4 import BeautifulSoup soup = BeautifulSoup('<html><…

0

Python2.x 中使用 Python3.x 的 print 函数

- python基础 - 阅 0

如果 Python2.x 版本想使用使用 Python3.x 的 print 函数,可以导入 __future__ 包,该包禁用 Python2.x 的 print 语句,采用 Python3.x 的 print 函数: 实例 >>> list =["a", "b", "c"]>>> print list …

0

脚本式编程

- python基础 - 阅 1

通过脚本参数调用解释器开始执行脚本,直到脚本执行完毕。当脚本执行完成后,解释器不再有效。 让我们写一个简单的 Python 脚本程序。所有 Python 文件将以 .py 为扩展名。将以下的源代码拷贝至 test.py 文件中。 print ("Hello, Python!") 这里,假设你已经…

0

交互式编程

- python基础 - 阅 0

交互式编程不需要创建脚本文件,是通过 Python 解释器的交互模式进来编写代码。 linux上你只需要在命令行中输入 Python 命令即可启动交互式编程,提示窗口如下:$ pythonPython 2.7.6 (default, Sep  9 2014, 15:04:36)[GCC 4.2.1 Compatible Apple …

      pip之家  懒人模板    长沙庆典策划公司