-
Python学习网络爬虫--转
所属栏目:[Python] 日期:2020-07-29 热度:69
原文地址:https://github.com/lining0806/PythonSpiderNotesPython学习网络爬虫主要分3个大的版块:抓取,分析,存储另外,比较常用的爬虫框架Scrapy,这里最后也详细介绍一下。首先列举一下本人总结的相关文章,这些覆盖了入门网络爬虫需要的基本概念和技巧[详细]
-
python2 与 python3 语法区别--转
所属栏目:[Python] 日期:2020-07-29 热度:69
原文地址:http://old.sebug.net/paper/books/dive-into-python3/porting-code-to-python-3-with-2to3.html使用2to3将代码移植到Python 3Life is pleasant. Death is peaceful. It’s the transition that’s troublesome.— Isaac Asimov (attributed)概述几[详细]
-
1.1 官网地址
所属栏目:[Python] 日期:2020-07-29 热度:121
原文地址:http://www.jianshu.com/p/c3fc3129407d1. 爬虫框架webmagicWebMagic是一个简单灵活的爬虫框架。基于WebMagic,你可以快速开发出一个高效、易维护的爬虫。1.1 官网地址官网文档写的比较清楚,建议大家直接阅读官方文档,也可以阅读下面的内容。地址[详细]
-
python识别图片文字
所属栏目:[Python] 日期:2020-07-29 热度:134
因为学校要求要刷一门叫《包装世界》的网课,而课程里有200多道选择题,而且只能在手机完成,网页版无法做题,而看视频是不可能看视频的,这辈子都不可能看...所以写了几行代码来进行百度搜答案。思路如下:手机屏幕投影到电脑上;截图并识别图片文字;调用百[详细]
-
selenium打开chrome浏览器代码
所属栏目:[Python] 日期:2020-07-29 热度:93
import osfrom selenium import webdriverchromedriver = C:Program Files (x86)GoogleChromeApplicationchrome.exeos.environ[webdriver.chrome.driver] = chromedriverdriver = webdriver.Chrome(chromedriver)driver.quit()[详细]
-
java.net.URISyntaxException: Illegal character in query
所属栏目:[Python] 日期:2020-07-29 热度:86
java使用httpclient爬取一个网站的时候,请求:String url3=http://sh.58.com/ershoufang/33562546149042x.shtml?amp;params=esfjxpclranxuanctrAB^descamp;fzbref=0amp;entinfo=33562546149042_0amp;cookie=|||c5/nn1jLReK730pAPL8MAg==amp;psid=10821968819[详细]
-
Java. How to use headless browsers for crawling web and scra
所属栏目:[Python] 日期:2020-07-29 热度:159
https://www.linkedin.com/pulse/java-how-use-headless-browsers-crawling-web-scraping-data-taluyev/Did you ever think to implement software to scrape data from web pages? I guess everyone could think about crawling web.The simplest way to get[详细]
-
python2 str object has no attribute decode
所属栏目:[Python] 日期:2020-07-29 热度:179
0102030405060708.decode(hex)上述代码,报错:str object has no attribute decode查找原因:https://stackoverflow.com/questions/29030725/str-object-has-no-attribute-decodeYou cannot decode string objects; they arealreadydecoded. Youll have to u[详细]
-
python:生成器进阶
所属栏目:[Python] 日期:2020-07-29 热度:188
1,列表推导式值 for 循环2,生成器表达式g=(i fori inrange(10))print(g)for i in g: print(i)3,列表推导式与生成器表达式的区别#括号不一样#返回值不一样 ===》生成器表达式几乎不占内存g =(鸡蛋%s%i for i in range(10))print(g)for i in g:print(i)4,各[详细]
-
python:迭代器与生成器
所属栏目:[Python] 日期:2020-07-29 热度:196
一、导入1,dir功能print(dir([]))告诉我这个列表拥有的所有方法带着双下划线的方法叫做双下方法。2,一个列表执行了_iter_()之后的返回值就是一个迭代器3,_length_hint_元素个数4,_setstate_从指定位置取值5,[]._iter_()迭代器----_next_通过next就可以从[详细]
-
pyDes 实现 Python 版的 DES 对称加密/解密--转
所属栏目:[Python] 日期:2020-07-29 热度:192
https://my.oschina.net/leejun2005/blog/586451手头有个 Java 版的 DES 加密/解密程序,最近想着将其 Python 重构下,方便后续脚本解析,捣鼓了两下 pyDes 貌似很方便,不过据网上其他同学测试说PyCrypto 性能要比 pyDes 高一个数量级,这里我没有做具体性能[详细]
-
Windows键盘驱动结构与消息机制--转
所属栏目:[Python] 日期:2020-07-29 热度:128
https://www.douban.com/note/318793892/本文主要介绍按键消息是如何传递到窗口并转化为具体的按键消息的。Windows系统是事件驱动的多任务系统,其中按键和鼠标是主要的事件。按键是由键盘驱动获得并转换,然后广播给各个窗口。整个架构的核心是csrss.exe这个[详细]
-
老男孩教育Python自动化2.0课程课件目录
所属栏目:[Python] 日期:2020-07-24 热度:79
Day1 - Python基础1 介绍、基本语法、流程控制 Day2 - Python基础2列表、字典、集合 Day3 - Python基础3 函数、递归、内置函数 Day4 - Pyth[详细]
-
python学习笔记十六:读取JSON文件
所属栏目:[Python] 日期:2020-07-24 热度:184
读取JSON文件可以用JSON库,示例代码:#coding:utf-8import jsonwith open(msg.json) as jsonfile:json_data = json.load(jsonfile)for key in json_data:val = json_data[key]print key + t + val[详细]
-
python学习笔记十七:base64及md5编码
所属栏目:[Python] 日期:2020-07-24 热度:175
一、Python Base64编码Python中进行Base64编码和解码要用base64模块,代码示例:#-*- coding: utf-8 -*-import base64str = cnblogsstr64 = base64.b64encode(str)print str64 #Y25ibG9ncw==print base64.b64decode(str64) #cnblogs二、MD5#Python 2.ximport[详细]
-
python统计日志小脚本
所属栏目:[Python] 日期:2020-07-24 热度:98
日志格式如下:[ 2016-06-28T00:10:33-03:00 ] xxx.xx.xx.xxx /api/index/xxx/ERR: code:400message:params:country:ustoken:uq6euz9dou6aqtk1Python(3)脚本如下:import urllib.requestimport ntpathimport os, sysimport timedef dirList(path):filelist[详细]
-
python 字典(dict)按键和值排序
所属栏目:[Python] 日期:2020-07-24 热度:114
python 字典(dict)的特点就是无序的,按照键(key)来提取相应值(value),如果我们需要字典按值排序的话,那可以用下面的方法来进行:1 下面的是按照value的值从大到小的顺序来排序。dic = {a:31, bc:5, c:3, asd:4, aa:74, d:0}dict= sorted(dic.items()[详细]
-
Python之路,Day21 - 常用算法学习
所属栏目:[Python] 日期:2020-07-24 热度:190
本节内容 1.算法定义 算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内[详细]
-
python 之路,Django rest framework 初探
所属栏目:[Python] 日期:2020-07-24 热度:163
Django rest framework介绍 Django REST framework is a powerful and flexible toolkit for building Web AP[详细]
-
Python之路,Day8 - Socket网络编程
所属栏目:[Python] 日期:2020-07-24 热度:196
本节内容 1. Socket介绍 概念 Anetwork socketis an endpoint of a connection across acomputer[详细]
-
python创建udp服务端和客户端
所属栏目:[Python] 日期:2020-07-24 热度:77
1.udp服务端server1 from socket import *2 from time import ctime34 HOST = 5 PORT = 88886 BUFSIZ = 10247 ADDR = (HOST, PORT)89 udpSerSock = socket(AF_INET, SOCK_DGRAM)10 udpSerSock.bind(ADDR)1112 while True:13 print(waiting for message...)14[详细]
-
git github 快速入门
所属栏目:[Python] 日期:2020-07-24 热度:172
本节内容 为什么要用版本控制? 假设你在的公司要上线一个新功能,你们开发团队为实现这个新功能,写了大约5000行代码,上线没2天,就发现这个功能用户并不喜欢,你老板让你去掉这个功能,你怎么办?你说简单[详细]
-
python第三方库 - dateutil
所属栏目:[Python] 日期:2020-07-24 热度:102
简介扩展并增强 datetime 模块的功能。支持 Python 2.3+。官方文档 :http://labix.org/python-dateutil安装两种方法:easy_install :easy_install python-dateutilpip在线安装 :pip install python-dateutil方法1,parse字符串可以很随意,可以用时间日期的英[详细]
-
python学习笔记十二:类的定义
所属栏目:[Python] 日期:2020-07-24 热度:163
demo#!/usr/bin/pythonclass Person:name = jimage = 25def say(self):print My name is + self.name + , and age is + str(self.age)p = Person()p.say()print p.name[详细]
-
python学习笔记十一:操作mysql
所属栏目:[Python] 日期:2020-07-24 热度:165
一、安装MySQL-python# yum install -y MySQL-python二、打开数据库连接#!/usr/bin/pythonimport MySQLdbconn = MySQLdb.connect(user=root,passwd=admin,host=127.0.0.1)conn.select_db(test)cur = conn.cursor()三、操作数据库def insertdb():sql = insert[详细]