python - 合并两个字典
12345x = {'a':1, 'b':2}y = {'b':3, 'd':4}z = {**x, **y} # 如果有重复键值,则取最后一次的键值对print(z) # {'a': 1, 'b': 3, 'd': 4}
12345x = {'a':1, 'b':2}y = {'b':3, 'd':4}z = {**x, **y} # 如果有重复键值,则取最后一次的键值对print(z) # {'a': 1, 'b': 3, 'd': 4}
123456789101112# lcut即list cut,返回切分之后的结果列表jieba.lcut('人生苦短我用Python') # 精确模式 # 全模式,返回所有可能的结果jieba.lcut('人生苦短我用Python', cut_all=True)# 搜索引擎模式,结果利于搜索引擎的搜索jieba.lcut_for_search('人生苦短我用Python')# 向分词词典增加新词
123456789101112# 作用:递归遍历多层嵌套列表内的值到一个列表# yield from iterable本质上等于for item in iterable: yield item的缩写版,yield from的作用对象是iterabledef recursive(ns): # if type(ns) is list: if isinstance(ns, list):
还能不动声色饮茶,踏碎这一场,盛世烟花 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293
1.打开任意一条微博的页面(手机端m.weibo.cn),这里按下F12打开开发者工具(这里使用的是Firefox),在页面内下拉时会产生请求,请求链接有规律 2.这里的请求链接中的id跟网页的那条微博id一致 3.对任意一条请求进行分析,请求返回的内容为json格式的数据, 4.只对该条微博的评论进行抓取 12345678910111213141516171819202122232425
1.打开任意一位Instagram用户的首页,这里以https://www.instagram.com/melissamale/为例,对任意一张图片进行检查,没有发现图片链接, 2.打开图片所在页面,对图片进行检查,发现两个div都指向了该图片,在其中一个div中找到了图片的地址, 3.复制找到的图片地址,回到用户首页,查看页面的源代码,查找链接找到了一个display_url节点, 4.搜
1.打开谷歌浏览器,找到需要抓取的bilibili直播页面,按F12打开开发者工具,再次刷新当前直播页面, 2.将Method设置为显示,点击排序,找到Method为Post的msg请求 3.这里可以找到侧边栏的弹幕信息,这里的返回数据有十条,如果观看的人数较少,返回的数据会有重复 4.这里是请求地址及请求方式 5.这里包含着需要提交的form表单数据,这里的roomid有时和当前直播网
下面的代码用python2写的,稍微改改python3下就可以使用了 python3下没有urllib2,可以用requests替代,这里没有写目录是否存在的判断,需要提前创建目录, 12345678910111213141516171819202122232425# -*- coding: utf-8 -*-# 下面的代码用来下载http://www.budejie.com/video目录下的
红尘初妆,山河无疆。 最初的面庞,碾碎梦魇无常,命格无双 123456789101112131415161718192021222324252627282930313233343536# -*- coding:utf-8 -*-import tkinter as tkwindow = tk.Tk()window.title('My First Window')window.geometry(