这段代码为大一上半学期选修课程Python数据基础与挖掘
如何使用 if 和 else 命令
1 | Name = input("请输入用户名") |
使用 for (sth) in range 进行循环命令后 使用 break 停止命令
1 | for i in range(3): |
字符串中的储存方式 —— 下标编号
1 | name = "abcdef" |
什么叫切片
1 | range[起始:结束:步长] |
使用切片加下标编号
1 | name = "abcdef" |
字符串内建函数 —— index函数:检测字符串是否包括子字符串
1 | # 具体参数如下:str —— 指定检索字符串、beg —— 开始检索而且默认为零、结束引索而且默认为字符串的长度 |
字符串内建函数 —— replace函数:将旧字符串替换为新字符串
1 | # 具体参数如下:old —— 将被替换的字符串、new —— 新字符串且用于替换old字符串、max —— 可选字符串且替换不超过max次 |
字符串内建函数 —— split函数:通过指定分隔符对字符串进行切片
1 | # 具体参数如下:str —— 分隔符而且默认为所有空字符、num —— 分割次 |
字符串内建函数 —— capitalize与title函数
1 | # capitalize:第一个字符大写而且其他字符小写 |
字符串内建函数 —— startswith函数:检查字符串是否以制定子串开头
1 | # 具体参数如下:strbeg —— 可选参数用于设置字符串检查的起始值、strend —— 可选参数用于设置字符串检查的结束位置 |
字符串内建函数 —— endswith函数:检查字符串是否以制定子串结尾
1 | # 具体参数如下:suffix —— 该参数可以是一个字符串或者是一个元素、start —— 字符串中的开始位置、end —— 字符串中的结束位置 |
字符串内建函数 —— upper函数:将小写字母转为大写字母
1 | str.upper() |
字符串内建函数 —— ljust函数:左对齐而且使用空格填充至指定长度的新字符串
1 | # 具体参数如下:width —— 指定字符串长度、fillchar —— 填充字符而且默认为空格 |
字符串内建函数 —— strip函数:截掉字符串左右边的空格或指定字符
1 | # 具体参数如下:chars —— 移除字符串头尾指定的字符 |
条件语句if-elif-else的使用:
1 | if condition1: |
字符串中使用“ ”或\t转义字符 空一格
1 | string1 = "Hello" |
列表aList元素访问与计数
1 | score = [99,88,92,100,66,85,57,79,90,61] |
列表aList元素的增加指令—append、extend、insert、*
1 | score = [99,88,92,100,66,85,57,79,90,61] |
列表aList元素的删减指令—pop()、remove()
1 | score = [99,88,92,100,66,85,57,79,90,61] |
在列表外/中去使用循环语句去除指定元素
1 | a = [1,2,1,2,1,2] |
在列表中使用count()指令查询指定元素次数
1 | score = [99,88,92,100,66,85,57,79,90,61] |
在列表中使用len()指令查询总元素数量
1 | score = [99,88,92,100,66,85,57,79,90,61] |
在列表中使用sort()函数,对函数从小到大排序并输出
1 | score = [99,88,92,100,66,85,57,79,90,61] |
在列表中使用reverse()函数,颠倒函数顺序
1 | score = [99,88,92,100,66,85,57,79,90,61] |
元组的创建与删除 —— 使用tuple函数和del删除
1 | aList = [-1,-4,6,7.5,-2.3,9,-11] |
序列解包 —— 对于列表和字典同样有效
1 | # 同时对多个变量进行赋值 |
将元组转换成列表的指令 —— list指令
1 | a = ('茸华似雪',520,'唯世恋茸',521) |
将元组转换成列表后增添/减少元素
1 | a = ('茸华似雪',520,'唯世恋茸',521) |
字典创建与删除 —— 创造字典
1 | a_dict = {'name':'茸华似雪','age':18} |
字典创建与删除 —— 相关dict使用
1 | d = dict(name = '茸华',age = 18) |
字典创建与删除 —— del使用
1 | add=dict = dict.fromkeys(['name','age','gender']) |
字典创建与删除 —— get、items的使用
1 | a_dict = {'name':'茸华似雪','age':18} |
字典创建与删除 —— del、clear()、pop()、popitem的使用
1 | a = {'name':'茸华似雪','age':18} |
Python数据类型
1 | # 整数 int |
函数代入数值
1 | def add2num(a,b): |
最常用的有参数有返回值的函数
1 | def Anum(num): |
使用结巴分词库
1 | import jieba |
结巴分词的精确模式
1 | words = jieba.cut(text,cut_all = False) |
结巴分词的全模式
1 | words = jieba.cut(text,cut_all = True) |
结巴分词的搜索模式
1 | words = jieba.cut_for_search(text) |
结巴分词的读取自带文件
1 | with open(r'E:/管理学/debug.log',encoding = 'ansi') as f: |
结巴分词的自定义词典
1 | import jieba |
结巴分词的词性标注
1 | import jieba.posseg as pseg |
结巴分词的命名实体识别
1 | import jieba.analyse |
结巴分词的情感分析
1 | import jieba.analyse |
结巴分词的提取成语
1 | import jieba |
结巴分词的提取成语和介词
1 | import jieba |
课堂上词云图作业
from wordcloud import WordCloud #导入
import jieba
import jieba.analyse
import collections
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
with open("C:/Users/69099/Desktop/二十大报告1.txt","r",encoding="utf-8") as file: #打开文件
txt = file.read() #读取文件
seg_list = jieba.analyse.extract_tags(txt)
wc_mask = np.array(Image.open("C:/Users/69099/Desktop/f94efe25cfc14c46934a05f046d05e33.png"))
wc = WordCloud(font_path="C:\Windows\Fonts\simkai.TTF", #设置属性
collocations=False,
background_color="white",
width=1000,
height=800,
max_font_size=100,
contour_color = 'Blue',
mask = wc_mask, #设置背景图
contour_width = 2, #词云边框大小
max_words=100).generate(txt)
wc.generate_from_frequencies(word_counts)
image_colors = wordcloud.ImageColorGenerator(wc_mask)
plt.figure(figsize = [10,10])
plt.imshow(wc)
plt.axis("off")
plt.show()