python入门 - 找到文件中出现次数最多的10个单词
title: python入门 - 找到文件中出现次数最多的10个单词 tags: python categories: python theme: vue-pro highlight:
最近有点需求,在看python的入门基础,看完入门基础之后,跟着练习,找到文件中出现次数最多的10个单词,以此熟悉语法。
语法概要
mac电脑命令行输入python3
,回车可以执行语句,exit()
退出
python3 xx.py
可以执行文件。
- 初始赋值,一般用
None
- 声明变量不需要任何多余,没有
var
/const
巴拉巴拉 - 语法用
:
表示一起,缩进
表示嵌套关系 - 字典就是对象,用
dict()
新建,注意dict({'a':1})
必须要用引号括起来键 - 字典获取值的时候,键必须存在不然会报错,一般用
xxDict.get('a',0)
来获取,这样没有就赋值0,有就获取 - 列表就是数组,用
list()
新建,注意不能获取超过list长度的索引,如果取局部的话xxList[0:10]
这样就行 - 元组,在js中没有,虽然ts中有,元组类似列表,但不能编辑,表示为
(1,2)
,如果你的列表不需要编辑,就可以用元组替换 - sorted可以排序的方法,排序数组、对象的key、元组,通常排序对象的时候,如果需要排序value的话,可以用
sorted(([(v,k) for (k,v) in xxDict.items()]))
快速得到排序后的元组列表,从大到小的话,第二参数加上reverse=True
- 打开文件
open(filepath)
,但返回值不是字符串,需要for line in open(filepath)
,拿到每行的文本 - 字符串变成数组,用
split
,默认分隔符是空格 try: expect:
关键语句,记得捕获错误,需要的话退出程序quit()
代码
```python
本文件是获取 任意文件里出现次数前10的word
借此学习python的简单数据结构
python3 xx.py 执行就可以
filename = input('文件的路径:')
这里用户输入的文件路径可能打不开,所以try下,如果出错,程序退出
try: # 打开文件,获取文件手柄 handle = open(filename) except: print('File Cannot be opened',filename) quit()
countDict = dict()
遍历文件的每行,line就是每行的字符串
for line in handle: # 空格为分隔符,得到每行的单词列表 words = line.split() # 遍历每行的单词列表,word是每个单词 for word in words: # 此行相当于,没有key的话,新建key取0,有的话返回 countDict[word] = countDict.get(word,0) + 1 # 等同于 # # word没出现在dic的话,需要赋值,不然读的话会报错 # if word not in countDict : # countDict[word] = 0 # # 处理完之后,都加1 # countDict[word] = countDict[word] + 1
得到各单词出现的次数字典
print(countDict)
最大出现的次数
bigCount = None
最大出现的次数对应的word
bigKey = None
遍历字典,key就是word,value就是次数
for word in countDict: count = countDict[word] # 注意None的情况和大于的情况都需要赋值 if bigCount is None or count>bigCount: bigCount = count bigKey = word
print(bigCount)
print(bigKey)
python的字典key必须是字符串包裹
a = dict({'a':1,'b':2})
items字典会返回元组列表 [('a', 1), ('b', 2)]
print(a.items())
sorted排序元组列表
将countDict变成元组列表,然后将k,v对调,变成新元组列表
sortList = sorted(([(count,word) for (word,count) in countDict.items()]),reverse=True)
等同于以下
# 装(value,key)的list
tempList = list()
# 遍历countDict.items(),能同时获取key,value
for (word,count) in countDict.items():
# key value调换下位置
newTuple = (count,word)
# 装进tempList
tempList.append(newTuple)
# sorted 排序元组的时候,先按照元组的第一项排序,这边就是按照count排序,且从大到小
sortList = sorted(tempList,reverse=True)
取前10
tenList = sortList[0:10]
还需要将key和value反转回来
resDict = dict() for (count,word) in tenList: resDict[word] = count
print(resDict)
```
- 跳转别人的页面,怎么加个返回呢
- python入门 - 找到文件中出现次数最多的10个单词
- 怎么修改请求的参数和响应
- 简单学习SQL语言
- h函数为什么叫h?
- 简单的DOM的相关总结
- 细心使用es6的语法
- 理解执行上下文和其生命周期
- JS内存管理生命周期和垃圾回收机制
- 从0实现简易版的vuex
- watch经常失效的场景和解决方案
- 让el-table更好用,通过配置的方式
- 让el-form更好用,通过配置的方式
- 写个简单css动画,transition 和animate
- 怎么封装弹框组件
- 手写实现el-form系列组件的核心逻辑 -- 练习组件通信
- 怎么使用async-validator快速校验表单
- 作用域插槽slot的使用场景 -- vue组件通信系列
- $parent/$children的使用场景 -- vue组件通信系列
- 怎么点击下拉框外面关闭下拉框