手抄报 安全手抄报 手抄报内容 手抄报图片 英语手抄报 清明节手抄报 节约用水手抄报

Python:如何利用正则表达式统计词频

时间:2024-10-12 10:54:26

1、打开PyCharm软件,创建一个Python文件,并准备一份有内容的文本文件。

Python:如何利用正则表达式统计词频

2、引入re模块。

Python:如何利用正则表达式统计词频

3、写上打开与关闭文件的代码。

Python:如何利用正则表达式统计词频

4、统计单个英文字母出现的频率。1、f.read()函数读取文件全部粝简肯惧内容;2、re.findall('i', f.read())获取文件中出现的i;3、len()函数统计列表元素个数。

Python:如何利用正则表达式统计词频

5、统计单个中文单词出现的频率,除了需要重新处理下文件偏移量外,其他步骤与第四步完全一致。

Python:如何利用正则表达式统计词频

6、统计数字出现的频率(与第五步一致)。

Python:如何利用正则表达式统计词频

7、统计英文字母出现的频率(与第五步一致)。

Python:如何利用正则表达式统计词频

8、统计有多少个标点符号(与第五步一致)。

Python:如何利用正则表达式统计词频
© 手抄报圈