批处理统计词频实现代码(统计重复行的数量/每行

编辑: admin 分类: 批处理 发布时间: 2021-11-22 来源:互联网

请问批处理可以统计词频吗?
4字一行,只统计4字词组出现的频率。
如:

一丘之貉
一丝不挂
一丝不苟
一事无成
一亲对老
一分身又
一叶知秋
一叶知秋
一叶障目
一叶障目
一往无前
一往无前
一往无前

实现如下:

一丘之貉 1
一丝不挂 1
一丝不苟 1
一事无成 1
一亲对老 1
一分身又 1
一叶知秋 2
一叶障目 2
一往无前 3

解决代码

@echo off & setlocal enabledelayedexpansion
for /f "delims=" %%a in ('type 【文章来自:高防ip处的文章,转载请说明出处】"测试.txt"') do set /a "#%%a#+=1"
for /f "tokens=1* delims=#=" %%a in ('set #') do echo %%a %%b
pause

win7以上系统

powershell -c "gc '测试.txt'|group $_|%%{$_.name+' '+$_.count}"
pause

到此这篇关于批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)的文章就介绍到这了,更多相关bat统计词频内容请搜索海外IDC网以前的文章或继续浏览下面的相关文章希望大家以后多多支持海外IDC网!

更多阅读