批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)

这篇文章主要介绍了批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数),需要的朋友可以参考下

请问批处理可以统计词频吗?
4字一行,只统计4字词组出现的频率。
如:

一丘之貉
一丝不挂
一丝不苟
一事无成
一亲对老
一分身又
一叶知秋
一叶知秋
一叶障目
一叶障目
一往无前
一往无前
一往无前

实现如下:

一丘之貉 1
一丝不挂 1
一丝不苟 1
一事无成 1
一亲对老 1
一分身又 1
一叶知秋 2
一叶障目 2
一往无前 3

解决代码

 @echo off & setlocal enabledelayedexpansion for /f "delims=" %%a in ('type "测试.txt"') do set /a "#%%a#+=1" for /f "tokens=1* delims=#=" %%a in ('set #') do echo %%a %%b pause

win7以上系统

 powershell -c "gc '测试.txt'|group $_|%%{$_.name+' '+$_.count}" pause

到此这篇关于批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)的文章就介绍到这了,更多相关bat统计词频内容请搜索html中文网以前的文章或继续浏览下面的相关文章希望大家以后多多支持html中文网!

以上就是批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)的详细内容,更多请关注0133技术站其它相关文章!

赞(0) 打赏
未经允许不得转载:0133技术站首页 » 脚本专栏