-
Notifications
You must be signed in to change notification settings - Fork 438
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
统计最频繁使用的前50个命令和最不频繁50个命令对应的代码疑问 #9
Comments
你说的是对的,这个肯定是错误。不止这里有问题,12-3.py也有这个问题。作者好像对于FreqDist这个理解有误了。 |
多谢楼上的回答。 |
多谢楼上的楼上解答了,囧 |
请问大家改对以后算出的准确率是多少啊,我的是100%.... |
@UnnameBao 我也是100%哎 |
@UnnameBao @lhwlhw90 请问你们是怎么改正的?求代码,我机器学习刚入门,求指教 |
@aviraonepiece 我是这样改的 |
@UnnameBao 十分感谢!!!!!!follow |
可以利用pandas来做: |
@xiaoyuge16 学习了,pandas了解的少。 |
到这里才发现代码是python2,orz。 |
我用的python3.8,这部分代码我改成这样: |
兜哥,你好
WEB安全机器学习入门P78里面有个“统计最频繁使用的前50个命令和最不频繁50个命令”对应的代码如下:
我看了官网对FreqDist的解释,该函数功能是对词频进行统计,例如这里如果使用临时变量tmp进行遍历即可得到如下结果:
gs : 4
tset : 1
basename : 616
uname : 443
touch : 3
... ...
所以这里已经是去重后的数据,但使用fdist[0:50]和fdist[-50:]并不能得到最频繁使用的前50个命令和最不频繁50个命令,比如fdist[0:10]得到的就是字典前10条。
求指导!谢谢了!
The text was updated successfully, but these errors were encountered: