基于KNN的分类算法研究.doc

资料分类:科技学院 上传会员:花开富贵 更新时间:2023-06-08
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:9501
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:随着Internet上信息量爆发式的增加,电子文本信息的数量也激增。在当今的信息技术科学中,如何有效管理电子文档已成为越来越重要的问题。同时,人们面对如此庞大的信息量,想要在其中找到对自己有用的信息也需要大量的精力。包括现在很多人因为工作繁重,需要快速的得到自己需要的信息,来节省并不充裕的时间。分类算法就可以使这个问题得到解决,文本的自动分类在对计算机上文本信息的处理中有着不可代替的作用,来帮助增加对信息的检测,以及提高对文本检测的正确性。通过文本的分类算法可以实现对文本的检测、分类和匹配,进而能以最快速度匹配到有用的信息。

本文首先讲述了文本算法意义和对当今世界非常大的影响,以及国内外发展的现状。然后简单介绍了实现算法的一些必备的工具和开发环境。还有算法的基本理论,相当于实现算法的底层基础。接着介绍了文本分类的一般的过程,从文本的预处理到算法的最终完成,要经历一个复杂但是很标准的过程,来最终呈现出想要的结果。最后通过一个简单的实例来实现一次算法,来验证算法的正确性,以及通过算法带给人们的便利和对社会生产生活的改变。本文介绍了KNN算法一些基础的思想,总结了针对KNN算法的优缺点。并对未来的文本分类算法的研究和实际应用有了一定的理解。

关键词:文本分类,KNN算法,分类器,权重分配

 

目录

摘要

Abstract

第一章 引言-1

1.1 课题意义-1

1.2 国内外现状-2

1.3 开发工具的选择-2

第二章 所用开发工具简介-4

2.1 Submile Text3 简介-4

2.2 Python 简介-4

第三章 基本理论的概述-5

3.1 文本分类的基本概念-5

3.2 文本分类的一般过程-5

3.2.1 预处理-6

3.2.2 文本表示-7

3.2.3 特征提取-7

3.2.4 权重分配-8

3.2.5 文本表示-8

第四章 系统应用程序实例-10

4.1  收集数据-10

4.2  数据准备:数据解析-11

4.3  数据分析:数据可视化-13

4.4  数据归一化-15

4.5  测试算法:验证分类器-18

4.6  算法使用:构建完整可用系统-19

4.7  小结-23

结 束 语-25

参考文献-26

致  谢-26

相关论文资料:
最新评论
上传会员 花开富贵 对本文的描述:例如,假设有两种类型的文档集合:“计算机”和“艺术品”。显然,如果文档中出现“算法”一词,则本文应分类为“计算机”。因此,“算法”的特征项应在距离KNN(距离数据)的......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: