admin 管理员组文章数量: 887021
TF
本文是为大家整理的TF-IDF算法主题相关的10篇毕业论文文献,包括5篇期刊论文和5篇学位论文,为TF-IDF算法选题相关人员撰写毕业论文提供参考。
1.[期刊论文]基于TF-IDF算法的分层搜索引擎设计
期刊:《计算机与数字工程》 | 2021 年第 003 期
摘要:随着网络信息的迅速增长以及深层网络结构的广泛应用,人们对于覆盖率广、检索效率高的搜索引擎提出了愈来愈高的要求.据此,论文提出了一种两阶段的搜索引擎设计方案.在第一阶段利用网络爬虫爬取相关的网络信息,并构成词条语料库,在第二阶段基于TF-IDF算法搜索词条语料库,得到与待查询语句最相近的词条.该引擎利用Flask框架构建本地Web界面,实现简洁明了的界面显示与快速的数据传输,且该框架易于维护.实验结果表明,该搜索引擎采用的爬虫技术所形成的语料库覆盖率广,TF-IDF算法具有计算速度快、匹配精度高的特点.
关键词:搜索引擎;网络爬虫;TF-IDF算法;Flask框架
---------------------------------------------------------------------------------------------------
2.[期刊论文]基于改进TF-IDF算法的牛疾病智能诊断系统
期刊:《计算机应用与软件》 | 2021 年第 002 期
摘要:传统的TF-IDF(Term Frequency&Inverse Documentation Frequency)算法提取的关键词不能合理地代表某疾病的症状,降低智能诊断系统的性能.对此,提出一种改进的TF-IDF算法,并将其应用在牛疾病诊断系统中.系统将用户描述的文本内容转换成向量的形式,用TF-IDF算法提取关键症状词,利用余弦定理和可信度计算给出可靠的疾病推荐和治疗方案.实验结果表明,该算法在疾病诊断中准确率和可信度两方面都具有更好的效果.与传统TF-IDF算法相比,平均可信度提高约4%.
关键词:智能诊断;TF-IDF;余弦相似度;VSM
---------------------------------------------------------------------------------------------------
3.[期刊论文]一种基于TF-IDF的朴素贝叶斯算法改进
期刊:《计算机技术与发展》 | 2020 年第 002 期
关键词:朴素贝叶斯;TF-IDF算法;去中心化;位置信息;特征权重
---------------------------------------------------------------------------------------------------
4.[期刊论文]一种结合TF-IDF方法和词向量的短文本聚类算法
期刊:《电子设计工程》 | 2020 年第 021 期
摘要:随着在线社交网络平台(微信、微博等)和APP(网易、学习强国)的快速发展和应用,产生了海量短文本.针对这些海量短文本,传统的文本聚类方法存在聚类性能较差的问题.本文融合TF-IDF方法和词向量,提出了一种短文本聚类方法.首先,使用TF-IDF方法,提取短文本中TF-IDF值靠前的TOP-N关键词作为短文本的特征词集合;其次,在Word2Vec工具的支持下,使用Skip-gram模型在海量语料中训练得到特征词的向量表示;最后,使用WMD距离计算短文本间的相似度.将所提方法应用于4个数据集,实验结果表示,该方法比传统的文本聚类算法具有更好的效果.
关键词:文本聚类;短文本;TF-IDF;词向量;自然语言处理
---------------------------------------------------------------------------------------------------
5.[期刊论文]一种改进TF-IDF的中文邮件识别算法研究
期刊:《现代电子技术》 | 2020 年第 012 期
关键词:TF-IDF算法;邮件识别;卡方统计量;权重分配;邮件分类;仿真分析
---------------------------------------------------------------------------------------------------
6.[学位论文]改进的TF-IDF特征选择和短文本分类算法研究
目录
封面声明中文摘要英文摘要目录第一章 绪 论1.1 研究背景与意义1.1.1 研究背景1.1.2 研究意义1.2 国内外研究现状1.2.1 文本分类综述1.2.2 国内外文本表示发展史概述1.2.3 国内外文本分类发展史概述1.3 论文的研究内容与组织结构1.3.1 研究内容1.3.2 论文组织结构1.4 本章小结第二章 短文本分类相关技术简介2.1 文本规范化处理2.1.1 文本预处理过程2.1.2 中文分词方法2.1.3 分词工具的介绍2.2 文本特征选择与提取2.2.1 文本特征表示2.2.2 文本特征选择2.3 文本分类算法2.3.1 多项式朴素贝叶斯2.3.2 支持向量机2.3.3 逻辑回归算法2.3.4 k 最近邻分类算法2.3.5 卷积神经网络分类算法2.4 分类算法评价指标2.5 深度学习2.6 Word2vec模型2.6.1 CBOW 和Skip-Gram模型简介2.6.2 Hierarchical Softmax 模型介绍2.6.3 Negative Sampling 模型介绍2.7 本章小结第三章 改进的TF-IDF特征选择算法3.1 改进型TF-IDF特征的权重算法3.1.1 WF_TF-IDF3.1.2 CHI_TF-IDF3.1.3 WoTFI 特征选择模型3.2 特征选择实验结果3.2.1 实验数据3.2.2 Word2vec参数配置3.2.3 实验结果3.3 基于WoTFI特征选择算法的CNN分类结果3.3.1 神经网络语言模型3.3.2 TextCNN文本分类算法模型3.3.3 实验环境和分类模型参数配置3.3.4 WoTFI 特征选择方法用于短文本分类结果3.4 本章小结第四章 基于Bi-LSTM 的char-CNN短文本分类模型的设计4.1 字符级嵌入简述4.2 本节模型介绍4.2.1 引入双向长短时记忆网络算法的双通道卷积神经网络模型4.2.2 解决过拟合的方法4.2.3 LRN优化4.2.4 LSTM模型介绍4.2.5 Bi-LSTM模型介绍4.3 中英文短文本实验数据4.3.1 英文语料库处理4.3.2 中文语料库处理4.4 实验环境及模型参数配置4.4.1 实验环境4.4.2 模型参数设置4.5 实验结果与分析4.5.1 不同实验模型分类精度对比结果4.5.2 嵌入方式不同的对比实验结果4.6 本章小结第五章 实验设计结果与分析5.1 实验环境的介绍5.2 文本数据模块的准备5.3 实验结果与分析5.3.1 维度对特征表示模型的影响5.3.2 改进后的分类模型对SST-1数据分类的结果5.3.4 融合的文本表示模型受单文本表示模型的影响5.3.5分类结果验证5.4 本章小结总结与展望参考文献攻读学位期间发表的学术论文致 谢
著录项
学科:电子与通信工程
授予学位:硕士
年度:2020
正文语种:中文语种
---------------------------------------------------------------------------------------------------
7.[学位论文]基于TF-IDF改进算法和喜好度的视频用户分类
目录
封面声明摘要英文摘要目录第一章 引言1.1 研究背景和意义1.2 研究现状1.2.1 国内研究现状1.4 结构和安排1.5 本章小结第二章 相关技术与理论2.1 Spark分布式计算框架2.1.1 分布式计算2.1.2 Spark组成模块2.1.3 Spark优点2.1.4 Spark核心RDD2.1.5 MLlib2.1.6 Scala简介2.2 HDFS架构分析2.3 其他相关技术2.4 分类算法概述2.5 视频喜好度分析2.6 本章小结第三章 用户年龄分类算法3.1 未加权算法3.1.1 贝叶斯定理3.1.2 朴素贝叶斯算法定义3.1.3 朴素贝叶斯算法小结3.2 加权算法3.2.2 改进的TFC-IDFC加权算法3.3 本章小结第四章 用户年龄分类模型设计4.1 模型设计步骤概述4.2 实验环境4.2.1 JDK的安装4.2.2 Scala的安装4.2.3 Spark的安装4.2.4 Hadoop与Spark整合4.3 年龄离散化4.4 用户喜好度计算方法4.4.1 节目喜好度公式4.4.2 视频喜好度公式4.5 实验数据4.5.1 数据获取4.5.2 数据处理4.6 评价指标4.7 本章小结第五章 用户年龄分类的实现5.1 基于朴素贝叶斯的年龄分类5.1.1 分类过程5.1.2 算法实现过程5.1.3 分类结果5.2.1 分类过程5.2.2 算法实现过程5.2.3 分类结果5.3 基于IFC-IDFC算法的年龄分类5.3.1 分类过程5.3.2 算法实现过程5.3.3 分类结果5.4 结果对比与分析5.4.1 结果对比5.4.2 结果分析5.5 本章小结第六章 总结参考文献发表论文和参加科研情况致谢
著录项
学科:计算机技术
授予学位:硕士
年度:2018
正文语种:中文语种
中图分类:计算机网络应用程序
---------------------------------------------------------------------------------------------------
8.[学位论文]大数据环境下基于并行化TF-IDF算法增强语义角色挖掘的研究
目录
封面声明摘要英文摘要目录1.1 研究背景和意义1.2 国内外研究现状1.2.1 国内研究现状1.2.2 国外研究现状1.3 研究内容和目标1.4 论文结构安排第2章 基于角色的访问控制机制与角色工程相关技术2.1 访问控制技术简介2.1.1 早期访问控制技术2.1.2 RBAC访问控制模型2.2 自顶向下的角色工程2.2.1 自顶向下的角色工程简介2.2.2 自顶向下的角色工程的优点与不足2.3 自底向上的角色工程2.3.1 自底向上的角色工程简介2.3.2 自底向上的角色挖掘的优点与不足2.4 本章小结第3章 TF-IDF语义增强角色挖掘3.2 TF-IDF角色挖掘与传统角色挖掘的问题空间转化3.2.1 TF-IDF角色挖掘与传统角色挖掘数据集对比3.2.2 TF-IDF角色挖掘与传统角色挖掘方法流程的转换3.2.3 TF-IDF语义增强角色挖掘实现3.2.4 TF-IDF角色挖掘与传统角色挖掘结果集对比3.3 本章小结第4章 大数据环境下pTF-IDF角色挖掘技术4.1 大数据处理技术简介4.2 pTF-IDF算法角色挖掘的实现4.3 本章小结第5章 pTF-IDF语义增强角色挖掘性能对比实验5.1 角色挖掘对比实验的设计5.2 单机/并行化算法实验的实现环境5.2.1 实验开发平台5.2.2 实验环境搭建5.3 单机/并行化算法时间性能对比实验5.3.1 时间验证数据集5.3.2 时间性能对比实验5.3.3 模拟现实环境的时间性能对比实验5.4 pTF-IDF角色挖掘算法挖掘质量对比实验5.4.1 挖掘质量实验数据集5.4.2 挖掘质量评价指标5.4.3 用户权限需求覆盖对比实验5.5 pTF-IDF角色挖掘与传统角色挖掘性能分析5.6 本章小结第6章 pTF-IDF语义增强角色挖掘展示系统6.1 系统需求分析及概要设计6.1.1 需求分析6.1.2 系统功能模块设计6.1.3 数据库设计6.2 系统开发框架与环境平台搭建6.2.1 系统开发平台6.2.2 系统开发框架6.3 页面展示6.3.1 挖掘结果展示页面6.3.2 时间对比实验展示页面6.4 本章小节7.1 总结7.2 展望致谢参考文献
著录项
学科:计算机技术
授予学位:硕士
年度:2017
正文语种:中文语种
中图分类:数据安全
---------------------------------------------------------------------------------------------------
9.[学位论文]基于多词TF-IDF算法的智能导医系统研究
目录
封面 声明 中文摘要 英文摘要 目录 1 绪论 1.1 研究背景 1.2 导医系统研究现状 1.3 论文主要研究内容 1.4 论文组织结构 2 相关技术 2.1 推理方法 2.2 自然语言处理 2.3 向量空间模型 2.4 Android技术 2.5 本章小结 3 智能导医系统设计 3.1 系统整体框架设计 3.2 UI界面子系统 3.3 自然语言处理子系统 3.4 导医计算子系统 3.5 数据存储和管理 3.6 本章小结 4 智能导医推理过程 4.1 自然语言处理 4.2 导医推理过程分析 4.3 可靠度计算 4.4 本章小结 5 TF-IDF算法的分析与改进 5.1 TF-IDF算法的分析 5.2 向量权重与相似度的计算 5.3 本章小结 6 智能导医系统的实现与实验分析 6.1 系统的实现 6.2 实验结果与分析 6.3 本章小结 7 总结与展望 7.1 工作总结 7.2 展望 参考文献 个人简历、在学期间发表的学术论文及研究成果 致谢
著录项
学科:计算机应用技术
授予学位:硕士
年度:2015
正文语种:中文语种
中图分类:程序设计
---------------------------------------------------------------------------------------------------
10.[学位论文]基于论坛关键字搜索的改进TF-IDF算法及其应用
目录
封面 声明 中文摘要 英文摘要 目录 第1章 绪 论 1.1 研究背景和意义 1.2 国内外研究现状 1.3 主要研究内容 1.4 本文的组织结构 第2章 相关理论知识 2.1 引言 2.2 关键词提取方法 2.3 文本挖掘与文本聚类 2.4 中文词汇特点 2.5 论坛特性 2.6 论坛帖子结构特征 2.7 中文分词 2.8 网络爬虫 第3章 基于论坛的TF-IDF算法的改进 3.1 TF-IDF算法 3.2 TF-IDF算法在基于论坛的关键词提取中的不足 3.3 TF-IDF算法的改进 3.4 改进后的TF-IDF算法的测试 第4章 系统分析与设计 4.1 系统概况 4.2 需求分析 4.3 系统设计目标与原则 4.4 系统结构 4.5 系统功能 4.6 系统总体流程 4.7 数据库设计 4.8 模块设计 第五章 系统实现与测试 5.1 系统环境 5.2系统界面 5.3 系统测试 5.4 系统性能分析 第6章 总结与展望 6.1总结 6.2展望 参考文献 致谢 在读期间公开发表论文(著)及科研情况
著录项
学科:计算机技术
授予学位:硕士
年度:2015
正文语种:中文语种
中图分类:软件工程
本文标签: TF
版权声明:本文标题:TF 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/jishu/1686558383h10123.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论