| 需要金币: |
资料包括:完整论文 | ![]() | |
| 转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:16093 | ||
| 折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:随着我国电子商务的日益发展,网络购物平台商品数据繁多且杂乱,人们追求商品质量的同时也对商家服务质量的要求不断提高,其中人们对商品信息的获取的便利与否尤其注重。常见的搜索引擎已经不能满足用户对快速准确获取信息的需求,而自动问答可以精准地回答用户以自然语言提出的问题。 本文以Python爬虫为基础,爬取京东购物平台商品信息,构建商品知识库。利用Django框架构建Web页面实现商品数据展示,用户可以很方便地浏览商品信息。结合中文分词技术定义问题关键词提取方法,运用编辑距离算法计算关键词与商品知识库中商品数据的相似度,根据相似度返回答案,最终实现中文问答系统。系统可以回答用户以自然语言提出的问题,帮助用户快速获取想要了解的商品信息,同时也可以缓解客服人员的工作压力。
关键词:自动问答;网络爬虫;电子商务
目 录 摘 要 ABSTRACT 第一章 绪论-1 1.1 研究背景-1 1.2研究现状-2 1.3 研究内容及主要工作-2 1.4 章节安排-3 第二章 系统开发相关技术-4 2.1 系统开发技术-4 2.1.1 Python技术-4 2.1.2 Django框架-4 2.1.3 网络爬虫技术-5 2.1.4 MySQL数据库-5 2.1.5 中文分词技术-6 2.2 技术分析比较-6 2.2.1数据爬取技术-6 2.2.2 分词工具-7 2.3 课题技术路线-8 2.4 本章小结-8 第三章 系统需求分析-9 3.1 系统可行性分析-9 3.2 系统总体需求-10 3.2.1性能需求-10 3.2.2 NABC模型分析-10 3.3 用户分析-11 3.4 其他需求-11 3.5 本章小结-12 第四章 自动问答系统分析与结构设计-13 4.1 问答系统总体架构设计-13 4.2 问答系统爬取数据模块-14 4.3 问答系统商品信息展示模块-15 4.4问答系统中文问答模块-15 4.5 本章小结-16 第五章 问答系统详细设计与实现-17 5.1 数据爬虫设计实现-17 5.1.1 分析京东商城页面-17 5.1.2 解析页面-18 5.1.3 JSON数据处理-19 5.1.4 爬取模块实现效果-20 5.2 Web页面展示模块实现-21 5.3 中文问答模块实现-23 5.3.1 分词与词性标注-23 5.3.2 关键词提取-25 5.3.3 相似度计算-25 5.4 系统功能测试-28 5.5 本章小结-29 第六章 总结与展望-30 6.1 总结-30 6.2 展望-30 参考文献-31 致谢-32 |

