| 需要金币: |
资料包括:完整论文 | ![]() | |
| 转换比率:金额 X 10=金币数量, 例100元=1000金币 | 论文字数:13877 | ||
| 折扣与优惠:团购最低可5折优惠 - 了解详情 | 论文格式:Word格式(*.doc) |
摘要:近年来个人信息侵权案件频发,但较少学者对个人信息侵权案例的法律文书进行文本挖掘分析。论文使用TF-IDF算法对个人信息侵权案例的法律文书进行关键信息提取,针对提取信息作出分析并提出对应对策。首先论文使用了selenium爬虫技术从裁判文书网爬取了个人信息相关案例,并将爬取的个人信息法律文书作为研究对象。其次论文使用jieba库提供的TF-IDF算法分别对获赔偿民事案件与未获赔偿民事案件进行主要关键词的提炼,并作词云图可视化展示,最后分析了两类文书的主要关键词,得到了司法案例中法官的裁判倾向于维护公共利益、侵权违法成本较低以及农村商业银行贷款流程可能存在的问题的结论,针对个人、农村商业银行和法律提出改进对策。
关键词:文本挖掘;个人信息;爬虫;法律文书
目 录
摘 要
Abstract
1绪论-1
1.1研究背景和目的-1
1.2 国内外研究现状-1
1.3 研究内容-2
1.4 研究创新点-2
2 个人信息-4
2.1 个人信息定义-4
2.2 个人信息保护法律依据-4
2.3 境外个人信息保护制度的比较与借鉴-5
2.3.1 欧盟对个人信息的保护-5
2.3.2 美国对个人信息的保护-5
2.3.3 对我国个人信息保护的启示-6
3 数据来源与预处理-7
3.1 数据来源-7
3.2 网站分析以及爬虫技术选择-8
3.3 开发环境-9
3.4 文书获取-9
3.4.1 应对反爬虫机制-9
3.4.2 模拟登陆-11
3.4.3 检索、下载文书-12
3.5 文书处理-14
3.5.1 文书格式转化-14
3.5.2 文书分类-15
3.5.3统计违法成本-16
4 文本挖掘-19
4.1 数据预处理-19
4.1.1 文书分类批量写入-19
4.1.2 分词-20
4.2 词频统计与可视化-20
4.3 TF-IDF算法-21
5 总结-24
5.1 法律文书分析结论-24
5.2 对策建议-25
参考文献-27
附录-29
致谢 |

