标签: python

8 篇文章

thumbnail
【论文数据|爬取与清洗】文本分析|数据清洗| Selenium 模拟登录与自动化下载|北大法宝网 Pkulaw 爬虫|天眼查爬虫| Charles抓包
问题描述 今年笔者参与了一个法律与市场相关的科研项目,在团队中,笔者主要负责数据抓取、处理和分析。在上一篇文章「【Python爬虫——批量爬取北大法宝网(pkulaw)的法律判决书】看似简单的任务为何如此麻烦?Selenium破解滑块验证|Xpath解析HTML|Re正则表达式文本分析」中,笔者写到…
thumbnail
【Python爬虫——批量爬取北大法宝网(pkulaw)的法律判决书】看似简单的任务为何如此麻烦?Selenium破解滑块验证|Xpath解析HTML|Re正则表达式文本分析
需求 本项目是法律相关的科研项目,需要通过深圳市律师协会官方网站 (szlawyers.com)进入北大法宝的案例库下载商标法相关的判决书,并提取相关的结构化数据,以供进一步学术研究。 所以,主要包括两个数据需求: 一、判决书文本:2019年和2013年商标法 1、搜索最新版本的商标法的相关判决书,…
thumbnail
【Python 金融数据分析】使用PCA算法实现普惠金融发展水平的综合评价
本项目实现金融数据的降维,笔者基于个人对普惠金融的研究兴趣,在初步进行文献调研后,决定使用PCA算法对我国普惠金融发展水平进行综合评价分析,在这个过程中,对PCA算法进行了较为深入的理解和扩展,最后对各省的普惠金融发展水平进行了排名,并画出了我国普惠金融发展水平地图。这是一个将所学算法知识应用于研究…
thumbnail
【如何让人工智能玩吃豆人游戏?】Pacman|对抗博弈|搜索策略|minmax搜索算法|alpha-beta 剪枝算法|评估函数设计|智能体
本次笔者拟通过Python解决吃豆人游戏,这是UC Berkeley的一个经典项目。 实际上是吃豆人与幽灵之间的博弈游戏,吃豆人根据豆子和幽灵的情况不断地调整自己的行动,最后完全吃完地图上的豆子,避开幽灵的攻击,这样就赢得了胜利。所以本项目的目标是设计一个智能体: 吃掉所有豆子躲避幽灵尽可能高分 项…
thumbnail
【如何用人工智能玩拼图游戏】八数码难题|Python|知识表示|状态空间法|深度优先算法|广度优先算法|无信息搜索|启发式函数|A*搜索算法
本次实验围绕求解八数码问题展开,将问题通过状态空间法进行知识表示,并对比分析了深度优先算法、广度优先算法和基于不同启发式函数的A*搜索算法的实现方案。思维导图如下: Oops! You forgot to select a pdf file. 完整代码如下: import time Statu_sa…
thumbnail
【机器学习入门:K-Means聚类算法】Python实现手写数字图像分类|PCA算法可视化|MNIST数据集|最优化方法分析
一、实验目的与要求 熟练掌握k-Means方法对手写数字图像进行分类; 编写代码,熟悉其画图工具,进行实验,并验证结果; 锻炼数学描述能力,提高报告的叙述能力。 二、问题 手写数字图像数据分类问题:文件train_images.mat包含大小为28*28的手写数字图像,共60000张;文件train…
thumbnail
【工具】pycharm使用指南(头文件、debug、macos快捷键)
设置脚本头文件---自动生成头文件 外观、字体等也都在 Preferences 中设置。 pycharm中的设置是可以导入和导出的,文件-管理IDE设置-导出设置,就可以保存当前pycharm中的设置为jar文件,重装直接使用导入设置就可以导入jar文件,就不用重复配置了。 debug 调试 右键d…