×

爬虫

【python量化】将Transformer模型用于股票价格预测

Gxr Gxr 发表于2024-05-13 浏览9757 评论0
前言 下面的这篇文章主要教大家如何搭建一个基于Transformer的简单预测模型,并将其用于股票价格预测当中。原代码在文末进行获取。 1、Transformer模型 Transformer 是 Google 的团队在 2017 年提出的一种 NLP 经典模型,现在比较火热的 Bert 也是基于 Transformer。Transformer 模型使用了 Self-Attention 机制,不采用 RNN 的顺序结构,使得模型可以并行化训练,而且能够拥有全局信息。这篇文章的目的主要

爬虫

Python 数据采集-爬取学校官网新闻标题与链接(进阶)(python爬取学校学生信息)

renhai renhai 发表于2024-05-13 浏览7945 评论0
前言 ⭐ 本文基于学校的课程内容进行总结,所爬取的数据均为学习使用,请勿用于其他用途 准备工作: 爬取地址:https://www.hist.edu.cn/index/sy/kyyw.htm 爬取目的:爬取全部新闻的标题与链接(绝对路径)并存储 了解前导文章 Python 数据采集-爬取学校官网新闻标题与链接(基础) 环境需求:安装扩展库 BeautifulSoup、urllib(⭐不会安装点这里 Python 下载安装第三方库) 基本知识: 了解网页的基本

爬虫

如何用 Python 识别车牌

haibao haibao 发表于2024-05-13 浏览7983 评论0
车牌识别在高速公路中有着广泛的应用,比如我们常见的电子收费(ETC)系统和交通违章车辆的检测,除此之外像小区或地下 车库门禁也会用到,基本上凡是需要对车辆进行身份检测的地方都会用到。 简介 车牌识别系统(Vehicle License Plate Recognition)是计算机视频图像识别技术在车辆牌照识别中的一种应用,通常一个车牌识 别系统主要包括以下这四个部分: •车辆图像获取 •车牌定位 •车牌字符分割 •车牌字符识别 我们再来看一下百科中对车牌识别技术的描述:

爬虫

将爬取的数据存为json格式(爬取数据保存到json文件为空)

此号已注销 此号已注销 发表于2024-05-13 浏览8831 评论0
将爬取的数据存为json格式,你会吗? 之前我都是将数据爬取后存为txt、csv或者excel,json格式几乎没有。于是乎我就想试一下,如何将爬取的数据存为json文件。于是我便查了一下使用json格式的好处,不查不知道,一查吓一跳。好家伙呀,json格式的特点和优势可真不少呢。json格式的特点和优势大致为: JSON数据清晰、易于读写 JSON有很多工具类支持它的转换 JSON在所有主流浏览器有很好的支持 JSON在传输时数据量更小、传输更快 JSON在JS中有天然的语言优势(因为

爬虫

python爬虫教程(五):解析库bs4及爬取实例

梦幻星空 梦幻星空 发表于2024-05-13 浏览7283 评论0
大家好,今天分享的是解析库中的bs4,本文章的目的是让你知道如何使用bs4,并且附带爬取实例。 目录 一、bs4简介 二、安装及初始印象 1.安装 2.解析器 3.初始印象   三、选择元素的方法 1.方法一 2.方法二: 3.方法三: 4.方法四: 三、获取元素信息 1.获取文本信息: 2.获取属性信息:  四、bs4爬取爬虫抓取实例 1.爬取说明 2.实现过程 一、bs4简介 BS4全称是Beatiful Soup,它提供一些简单的、python式

爬虫

python实现百度翻译

花若飞絮花曾落 花若飞絮花曾落 发表于2024-05-13 浏览6319 评论0
希望能对初学爬虫的朋友有帮助。 文章目录 一、分析网页 二、使用步骤 1.导入库 2.键盘输入内容 3.构建url、headers和data参数 4.发起请求,响应数据 5.解析数据输出结果 三、完整代码 一、分析网页  1. 打开网页,在搜索框输入百度翻译并进入百度翻译网站中。F12调出开发者工具,点击Network(网络)\ Fetch/XHR,同时在翻译框中任意输入搜索内容,此时就会发现有一个名称为sug的包。点击该包,点击后

爬虫

女朋友跟你说晚安之后仍然在线,我用Python制作脚本成功征服

温暖记忆 温暖记忆 发表于2024-05-13 浏览16282 评论0
大家好,我是辣条。   辣条的一个朋友最近跟我诉苦:女朋友沉迷淘宝抢购无法自拔,大晚上不睡觉都在定时抢购,真是败家。 都是好朋友辣条肯定帮忙,不就是定时抢购,定时清空购物车嘛,这叫安排。 爬取目标 网站:淘宝 工具使用 开发工具:pycharm 开发环境:python3.7, Windows10 使用工具包:selenuim 需求分析 我们的目标是秒杀淘宝的订单,这里面有几个关键点,首先需要登录淘宝,其次你需要准备好订单,最后要在指定时间快速提交订单。 项目思路解析

爬虫

【python实战】还是单身?教你如何用python追到女朋友

longhuahim longhuahim 发表于2024-05-13 浏览18343 评论0
微信搜索一条IT,领取文中提到的源码及成品。 前言 今天和几个群友闲聊,聊到程序员难找女朋友,工作太忙,圈子太小,单身太多,妹子太少。 “一条,你每天这么忙,也不爱说话,怎么找到的女朋友?” 突然有群友cure到我头上,哎,这个问题我还没想过,可能是因为我帅吧,哈哈哈 “我呸!你还帅,本仙女当初是觉得你很有才,总能鼓捣出点好玩的东西让我开心。” 哎呀,被女朋友看见了,不过也给出了官方回答,回想一条确实给女朋友做了不少好玩的,这可得感谢python,帮我追

爬虫

Python爬虫 数据分析 数据可视化(分析雪中悍刀行弹幕)

周正,拆迁户化身 周正,拆迁户化身 发表于2024-05-13 浏览16487 评论0
哔哔一下 雪中悍刀行兄弟们都看过了吗?感觉看了个寂寞,但又感觉还行,原谅我没看过原著小说~ 豆瓣评分5.8,说明我还是没说错它的。 当然,这并不妨碍它波播放量嘎嘎上涨,半个月25亿播放,平均一集一个亿,就是每天只有一集有点难受。 我们今天就来采集一下它的弹幕,实现数据可视化,看看弹幕文化都输出了什么~ 爬虫部分 我们将它的弹幕先采集下来,保存到Excel表格~ 首先安装一下这两个模块 requests # 发送网络请求 pandas as pd # 保存数据

爬虫

爬取boss直聘“数据分析”工作(如何爬取boss直聘的数据)

Mc Mc 发表于2024-05-13 浏览6597 评论0
爬取boss直聘数据分析【1、获取数据】 1、背景:面临工作,需要数据支持,看到各大数据源(天池、和鲸社区…),萌生一种自己爬取数据分析工作的信息,将数分融入进找工作的环节中,利用数据分析来分析当前数据分析就业环境,就业前景,以及提高找工作的效率。 2、使用工具:python3.10,sublimeText3 3、工作任务: A:获取数据 B:保存数据 C:清理数据集 4、开始任务: 4.1 安装python3,sublimeText3环境,安装所需pip插件和类库 4.2 新建boss.p

爬虫

网易云音乐接口解析(网易云音乐接口解析错误)

84929290 84929290 发表于2024-05-13 浏览9081 评论0
我们都知道,爬虫网易云音乐时候参数是经过加密的,所以在分析网易云接口的时候要了解它的加密过程,下面来看看怎么实现爬虫的整个过程。 Part1 进行网页分析 首先打开网易云的网页版 点击搜索音乐,这里我们以音乐:后来,为例 Part2 进行数据包分析 鼠标右键审查元素或者直接打开F12,进入调试界面,然后点击网络 点击播放按钮,出现了如图所示的数据包,点击箭头所指的数据包内容 这里得到了点击播放返回的json数据,里面包含了播放音乐的url,现在我们怎么得到这个url呢

爬虫

Python爬虫:自动评论何须学完爬虫,只需要掌握requests库即可

牙郎 牙郎 发表于2024-05-13 浏览7701 评论0
网络库requests 其实,我们有专门的网络库进行直接的网络请求与处理,它就是requests库。在我们开始讲解与使用之前,需要通过如下命令进行安装: pip install requests 首先,我们先来看看requests库可以进行哪些操作: 发送HTTP请求 上传文件 处理Cookie 支持Session会话 使用代理 身份验证 打包请求 SSL证书验证 下面,我们来一一介绍这些操作具体是如何实现的。 发送HTTP请求 与urllib与urllib3一