酷代码 AI
菜单
全部AI  /  AI写代码神器
服务商

帮我用易语言写一个爬虫代码 需要爬虫的网址是:https://www.mihuashi.com/artworks 需要爬取的内容是当天的最新作品里所有作品的画师和点赞数量和标签内容

# 易语言爬虫代码:米画师最新作品爬取 ```e .版本 2 .程序集 爬虫程序 .程序集变量 网页内容, 文本型 .程序集变量 正则表达式, 正则表达式类 .程序集变量 画师名数组, 文本型, , "0" .程序集变量 点赞数数组, 文本型, , "0" .程序集变量 标签数组, 文本型, , "0" .程序集变量 当前日期, 文本型 .子程序 _启动子程序, 整数型 .局部变量 索引, 整数型 .局部变量 结果文件, 文本型 当前日期 = 取日期文本 (取现行时间 (), "-") 结果文件 = 取运行目录 () + "\米画师作品_" + 当前日期 + ".txt" 爬取米画师数据 () 删除文件 (结果文件) 写到文件 (结果文件, "米画师当日最新作品数据 (" + 当前日期 + "):" + #换行符 + #换行符) .计次循环首 (取数组成员数 (画师名数组), 索引) 写到文件 (结果文件, "作品 " + 到文本 (索引) + ":" + #换行符, 真) 写到文件 (结果文件, "画师: " + 画师名数组 [索引] + #换行符, 真) 写到文件 (结果文件, "点赞数: " + 点赞数数组 [索引] + #换行符, 真) 写到文件 (结果文件, "标签: " + 标签数组 [索引] + #换行符 + #换行符, 真) .计次循环尾 () 信息框 ("数据爬取完成,已保存到:" + 结果文件, 0, , ) 返回 (0) .子程序 爬取米画师数据 .局部变量 网页请求, 网页访问类 .局部变量 作品块数组, 文本型, , "0" .局部变量 作品块, 文本型 .局部变量 临时文本, 文本型 网页请求.初始化 () 网页内容 = 网页请求.访问网页 ("https://www.mihuashi.com/artworks", , , , , , , , , , , , , ) ' 检查是否获取到网页内容 .如果真 (网页内容 = "") 信息框 ("获取网页内容失败", 0, , ) 返回 () .如果真结束 ' 提取所有作品块 正则表达式.创建 ("<div class=""artwork-item"".*?<\/div><\/div><\/div>", 网页内容) 作品块数组 = 正则表达式.取匹配文本数组 () .计次循环首 (取数组成员数 (作品块数组), 索引) 作品块 = 作品块数组 [索引] ' 提取画师名 正则表达式.创建 ("<a class=""username"" href="".*?"">(.*?)<\/a>", 作品块) .如果 (正则表达式.取匹配数量 () > 0) 画师名数组 [索引] = 正则表达式.取子匹配文本 (1, 1) .否则 画师名数组 [索引] = "未知" .如果结束 ' 提取点赞数 正则表达式.创建 ("<span class=""like-count"">(\d+)<\/span>", 作品块) .如果 (正则表达式.取匹配数量 () > 0) 点赞数数组 [索引] = 正则表达式.取子匹配文本 (1, 1) .否则 点赞数数组 [索引] = "0" .如果结束 ' 提取标签 正则表达式.创建 ("<span class=""tag"">(.*?)<\/span>", 作品块) 临时文本 = "" .计次循环首 (正则表达式.取匹配数量 (), 标签索引) .如果 (标签索引 > 1) 临时文本 = 临时文本 + ", " .如果结束 临时文本 = 临时文本 + 正则表达式.取子匹配文本 (标签索引, 1) .计次循环尾 () 标签数组 [索引] = 临时文本 .计次循环尾 () .子程序 取日期文本, 文本型, , 返回格式为YYYY-MM-DD的日期文本 .参数 时间, 日期时间型 .局部变量 年, 整数型 .局部变量 月, 整数型 .局部变量 日, 整数型 年 = 取年份 (时间) 月 = 取月份 (时间) 日 = 取日 (时间) 返回 (格式化文本 ("%04d-%02d-%02d", 年, 月, 日)) ``` ## 代码说明 1. 这段代码使用易语言实现了一个爬取米画师网站最新作品的功能 2. 主要爬取内容包括:画师名称、作品点赞数和标签内容 3. 爬取的数据会按当天日期保存到文本文件中 ## 使用说明 1. 需要易语言5.9或更高版本运行 2. 需要"网页访问类"和"正则表达式类"支持库 3. 运行后会生成一个以当天日期命名的文本文件,包含所有爬取的数据 ## 注意事项 1. 网站可能有反爬机制,频繁请求可能导致IP被封 2. 网页结构变化时需要调整正则表达式匹配规则 3. 商业用途需遵守米画师网站的使用条款 ## 额外逻辑点 1. 正则表达式匹配可能因网页结构微小变化而失效,需要定期检查更新 2. 点赞数可能包含"k"等缩写形式,当前代码仅处理纯数字情况 3. 标签提取未做去重处理,同一标签可能在不同位置重复出现 [2025-07-13 22:15:14 | AI写代码神器 | 1312点数解答]

热门AI查看更多
“AI写代码神器”擅长各种语言编程、解释代码、注解补充。 在这里填写你的问题。如:写出java冒泡排序算法。
一个入口掌握所有。 在这输入任何问题,或者要AI输出的内容。
将阿拉伯数字转为人明币大写,如:数字1000转换为壹仟。
AI生成爆文标题,能够快速创作出极具吸引力的标题,促使短视频、自媒体文章的点击率与阅读量迅猛攀升。 此处填写一个原始标题,如:一般人怎样打理自身的社交圈?
AI生成新闻评论。 在这里填入新闻内容。
AI生成内容摘要。 在此处填入需要生成摘要的内容,还可以输入4000字。
AI生成主持词,擅长团建、年会、婚礼、节日等场合的主持词编写。 在这里填入主持场景,如:运动会
AI快速生成周报、月报、日报、年终总结等各类总结报告。 在这里简单输入工作目标、指标、成果,没有任何格式或特殊需求。如:计划年销售业绩1000万,实际完成800万。
输入一个字,显示以这个字开头的歇后语
输入一个字,显示以这个字开头的成语
极速在线生成证件照
极速更换证件照红、蓝、白底色
实用工具查看更多
阿里云99元2核2G服务器/年,199元2核4G服务器随心买。
今日油价 [生活类]
全国各省油价,实时更新。
图片互转base64 [开发类]
将图片转换为Base64编码,可以让你很方便地在没有上传文件的条件下将图片插入其它的网页、编辑器中。 这对于一些小的图片是极为方便的,因为你不需要再去寻找一个保存图片的地方。
时间转换器 [开发类]
时间戳转换器,时间、毫秒、秒、倒计时查看
录入名字、电话、邮箱、个人介绍信息,生成二维码,可通过此码扫码添加微信联系人
数独游戏 [娱乐类]
数独(Sudoku)是经典的9x9数字逻辑谜题。在有81个小格的九宫格内,玩家依据初始数字推理填入1 - 9的数字,要保证每行、每列以及每个3x3宫格中的数字都不重复。这款在线数独游戏有多难度可选,没有头绪时,可以点开答案看一下哦^_^
经典推箱子 [娱乐类]
基于H5的经典推箱子小游戏,锻炼玩家的眼力和反应力,非常不错
AI摸鱼五子棋 [娱乐类]
基于H5的五子棋人机对练,锻炼玩家的眼力和反应力,非常不错
相关提问