文章目录:
易语言怎么获取网页源代码
易语言如何取网页源码:
1、首先,运行“易语言”主程序,弹出“新建工程对话框”选择“Windows窗口程序”然后点击“确定”按钮,进入“Windows窗口程序设计界面”。如下图:
2、接下来,拖放标签组件一个、编辑框组件两个、按钮组件一个及分组框组件一个。将他们放置到合适的位置并将窗口的宽高设置到适当的大小。以确保窗口的简洁美观。如下图:
3、待界面调整完毕之后,将窗口标题、标签标题、分组框标题及按钮标题修改成相应内容,并且将编辑框、按钮组件规范命名。为编写程序代码做准备。
4、接下来就是编写代码了,在“_按钮_获取源码_被单击”事件子程序下,编写如下代码【 编辑框_网页源码.内容 = 到文本 (HTTP读文件 (编辑框_网址.内容)) 】如下图所示:
5、待代码编写无误后,进入调试阶段。按下“F5”快捷键运行程序,网址以百度经验的网址为例,然后点击“获取源码”按钮,等待程序执行。如图:
6、从网页源码编辑框得到的反馈结果分析,如果源码中出现乱码通常是编码方式的问题。这个时候,需要进行转码,就能看到正常的代码了。那么,代码也需要做小的改动。如图:
7、重新测试程序,从网页源码编辑框的反馈结果可以看出,这次读取的网页源码是正确的。
易语言网页验证码提取
获取网页验证码有几种方式。 1.手动查看网页中的验证码图片是否是 图片格式存储,如果是,可以通过自定义浏览器控件进行下载。 2.如果 是地址链接方式无法获得图片,可以通过后台截图方式进行获取。 介绍 彗星HTTP模块 识别的话 就麻烦一点了,识别才是真正的技术问题。 1.手绘描点,不是所有的验证码都长的一样,有个别的网站要发现他的图片规律,不是通用型的,我们要通过自己手绘描点方式来做识别模板。 2.通用模式,介绍给你 万挂海,精易,作坊等模块,里面包含了一些识别模块。
易语言如何获取网页源码的并展示出来?
.版本 2
.支持库 RegEx
.支持库 internet
.支持库 iext
.子程序 _按钮1_被单击
.局部变量 网页文本, 文本型
.局部变量 表达式, 正则表达式
.局部变量 搜索结果, 搜索结果, , "0"
.局部变量 计次变量, 整数型
.局部变量 文本, 文本型
网页文本 = 到文本 (HTTP读文件 (编辑框1.内容))
网页文本 = 子文本替换 (网页文本, #引号, “'”, 0, , 真)
网页文本 = 到小写 (网页文本)
透明标签1.标题 = 取中间文 (网页文本, “title”, “/title”)
表达式.创建 (“meta (.*?)”, 假)
搜索结果 = 表达式.搜索全部 (网页文本)
.计次循环首 (取数组成员数 (搜索结果), 计次变量)
文本 = 搜索结果 [计次变量].取子匹配文本 (网页文本, 1, )
.判断开始 (寻找文本 (文本, “name='keywords'”, 1, 假) > 0)
透明标签2.标题 = 取中间文 (文本, “content='”, “'”)
.判断 (寻找文本 (文本, “name='description'”, 1, 假) > 0)
透明标签3.标题 = 取中间文 (文本, “content='”, “'”)
.默认
.判断结束
.计次循环尾 ()
.子程序 取中间文, 文本型
.参数 全文, 文本型
.参数 左文, 文本型
.参数 右文, 文本型
.局部变量 位置, 整数型
.局部变量 总长度, 整数型
.局部变量 文本, 文本型
总长度 = 取文本长度 (全文)
位置 = 寻找文本 (全文, 左文, , 假)
.如果真 (位置 < 0)
返回 (“”)
.如果真结束
位置 = 位置 + 取文本长度 (左文)
文本 = 取文本中间 (全文, 位置, 总长度)
总长度 = 取文本长度 (文本)
位置 = 寻找文本 (文本, 右文, , 假) - 1
.如果真 (位置 < 0)
返回 (“”)
.如果真结束
文本 = 取文本中间 (文本, 1, 位置)
返回 (文本)
].取子匹配文本 (网页文本, 1, ).判断开始 (寻找文本 (文本, “name='keywords'”, 1, 假) > 0)透明标签2.标题 = 取中间文 (文本, “content='”, “'”).判断 (寻找文本 (文本, “name='descri
编辑框_网页源码.内容 = 到文本 (HTTP读文件 (编辑框_网址.内容)) 】如下图所示:5、待代码编写无误后,进入调试阶段。按下“F5”快捷键运行程序,网址以百度经验的网址为例,然后点击“获取源码”按钮,等待程序执行。如图
写 (网页文本)透明标签1.标题 = 取中间文 (网页文本, “title”, “/title”)表达式.创建 (“meta (.*?)”, 假)搜索结果 = 表达式.搜索全部 (网页文本).计次循环首 (取数
本型.参数 右文, 文本型.局部变量 位置, 整数型.局部变量 总长度, 整数型.局部变量 文本, 文本型总长度 = 取文本长度 (全文)位置 = 寻找文本 (全文, 左文, , 假).如果真 (位置 < 0)返回 (“”).如果真结束位
方式无法获得图片,可以通过后台截图方式进行获取。 介绍 彗星HTTP模块 识别的话 就麻烦一点了,识别才是真正的技术问题。 1.手绘描点,不是所有的验证码都长的一样,有个别的网站要发现他的图片规律,不是通用型的,我们要通