`
sfeve
  • 浏览: 42404 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论

Linux下抓取网页数据小程序

阅读更多

每天都在维护学校的教务系统,访问量小的时候还好,访问量大的时候server时不时就崩溃。。同学写了一个自动重启Web server的小程序,果断拿来学习一下,收获很大,现总结如下。

 

Web server部署在Linux操作系统上,IDE用的是Weblogic Workshop。如果访问量大到超过Weblogic连接池最大容量的时候,server就会崩溃。。Weblogic有个自带网页的控制台console,里面有个监控页面Monitor。显示了当前的连接数,最大连接数等等数值。所以可以写程序实时抓取监控页面的数据,来决定什么时候自动重启。

 

使用wget命令来下载网页,用system命令来执行语句。

如 wget http://www.baidu.com -O baidu_index.html

这样就在当前目录下,抓取到了百度的主页到baidu_index.html文件下。

写在程序里就用 system("wget http://www.baidu.com -O baidu_index.html"); 运行后相当于执行了上面的命令。同理,写system("startWeblogic.sh &");就相当于重启Weblogic。

 

这样就简单了,使用wget下载到监控页面后,读到当前的连接数,如果大于一个值就重启就搞定了~(因为监控页面的框架是固定的,所以在固定的行数读数字就好了O(∩_∩)O~~)。

 

写完了程序,想想自己还差得远啊,光光加油!

分享到:
评论
12 楼 johnson444 2011-06-22  
看上去有点牛逼~~
11 楼 rogerer 2011-05-04  
不错,谢谢分享。
10 楼 pubobo 2011-04-28  
JMX是不二选择
9 楼 yagas 2011-03-01  
这就叫做“山人自有妙计”,有办法总比没办法好。我也将就玩一下吧。
8 楼 feihen 2011-03-01  
有必要优化架构,感觉这样的技术方案不行。
7 楼 flynofry 2010-12-24  
huansinho 写道
是学生的话就要鼓励一下!
现在上大学真正学习知识的同学已经不多了。


对在校学生更多的鼓励,帮助。
6 楼 huansinho 2010-11-25  
是学生的话就要鼓励一下!
现在上大学真正学习知识的同学已经不多了。
5 楼 GIL_CHEN 2010-11-21  
鼓励一下. 你可以考虑优化下这个脚本看能做点什么别的事情.

当然这个只能是workround的做法, 不能算是最终解决方案
4 楼 vlinux 2010-11-14  
就算是用你这样的方法,也应该是推荐用SHELL、Python之类的脚本语言来完成,你用system这个以后谁来维护啊...
3 楼 glamey 2010-11-14  
1。首页任务是优化代码。
2。自己写一个采集分析工具,每隔一段时间访问一次weblogic控制台页面,等于又给服务器造成压力了。

应该看看日志,然后分析下哪里出问题了。你的方法不行的。
2 楼 sfeve 2010-11-03  
goldpicker 写道
你这个明显是程序问题,用重启来解决?

确实程序效率也不高,而且Web server的配置也比较低。。高峰时同时有上千人访问。项目很大,我们维护小组一共三个人也有很多别的任务,没时间优化代码,只能想出这么个懒招儿了呵呵。
1 楼 goldpicker 2010-11-03  
你这个明显是程序问题,用重启来解决?

相关推荐

    从Linux程序中执行shell(程序、脚本)并获得输出结果

    5. 小结 1. 前言 Unix界有一句名言:“一行shell脚本胜过万行C程序”,虽然这句话有些夸张,但不可否认的是,借助脚本确实能够极大的简化一些编程工作。比如实现一个ping程序来测试网络的连通性,实现ping函数需要...

    公司网站源码(pc+wap)小程序 php源码

    小程序网站 小程序电商软件开发公司网站源码(pc+wap) 营销型网站模板,该模板适用于小程序网站、软件公司网站等企业; pc+wap同一个后台,数据即时同步,简单适用!附带测试数据! 完美的seo,所有页面均都能完全...

    蓝色小程序电商软件开发公司网站源码(pc+wap) 小程序网站pbootcms模板

    蓝色小程序电商软件开发公司网站源码(pc+wap) 小程序网站pbootcms模板 蓝色小程序网站pbootcms模板-小程序电商软件开发公司网站源码(pc+wap) PbootCMS内核开发的营销型网站模板,该模板适用于小程序网站、软件...

    linux大作业报告

    3、设计shell脚本程序,要求用户对/home目录下的文件进行备份,压缩为Linux系统中常用的tar.gz格式。 4、设计shell脚本程序,假设用户建立了目录A和目录B,目录中不包含子目录,要求用户编写一个脚本程序,比较两个...

    linux-Autoripsh是一个LinuxUnix下的命令行脚本

    Autorip.sh 是一个 Linux/Unix 下的命令行脚本,用来抓取 DVD 数据的小工具,主要用来创建高质量的 DVD 备份,包括所有的字幕、音轨,无需任何配置。

    RED HAT LINUX 6大全

    1.3 在哪里可以获取Red Hat Linux 3 1.4 系统需求 3 1.5 小结 4 第2章 Red Hat系统的安装 5 2.1 准备,认真准备 5 2.2 安装Red Hat Linux 6 2.2.1 创建引导盘和辅助盘 6 2.2.2 不利用引导软盘进行安装 7 2.2.3 虚拟...

    pbootcms模板-小程序电商软件开发公司网站源码(pc+wap)

    蓝色小程序网站pbootcms模板-小程序电商软件开发公司网站源码(pc+wap) pbootcms内核开发的营销型网站模板,该模板适用于小程序网站、软件公司网站等企业; pc+wap同一个后台,数据即时同步,简单适用!附带测试...

    泰凌微ble mesh蓝牙模组天猫精灵学习之旅 ② 如何实现 微信小程序蓝牙控制 Ble Mesh模组 安信可TB02,全部开源!

    文章目录前言一、材料准备二、实现过程三、蓝牙模块初始化四、微信小程序编程4.1 搜索设备4.2 连接设备4.3 获取服务列表4.4 获取服务下的特征列表4.5 如何接受设备发来的数据4.6 如何发送数据到设备另外,不要把我的...

    清华大学Linux操作系统原理与应用

    C.4 新版本内核的获取和更新 229 C.5 内核编译 230 C.6 修改并重启管理器 232 附录D Linux编程基础(C语言环境) 233 D.1 Linux编程常识 233 D.1.1 相关标准(ANSI C、POSIX、SVID、XPG) 233 D.1.2 函数库和系统...

    Sysinfo 是一个提供 Linux 操作系统/内核/硬件系统信息的 Go 库_GO_代码_相关文件_下载

    Package sysinfo 是一个提供 Linux 操作系统/内核/硬件系统信息的 Go 库。它完全独立,不依赖主机系统,不执行外部程序,甚至不导入其他 Go 库。 我找不到任何可以提供我需要的数据/功能集的独立库。于是又一个...

    LINUX设备驱动第三版_588及代码.rar

    LINUX设备驱动第三版_ 前言 第一章 设备驱动程序简介 设备驱动程序的作用 内核功能划分 设备和模块的分类 安全问题 版本编号 许可证条款 加入内核开发社团 本书概要 第二章 构造和运行模块 设置测试系统 ...

    Linux管理员指南

    编译Linux内核 131 10.1 内核到底是什么 131 10.2 获取内核源代码 132 10.2.1 选择正确的版本 133 10.2.2 解压缩内核源代码 133 10.3 建立内核 134 10.3.1 make xconfig过程 135 10.3.2 内核...

    Linux DeviceDrivers 3rd Edition

    第一章 设备驱动程序简介 9 设备驱动程序的作用 10 内核功能划分 12 设备和模块的分类 14 安全问题 15 版本编号 17 许可证条款 18 加入内核开发社团 19 本书概要 19 第二章 构造和运行模块 21 设置测试...

    Linux环境数据库管理员指南

    2.4.10 Linux装载程序与引导盘 35 2.4.11 完成安装 36 2.4.12 配置服务器运行数据库 36 2.4.13 需要注意的事项 36 2.5 Linux的其他风格 36 2.6 小结 37 2.7 常见问答 38 第3章 在 Linux上安装并运行 Oracle 40 3.1 ...

    LINUX 24学时教程

    本书详细讲解了用Linux的图形配置工具配置Caldera OpenLinux,通过一个ppp与网络连接、使用K桌面环境、用StarOffice提高在家办公的效率、网络浏览、发传真、接收email及使用GIMP等图形工具。 24学时每次1小时的课程...

    PHP程序开发范例宝典III

    2000/Windows 2003 Server/Linux/UNIX下测试通过。 PHP程序开发范例宝典 目录 第1章 PHP的运行环境配置 1 1.1 Windows下环境配置 2 实例001 Windows下Apache的安装配置 2 实例002 Windows下MySQL...

    Linux操作系统基础教程

    (Torvalds@kruuna.helsinki.fi)写了 Linux核心程序的 0.02 版开始的,但其后的发展却几乎都 是由互联网上的 Linux社团(Linux Community)互通交流而完成的。Linux 不属于任何一 家公司或个人,任何人都可以免费取得...

    linux programming instances网络编程教程 附源代码

    本书通过55个精彩的实例,全面剖析了在Linux下编写网络应用程序的方法,并阐述了网络协议架构和开发规范。为了适应不同读者的需要,本书从最基本的Linux系统操作到网络技术的基本理念,逐步深入至Linux/UNIX下具体的...

    linux网络编程-宋敬彬-part1

    2.2 Linux下的GCC编译器工具集 19 2.2.1 GCC简介 19 2.2.2 编译程序的基本知识 21 2.2.3 单个文件编译成执行文件 22 2.2.4 编译生成目标文件 22 2.2.5 多文件编译 23 2.2.6 预处理 24 2.2.7 编译成...

Global site tag (gtag.js) - Google Analytics