虚拟主机大流量的排查方法
发布时间:2012-07-14
来源:网户客服
虚拟主机在设计之初即设计了用户数量,当一个或多个站点访问量很大时,将会大大提高CPU、内存和磁盘I/O的使用,从而侵占其它站点的资源,导致整台服务器访问缓慢。所以我们建议用户购买适合自己的主机,而非最便宜的主机。所以建议您在购买虚机时,根据自己的网站性质、规模、内容、程序语言等确定应该购买哪款主机。
网站可能会因为流量过大而使网站管理者投入更多的费用,而且自己的网站访问起来也会变慢,本文将对流量分类及如何优化做简单分析。
一、流量统计参数::
PV(Page View)值:是指一定时间范围内所有浏览该网站的访问者请求的页面数量之合。(例如:该网站一天有100个访问者,每个访问者浏览的页面数量平均为5页,则每天的PV是100×5)
Hits值:是指对每个页面元素的请求数量。(一个页面中任何一个图片或者flash文件都算是一个页面元素)
日浏览字节数:即日流量,是指一天内,访问者请求的所有页面元素的字节数之和。
二、用户站点流量的计算公式:
总流量=访问流量+下载流量= Page view值 x 页面大小+下载文件大小 x 下载次数
三、为什么控制流量:
由于虚拟主机是多个用户的网站共享一台物理服务器资源。如果一个网站流量太大,不仅严重占用网络带宽资源,而且还加重了整台服务器负荷,影响到其它用户。所以,为了保证服务器的正常工作,我们在需要对虚拟主机的流量进行控制,根据虚拟主机服务协议,我们的控制措施包括删除站点的部分内容或关闭主机,并且不承担相应的责任。
四、造成流量过大的原因:
1. 网站规模较大(比如门户网站、网络商城等),即网站本身访问量需求大,查看网站的Page View值、Hits值、日流量都很高。
2. 网站页面设计不合理,页面中包含大图片或音频、视频文件等文件,导致网站页面太大,查看网站Page View值、Hits值较低,但日流量很高,请您检查网站是否有过大的页面(超过1M),例如:Page View=1000,则 1M*1000=1G ,所以也会造成大流量。页面过大不利于您的用户访问您的站点,如果您的用户所处的网络环境速度较慢,页面越大打开的时间就会越长。请您对网页程序进行整改(如网站首页过大,可以采用分级式结构处理。)
3. 网站内容被盗链或提供数据下载,网站提供*.mp3,*.rar,*.zip*.exe等文件的下载,或者是您的网站提供视频、音频文件的播放(如:背景音乐,宣传广告,flash 等),查看网站Page View值可能不是很高,但Hits值、日流量会很高。 (此种情况比较常见)
4. 搜索引擎产生大量流量,如果您在某些搜索引擎上做过某些推广或宣传,或者网站上提供大量的图片用于外部调用,网站正常访问量较小,但搜索引擎搜索产生流量很多,与被盗链特征类似,查看网站Page View值不高,但Hits值、日流量会较高。
5. 如果以上情况均能排除,还有可能是您网站遭受DDOS攻击或者是被挂码,短期内产生大量的访问需求,此类网站Page View值、Hits值、日流量都很高,但持续几天后攻击结束就会降低,或者相应的修补程序漏洞。
五、如何避免大流量:
1. 如果网站规模较大,网站的点击率很高,如果是这样造成大流量则说明您网站的访问量很高,您当前购买的服务已不能满足您网站流量的需求,建议购买相适应的虚拟主机。主机类型越高所提供的流量也越大,相比之下,购买低端主机需要支出主机租用费用+流量费用,可能比高端主机花费更多。
2. 如果页面太大导致大流量,则建议减少音频、视频文件,如果实在不能减少,建议将这些文件分散到多个页面中以减少单个页面大小。可以适当降低流量,也可以提高访问速度。
3. 编写 robots.txt文件来限制搜索引擎搜索不想开放的资源,甚至全部内容禁止搜索引擎搜索,这样会影响网站推广效果,但可以避免一部分流量,也可以间接避免被盗链。
4. 网站遭受攻击规模较大的话,网户会关停此站点,如果规模较小,则可能会被网户当作正常访问而不作处理。如果用户发现了自己的网站被攻击,则可以提请网户做站点保护,我们将在防火墙上做适当保护策略,以减少用户的损失。
5.客户目前在CP控制面板中有一个单独的流量查询的功能,在“增值服务工具”中点击“流量查询”后可以查询到前一个完整月的流量记录和应该的流量限制,客户可以查询并且根据情况进行流量的购买。
6. 经常分析流量,虚拟主机用户可以通过http://cp.hichina.com控制面板生成访问统计报告进行分析,也可以查看流量报告进行简单分析。如果您使用了第三方的网站统计,感觉与网户提供的数据相差太大,也可以通过控制面板WebLog日志下载功能,下载近期的www访问日志进行分析,这里推荐使用 Awstats、Expert等软件进行分析查看,另外网户提供的流量统计中,将302跳转的页面只统计访问次数,但不统计流量,比第三方统计的流量会小一些。