`
stingchen
  • 浏览: 109726 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Twitter没有计划放弃ruby on rails,而且早就用了erlang改进性能

阅读更多


Twitter 是用 RoR 开发的流量最大的站点. 应用了 Rinda,其 基于 DRb使用DRb (”Distributed Ruby”.), 该库可以通过 TCP/IP 从远程 Ruby 对象发送接收消息,
,还用到了erlang技术中著名的 ejabberd。

5月9日,其官方网站上登信息辟谣, Twitter没有计划放弃ruby on rails,早就开始使用了混合语言改进性能。

为什么这个谣言传得这么快,这么像真的?

许多人总是担心rails的性能问题,一旦网站稳定性出了问题,首先考虑是rails撑不住了。

真实的情况是这样的:

1)网站和传统java,delphi桌面或企业应用程序不同,大部分性能不是来自语言,而是来自应用设计。

2)目前twitter可以支持每秒11000个请求,性能已经够了。
这是什么概念?假设1000万个用户,每个用户平均每天发10个帖子,每秒也就1000个帖子。
如果1000万个用户,每人运行一个客户端来发贴,24小时内每15分钟发一贴,每秒为10000个帖子。
现在twitter的规模还不到1000万用户,更没有每天如此活跃的1000万用户和客户端。

3)系统宕机的原因是有些恶意的程序通过API发帖,在瞬间超过了11000个以上。
系统必须通过限制程序的短时间内发帖总量,避免恶意程序破坏。
谁在做这些事?SEOer,twitter排名靠前, PR高, 发帖有API接口,很容易快速建立反向链接,许多人都在做这些发帖。也有些好奇者用极端情况测试,比如24小时增加9000个朋友。
有效地控制一个合理上限,是应用设计的一个关键。
为了彻底灭掉SEOer的行为,twitter已经去掉了帖子中的链接。
对于极端用户,已经做了封闭帐号或删除处理。
还使用了一系列方式检测这些问题。

4)目前性能足够,所以twitter没有使用数据分区存储,还是Master-slave架构。
相信要提升空间,还有很大余地。比如将用户按照地区或名称计算hash值,分配到10个或更多的数据库服务器上。

twitter平台如下:
------------------------------------------------
Ruby on Rails
Erlang
MySQL
Mongrel
Munin
Nagios
Google Analytics
AWStats
Memcached

据说twitter目前的运行状态如下:
------------------------------------------------
每秒钟600请求
每秒钟平均200-300个连接,峰值为800个连接
MySQL每秒钟处理2,400个请求
180个Rails实例,使用Mongrel作为Web服务器
1个MySQL服务器(one big 8 core box)和1个slave用于只读的统计和报告
30+进程用于处理其余的工作
8台Sun X4100s
Rails在200毫秒内处理一个请求
花费在数据库里的平均时间是50-100毫秒
超过16GB的memcached
7
5
分享到:
评论
2 楼 Arbow 2009-04-08  
此文太旧了吧,都快一年了,现在批起来比较怪异。
最新的可以查看《Improving Running Components at Twitter》这篇在QConLondon发表的slides,现在Twitter使用了Rails,C,Scala,Java,MySQL这些工具,Erlang似乎被废弃了。
1 楼 gashero 2009-04-08  
楼主没必要为ROR做这么fans状的保护么。纠正几个错误:

11000req/s我不知道是指哪种,但是似乎没听说过是按照发帖数来计算的。从HTTP请求数来计算,nginx和lighttpd,甚至一个erlang初学者写的http服务器,跑在DELL 1950上都可以达到这个数字,注意,是一台服务器。如果按照Twitter这种规模的网站,动态响应只能达到11000req/s显然是远远不够的。反过来说ROR的性能还是值得怀疑的。

关于恶意发帖的,各种论坛、聊天室、博客都存在这个问题,貌似加个验证码也就解决了。

关于下面的那些运行状态,对正经一点网站做运维的工程师来说,性能真的很弱,简直就像菜鸟配置出来的Apache一样。再者就是用200ms来处理一个请求必然会造成并发数的急剧提到,常见的要求是后台要求在5ms以内,前台对公网的服务器不处理逻辑只顶并发的,限制在100ms内。而提到的区区800并发连接简直就是个笑话,对于200ms的处理时延来说,网站必死无疑。

相关推荐

Global site tag (gtag.js) - Google Analytics