400-638-8808
|
微信公眾號(hào)





穩(wěn)定可靠 永不間斷

海外收發(fā) 暢通無阻

協(xié)同辦公 資源管理

超大郵件 超級(jí)功能

智能反垃圾郵件技術(shù)
易管理 免維護(hù)

微信掃一掃 關(guān)注"天下數(shù)據(jù)"商品一律九折
![]()
搜索"朗玥科技"關(guān)注,了解最新優(yōu)惠

1.硬件
設(shè)計(jì)數(shù)據(jù)中心的時(shí)候,我們的目標(biāo)是在每個(gè)環(huán)節(jié)上有冗余的時(shí)候保持系統(tǒng)最大的可用性,因此,即使有些環(huán)節(jié)不工作了,可影響不會(huì)受到影響。
·服務(wù)器使用了日常硬件:我們所有的服務(wù)器硬件基于Inter Core i3處理器,16G內(nèi)存和3TB的存儲(chǔ)空間,為了做到最大可用性,設(shè)備共用了硬盤、網(wǎng)卡、路由和交換機(jī)。
多UPS和發(fā)電設(shè)備:我們意識(shí)到在印度經(jīng)常會(huì)停電。我們不能因?yàn)橥k姸鵂奚⻊?wù)器,因此我們?cè)O(shè)置了多個(gè)UPS,一個(gè)附加的發(fā)電設(shè)備——用來防備USP也撐不住的時(shí)候。
·多個(gè)網(wǎng)絡(luò)專線:雖然有一條專線我們的服務(wù)器和爬蟲就應(yīng)該能7×24小時(shí)的工作,但為了防止網(wǎng)絡(luò)中斷,我們做了冗余——來自兩個(gè)不同服務(wù)商的專線。
2.硬件監(jiān)控和軟件配置的工具
自動(dòng)化的安裝、配置和監(jiān)控至關(guān)重要,可以接受日常的維護(hù)工作。
·自動(dòng)安裝和配置:Mondo (linux下的ghost)和 Puppet用來完成系統(tǒng)配置的自動(dòng)化管理。Mondo 用來批量安裝Puppt到裸機(jī),Puppt安裝既定的設(shè)置進(jìn)行管理和配置。
·監(jiān)控和警告: Nagios, Munin and WinPower(伊頓中國|winpower),這些軟件用來監(jiān)控我們的私有云設(shè)備。Nagios 對(duì)主機(jī)進(jìn)行頻繁的檢查并通過郵件、短信、聊天工具提出警報(bào),我們通過一個(gè)藍(lán)牙發(fā)射器連接一個(gè)廢棄手機(jī),用來發(fā)送警報(bào)短信。
·數(shù)據(jù)備份:所有數(shù)據(jù)復(fù)制在多個(gè)硬盤上備份。關(guān)鍵數(shù)據(jù)仍然要用一套獨(dú)立的外部系統(tǒng)和存儲(chǔ)設(shè)備再備份一次。我們使用rsync配合BackupPC進(jìn)行每周一次的全局備份和每日的增量備份。周備份按時(shí)傳送到外部硬盤上。
3.設(shè)置爬取設(shè)施
我們使用如下開源軟件進(jìn)行7×24小時(shí)的爬取、分布式存儲(chǔ)和工作處理。
·Hadoop HDFS:阿帕奇Hadoop 是一個(gè)支持?jǐn)?shù)據(jù)庫分布式處理的開源框架。Hadoop Distributed File System (HDFS)是其使用的主要存儲(chǔ)系統(tǒng),HDFS能夠串聯(lián)一個(gè)計(jì)算機(jī)集群中以極快的速度地為數(shù)據(jù)塊進(jìn)行拷貝和分發(fā)。
·上面提到的Cassandra 非關(guān)系型數(shù)據(jù)庫:阿帕奇Cassandra 是一個(gè)開源的分布式數(shù)據(jù)庫管理系統(tǒng)。它被設(shè)計(jì)用來通過日常服務(wù)器處理大數(shù)量級(jí)的數(shù)據(jù),提供沒有單點(diǎn)故障的高可用性。
·Hadoop Map-Reduce :是一個(gè)使用簡易的軟件框架,基于它寫出來的應(yīng)用程序能夠運(yùn)行在由上千個(gè)商用機(jī)器組成的分布式大型集群架構(gòu)上,并以一種可靠容錯(cuò)的方式并行處理上T級(jí)別的數(shù)據(jù)集。
·Pig腳本:“ Pig是一種編程語言,它簡化了Hadoop常見的工作任務(wù)。Pig可加載數(shù)據(jù)、表達(dá)轉(zhuǎn)換數(shù)據(jù)以及存儲(chǔ)最終結(jié)果。Pig內(nèi)置的操作使得半結(jié)構(gòu)化數(shù)據(jù)變得有意義(如日志文件)。同時(shí)Pig可擴(kuò)展使用Java中添加的自定義數(shù)據(jù)類型并支持?jǐn)?shù)據(jù)轉(zhuǎn)換!
·Zookeeper:是Hadoop的正式子項(xiàng)目,它是一個(gè)針對(duì)大型分布式系統(tǒng)的可靠協(xié)調(diào)系統(tǒng),提供的功能包括:配置維護(hù)、名字服務(wù)、分布式同步、組服務(wù)等。
·Apache Nutch :基于Lucene 和 Java的開源搜索引擎,用于爬蟲搜索和索引。
·文本處理通過Lucene
4.成本
1)設(shè)備支出:
整個(gè)設(shè)施花費(fèi)了大概一萬二千美元,包括服務(wù)器、冷卻系統(tǒng)、電源組件的價(jià)格,我們從當(dāng)?shù)毓⿷?yīng)商購買,自己組裝,每個(gè)服務(wù)器成本控制在了500美元。效率方面從組裝到提供給用戶需要2-3小時(shí)時(shí)間。(一小時(shí)組裝,30分鐘用Mondo恢復(fù)統(tǒng)一鏡像,一小時(shí)用Puppt安裝和配置)
可視化監(jiān)控使用了一臺(tái)LED電視,450美元,用于監(jiān)測(cè)內(nèi)存使用率、IO狀態(tài)和抓取狀態(tài),同時(shí)搭配一個(gè)藍(lán)牙發(fā)射器(4美元)和廢棄手機(jī)。
2)設(shè)備每月的運(yùn)營成本
整個(gè)系統(tǒng)每月花費(fèi)1000美元,包括每月互聯(lián)網(wǎng)線路的租用、電費(fèi)和房子租金。兩個(gè)獨(dú)立線路每月250美元。
3)維護(hù)成本
每天不會(huì)花費(fèi)超過30分鐘去監(jiān)控和維護(hù)設(shè)備。
產(chǎn)品與服務(wù)
香港服務(wù)器 香港高防服務(wù)器 美國服務(wù)器 韓國服務(wù)器 新加坡服務(wù)器 日本服務(wù)器 臺(tái)灣服務(wù)器云服務(wù)器
香港云主機(jī) 美國云主機(jī) 韓國云主機(jī) 新加坡云主機(jī) 臺(tái)灣云主機(jī) 日本云主機(jī) 德國云主機(jī) 全球云主機(jī)高防專線
海外高防IP 海外無限防御 SSL證書 高防CDN套餐 全球節(jié)點(diǎn)定制 全球?qū)>GPLC關(guān)于我們
關(guān)于天下數(shù)據(jù) 數(shù)據(jù)招商加盟 天下數(shù)據(jù)合作伙伴 天下數(shù)據(jù)團(tuán)隊(duì)建設(shè) 加入天下數(shù)據(jù) 媒體報(bào)道 榮譽(yù)資質(zhì) 付款方式關(guān)注我們
微信公眾賬號(hào)
新浪微博
天下數(shù)據(jù)手機(jī)站 關(guān)于天下數(shù)據(jù) 聯(lián)系我們 誠聘英才 付款方式 幫助中心 網(wǎng)站備案 解決方案 域名注冊(cè) 網(wǎng)站地圖
天下數(shù)據(jù)18年專注海外香港服務(wù)器、美國服務(wù)器、海外云主機(jī)、海外vps主機(jī)租用托管以及服務(wù)器解決方案-做天下最好的IDC服務(wù)商
《中華人民共和國增值電信業(yè)務(wù)經(jīng)營許可證》 ISP證:粵ICP備07026347號(hào)
朗信天下發(fā)展有限公司(控股)深圳市朗玥科技有限公司(運(yùn)營)聯(lián)合版權(quán)
深圳總部:中國.深圳市南山區(qū)深圳國際創(chuàng)新谷6棟B座10層 香港總部:香港上環(huán)蘇杭街49-51號(hào)建安商業(yè)大廈7樓
7×24小時(shí)服務(wù)熱線:4006388808香港服務(wù)電話:+852 67031102
本網(wǎng)站的域名注冊(cè)業(yè)務(wù)代理北京新網(wǎng)數(shù)碼信息技術(shù)有限公司的產(chǎn)品