久久久久久综合网天天,男女久久久国产一区二区三区,综合图区亚洲欧美另类图片,亚洲国产精品SSS在线观看AV,人妻少妇精品久久久久久

 
新華社大數據處理平臺
來(lái)源: | 作者:tardetech | 發(fā)布時(shí)間: 2015-07-15 | 4177 次瀏覽 | 分享到:
新華社多媒體數據庫中的數據資源超過(guò)1.5億條,如何更好使用和盤(pán)活這些數據資產(chǎn),使之轉化為新的生產(chǎn)力,服務(wù)于新華社戰略轉型,是新時(shí)期新華社信息化建設的一個(gè)歷史使命。

1.客戶(hù)需求

新華社多媒體數據庫中的數據資源超過(guò)1.5億條,如何更好使用和盤(pán)活這些數據資產(chǎn),使之轉化為新的生產(chǎn)力,服務(wù)于新華社戰略轉型,是新時(shí)期新華社信息化建設的一個(gè)歷史使命?,F有的文本檢索系統檢索精度差,基于規則的靜態(tài)分詞不適應業(yè)務(wù)發(fā)展需要。同時(shí),對于歷史新聞數據的語(yǔ)義分析,新聞文檔對象之間的關(guān)系理解,都需要借助新的技術(shù)手段予以實(shí)現。另外,對于多語(yǔ)言的分析處理,海量多媒體資源(圖像,音視頻)識別和標引的需求也亟待被滿(mǎn)足。

從業(yè)務(wù)角度上看,新華社業(yè)務(wù)種類(lèi)的日益豐富,原有的IT系統已顯露出諸多的不足和問(wèn)題,難以對新業(yè)務(wù)和新的需求進(jìn)行快速的響應和有力的支撐。另外,隨著(zhù)新華社新聞稿件半結構化、非結構化數據的日益增長(cháng),信息管理平臺應用已面臨著(zhù)數據備份恢復時(shí)間長(cháng)、運維成本高、存儲彈性擴展能力差、存儲成本高、無(wú)法滿(mǎn)足業(yè)務(wù)多維查詢(xún)的問(wèn)題;文檔服務(wù)平臺存在海量歷史數據離線(xiàn)檢索不便、數據備份恢復時(shí)間長(cháng)的問(wèn)題。同時(shí),隨著(zhù)近年來(lái)業(yè)務(wù)的發(fā)展,產(chǎn)生了結構化數據與非結構化數據整合存儲與聯(lián)動(dòng)查詢(xún)的新需求。

2.解決方案

天迪工控大數據一體機在解決如上問(wèn)題和新需求方面較傳統技術(shù)手段更有優(yōu)勢,并具備現實(shí)可行性。非結構化數據分析采用XData-hadoop,結構化數據分析采用XData并行數據庫,系統架構如圖:

3.客戶(hù)收益

1) 對各應用系統進(jìn)行整合,避免之前的獨立建設造成的IT資源浪費;

2) 實(shí)現了音像資料、金融信息的共享,能夠很好地滿(mǎn)足新媒體發(fā)展和全媒體融合的需要;

3) 基于標準規范構建的多媒體數據庫數據共享服務(wù),實(shí)現了系統間數據復用功能;

4) 能夠很好地滿(mǎn)足新華社對結構化和非結構化數據整合存儲與聯(lián)動(dòng)查詢(xún)的新需求;

5) 架構上采用松耦合的技術(shù)原則,能夠實(shí)現系統的靈活擴展;

6) 平臺針對不同子系統的需求特點(diǎn),選用合適的技術(shù),能夠突破性能瓶頸提升單臺設備的處理性能;

7) 系統具備良好的擴展能力,能夠在適應當前需求的基礎上盡量為將來(lái)可預見(jiàn)和不可預見(jiàn)的功能、性能擴充留有余地;

8) 新功能、新業(yè)務(wù)的增加能夠在不影響系統運行的情況下實(shí)現;

9) 系統采用HA、負載勻衡、云計算虛擬化、副本式存儲計算冗余等技術(shù),從系統級、設備級和業(yè)務(wù)級等多個(gè)層面進(jìn)行高可用設計;

10)有全面、完善、便捷、統一的網(wǎng)管系統和網(wǎng)絡(luò )性能監控系統,支持多種故障報警,一旦發(fā)生問(wèn)題能夠在最短的時(shí)間內處理解決。