來源:《中國高新技術產業導報》
北京是中國軟件產業的中心,產業規模居全國首位。盡管如此,北京的數據挖掘產業發展與中國數據產業類似,仍停留在初級階段。北京擁有大量從事數據挖掘的國內外企業和單位,分布在理論算法研究、軟件工具、咨詢服務、集成開發等產業鏈各個環節。相比較而言,產業鏈上游市場主要被國外企業占據,國內企業主要處于產業鏈的末端。SAS、SPSS、SAP、Oracle、Teredata、微軟和IBM等企業都把北京作為輻射中國的核心;而國內企業像神州數碼、太極、中科軟、華迪、拓爾思等主要提供系統集成服務,產品和工具提供商數量較少,規模較小,影響力與國外企業相比有一定差距。
北京海量數據挖掘產業發展難點分析
用戶數據挖掘工具使用能力弱
目前用戶普遍存在的問題是,數據掌握者與數據挖掘結果需求者往往不是同一人,由此造成掌握企業數據的人不知道數據有什么用,而需要數據挖掘結果的人卻不知道從何處得到這些結果,因而在決策中處于被動的局面。用戶數據挖掘工具使用能力弱,造成企業數據與數據挖掘結果的集成問題突出。
用戶缺乏能夠執行數據挖掘的復合型人才
從目前電信、金融行業的人才結構來看,主導建設數據挖掘系統的大多是工科出身,業務不熟悉,對于數學領域中的統計學也都較為生疏。因此這種復合型人才的缺乏也在很大程度上造成了我國數據挖掘市場的不成熟。
數據源的可靠性問題
數據源是整個數據挖掘過程的源頭,如果源頭的數據不能保證可靠、可信和科學,那么挖掘得到的信息也就不可靠。因此,如果數據源的問題不解決,數據挖掘就是紙上談兵。
北京發展海量數據挖掘產業的優劣勢分析
北京發展海量數據挖掘產業的優勢
一是數據挖掘產業結構完整。完整的數據挖掘產業鏈條包括算法提供方、產品和工具提供商、系統集成商、咨詢公司和企業用戶。北京是中國軟件產業的中心,其海量數據挖掘產業結構相對完整。
二是有較為成熟的理論和技術。北京有較為成熟的海量數據挖掘理論和技術,擁有北大SAS 數據挖掘卓越中心、中國科大博納數據挖掘中心等專業研究機構;擁有中科院計算所MSMiner多策略數據挖掘平臺、人大金倉SmartBI系列產品、TRS BigData等海量數據挖掘產業有代表性的產品。
三是數據資源豐富,企業、政務機關集聚,數據的質量和數量都占有優勢。