第5部分(第1/4 頁)
千萬臺計算機。。。。。。
莫回被這個資料嚇了一跳,這太嚇人了,現有的一切超級計算機放到它面前全部是渣渣。
不過這也給了莫回靈感,既然它計算力這麼牛叉,那最適合他的賺錢方式應該就是大規模計算方面了。
莫回突然笑了,這還真是踏破鐵鞋無覓處。
莫回是個碼農,並且還是玩大資料的碼農,這還真是專業對口,只要他把大資料的程式編寫好,讓這臺超級筆記本來計算,那麼可做的事情就很多了。
首先進入莫回腦海裡的就是金融大資料,只要莫回能夠開發出一款大資料軟體,讓它自動蒐集網路上的相關資訊,然後進行深度的資料分析,那麼很容易能夠將一個公司的實際經營狀況分析出來。
這些資料只要利用好了,完全可以利用在股市上嘛,只要有無窮計算力做保證,那麼分析結果將會無限趨近於真實情況,甚至會那個企業的董事長還要準確的把握住企業未來發展狀態。
莫回通盤考慮了一下,感覺這個想法應該有足夠的可行性,程式自己編寫就足夠了,網上的公共渠道也可以提供足夠的資訊,只要資料分析演算法設計好,最終輸出的結果將會有極大參考價值。
不過這事對於軟體開發來說是一個大專案,恐怕很難一個人在短期內完成,不過這也不用太過擔心,莫回的想法是拼接。在網上尋找各類開源軟體,然後將這些軟體拼接起來,先做成第一版的大資料金融分析軟體。
等第一版軟體出來,實際執行測試,開始幫助他炒股掙錢之後,他就可以用這些錢來僱人幫忙開發軟體了。
到時他可以將整個軟體分成很多個模組,每個模組發一個包,無論是包給個人也好,還是包給其他軟體公司也好,這樣分解開發,最終再在他這裡組裝在一起。到時他就是一個專案經理的角色,只要控制好整體的開發進度,完全可以遙控很大的一個團隊幫助他進行開發。
這款軟體的名字莫回已經想好了,就叫股神,他準備先開發股神1。0版。
開發週期莫回暫時無法預期,不過可以想見的是,即使做一個拼接組裝的活,中間也會有大量的介面開發工作,將這些軟體拼接在一起的粘合劑和組裝平臺就需要他自己動手了。
具體工作量無法預估,只能先幹著再說,如果開源軟體剛好都能找到合用的,這個週期自然會短不少,如果很不巧,沒有合用的軟體,估計他就得自己開發,這所耗用的時間就沒頭了。
莫回給自己列了一個工作進度表,按照這個進度表開始逐條逐項的完成和推進。
如果想要“攢”一個股神1。0,那麼有幾個必須的關鍵功能模組,比如股神1。0的大腦,這將是一個大資料分析模組,它負責將所有蒐集來的資訊進行整理加工,並且從中提取具備指導意義的分析結論。
這個資料分析模組,它必須同時具備顯性因果分析能力,和隱性因果分析能力。
比如生豬存欄資料下跌,必然導致隨後的豬肉價格上漲。生豬存欄數量與豬肉價格存在某種必然的因果關係,而資料分析模組,必須具備識別這種明顯由因就可以導致果的因果關係的能力。
比如東南海峽輸油管道發生破裂,必然導致帝國東南大區油品價格上漲,這也存在某種必然的因果關係。只不過與生豬存欄資料不同的是,生豬存欄資料屬於常態化資料,它每天都有,每天都有浮動,而油管破裂屬於偶發事件。
雖然油管破裂屬於偶發事件,但是資料分析模組必須具備識別這種偶發事件,進而給出隨後由其導致的必然後果的能力。
類似的因果關聯事件或者資料很多,資料分析模組必須具備識別這種顯性因果聯絡的能力。
與這些顯性因果相對應的,就是隱性因果聯絡。
那個著名的啤酒和尿布的案例其實就是隱性因果聯絡,這些隱性因果之間,不一定具備必然性,但是因和果之間,往往存在或然性聯絡。
就單個事例來說,這種因果聯絡未必成立,但是將其置於一個足夠大的基數上時,這種因果聯絡就凸顯出來,這是一種機率學意義上的因果關係。
另外有一個案例,就是基於這種機率學因果關係的。一個搜尋公司,它想研究今年冬天流感爆發的可能性,但是它研究的角度非常有意思,他不是從醫學角度來研究,而是程式和演算法角度來研究。
它透過分析5000萬條最頻繁檢索的詞彙,將之和疾病中心在5年間季節性流感傳播時期的資料進