由於晶片效能不斷地提升,數位科技處理資料的能力也跟著水漲船高,因此大數據(big data)的應用越來越廣泛,許多決策與行為都依賴大數據與演算法來實施。這是一個可悲的現象,也是一個迷信的時代,光是探究誰會擁有大數據?誰在制定演算法?民眾就應該集體覺醒,切莫成為資料獨裁(dictatorship of data)者的奴隸。只有人們不迷信大數據,並懂得如何反向操作還原真相,大數據才能成為你可使用的工具。
圖為川普團隊高級法律顧問Jenna Ellis,在11月19日的新聞記者會上,向美國民眾說明採取法律行動的第一步。 |
根據《大數據》一書作者麥爾荀伯格的定義,大數據要的是大雜燴的巨量資料,也就是蒐集全部的資料,使得資料處理的樣本等於母體。過去還無法蒐集與處理巨量資料的時期,多是使用隨機抽樣的方法來預測,根據數學統計的原理,那麼誤差只會在3%的範圍之內,是一項相當可靠的科學方法。然而時至今日,各項抽樣調查也屢屢失誤,甚至與結果完全相反,民調已成為刻意操控的工具,客觀的環境不復存在。
到了大數據時代,這項缺失可以改善嗎?答案是或許可以,或許不可以,完全取決於人心。一般以為大數據是實在的,人心是空泛的,其實剛好相反,大數據才是空泛的,人心才是實在的,這樣來處理大數據才可能回歸本質。《大數據》一書提到:「巨量資料的一個核心概念,就是要以相關性,做為預測的根據。」找到相關性等於找到「緣」,事物的確是靠緣來運行或媒合,所謂:「有緣千里來相會,無緣對面不相識。」緣很不可思議,但沒有「因」就什麼都不是。
大數據的相關性(correlation)是更為物化的概念,它不須要強調因果關係(causality),就能八九不離十預測事物的發展。雖然這很有科學根據,所謂:「同聲相應,同氣相求;水流溼,火就躁。」或是「近朱者赤,近墨者黑。」但你可能沒有想過,事物也可以「出汙泥而不染」或是「火焰化紅蓮」。大數據的相關性都來自於既有結果(data)的分析,然而沒有種子(因),只有陽光、水、土壤等眾緣,會長出花草嗎?會有意義嗎?
所有的根本正因來自於「心識」,這是近來科學界漸漸得出的結論與方向,所以不強調因果關係等於走向物化的不歸路。每個人都有獨立的心識,因不同,結果就會不同;意念改變,結果就會改變。當把事物的結果都資料化(datafication)後,可能把人心都蒙蔽了,變愚昧了,任由資料來操縱了。
所以,大數據有四種天生的缺陷,一是數據可能造假或不實,也就是所謂的因地不真,果遭迂曲,垃圾進則垃圾出,這是最大的問題;二是未來並非科技決定論,不僅測不準,實際還有無限可能;三是演算法只是一種面向,容易演變成先射箭再畫靶;四是數據永遠不可能完整,在無限的概念下,所有大數據都是小數據。
孟子說:「人之所不學而能者,其良能也;所不慮而知者,其良知也。」良知良能是人的根本,不需要大數據你也能做出判斷,想想螞蟻在大水來臨之前就知道遷移準備,這不用靠Google,也不用問Siri。這次美國的大選,極有可能就是一場大數據的大詐欺,從荒謬的民調風向、主流媒體的偏頗報導、社群平台的操縱痕跡,到Dominion投票系統的數據疑雲,以及最後顯示的拜登突變曲線,種種違反常識的作為,有良知者不可能視而不見,這是數據操控者的傲慢,也是對人類智慧的挑戰。
未來,在大數據時代,資料獨裁者或許會遍佈在金融巨鱷、科技集團、主流媒體與政黨政客裡,那麼世界的黑暗就會來臨,這也是受聽大眾甘受資料化的結果,唯有放下對大數據的迷思,才有可能脫離物化,改變命運,走向光明。
圖說
圖為川普團隊高級法律顧問Jenna Ellis,在11月19日的新聞記者會上,向美國民眾說明採取法律行動的第一步,誓言將對本次選舉是非曲直進行全面審判。同時也對主流媒體掩飾事實的傲慢提出了鏗鏘有力的批判。(https://www.youtube.com/watch?v=vRoQPnsX6yA&t=263s)