即時文摘

數據素養:善用數據與有效抗疫的距離(文:黃偉豪) (09:00)

擁有數據和能否善用數據完全是兩回事,而缺乏良好的「數據素養」(data literacy)往往是阻礙數據被善用的主要因素。而特區政府在處理新冠病毒第五波疫情上進退失據,不能善用數據便是主要的關鍵。

在現今資訊科技發達,人工智能及大數據逐漸成為了主流的時代,對於一般人來說,已經可以透過互聯網等途徑,使不少數據在瞬間唾手可得。除了經濟合作與發展組織(OECD)及世界銀行(World Bank)等較傳統的國際組織外,好像Our World in Data (ourworldindata.org)等快速冒起的網站,也提供方便、快捷和可靠的數據庫。擁有公權的政府能夠收集和分析到的數據,自然也幾何級數地上升。這不止是因為政府先天地擁有法定的權力,可收集任何人的出生、結婚、收入、出入境與死亡等重要的人生數據,也因為多項公共服務的電子化,自自然然使政府旗下擁有的數據大量增加。

這催生了今時今日在國際上的一項重要趨勢,就是「開放數據」(open data)運動,希望政府可以把它擁有的公共數據與民共享,以創造更多的商業和公共價值(public value)。以香港為例,香港市民每日使用的八達通數據,其實是從市民身上收集的重要數據,擁有極大的價值和用途,政府也有使用這些數據以作抗疫用途,但可惜,這寶貴數據至今仍未向公眾開放。

相信較少人會去爭議,我們已步入一個數據充裕,甚至過多而接近爆炸的年代。這樣,問題便開始來了,為什麼我們比人類過往的歷史的任何一刻掌握了更多的數據,但卻見不得我們能夠作出更佳和更有智慧的決定?在香港目前的抗疫上,我們更加是像跌入了一個深淵,難道更多數據,反而帶來更差的決定?

數據要置於現實情境理解

問題的核心,往往不在於數據本身,而是在於人去正確理解和適當地運用數據的能力,這在現今的研究及學術的討論上稱之為「數據素養」。香港互聯網協會在3月7日以「數據與善的距離——探索數據管治之道」為題,舉辦了一個網上論壇,而筆者也是其中一個講者。筆者發言的重點之一,便是指出欠缺數據素養,是善用數據與有效抗疫的距離之間的重大阻礙之一。雖然現今有關數據科學(data science)的相關科技已經相當進步和發達,但電腦仍然不能夠完全取代人腦,不會給予我們一個「神奇數字」(magic number),只要不加思索地跟隨,便能令所有問題迎刃而解。

「數據素養」可以被廣泛地定義為「懂得了解和演繹數據,從中得到知識和洞見,能幫助制訂更有效的決策,以解決現實問題」的能力。要解決現實問題,便先要有能力把數據放置於現實世界的情境(context)中來理解,這才能知道問題的來龍去脈,從而因時制宜。

舉一個簡單而貼切的例子來解釋:有不少的統計數字均指出,家居發生最多意外的地方是廚房。對於盲目相信數字、缺乏把數據放置於現實的情境中來理解的的人來說,便會減少進入和使用廚房,甚至極端至在家居的其他地方來煮食。但真正有「數據素養」、能夠把數字融入情境來理解因果關係的人也應該知道,廚房之所以危險,正是因為是煮食的地方。所以,把煮食的地方轉移至家中的其他位置,對於減低危險根本毫無幫助,正確的方法是加強煮食的安全。

看通大局 提出真確問題

以上的例子雖然簡單顯淺,但卻突顯了現時很多人,包括了主管公共事務的決策者,在運用數據上常犯的普遍而嚴重的錯誤,這亦是為何「數據素養」近年在有關數據科學的發展趨勢的討論上突然走紅、大行其道。根據一篇《哈佛商業評論》(Harvard Business Review)的文章(註)的兩位作者指出,在他們透過20間主要公司以聚焦小組進行的研究發現,這些公司並不缺乏擁有分析數據技術能力的員工,而是缺乏擁有良好「數據素養」的精英,包括了能夠因應面對問題的現實情境,看通大局(big picture),不會只見樹木而不見森林,以「提出真確問題」(ask the right questions)的人才。

在抗疫問題上,特區政府似乎也面對跟以上類似的「不缺乏數據,也不欠缺分析數據的技術能力,但卻沒有足夠的『數據素養』」的問題,因而不能把數據放置於現實的情境之中,再找出問題的核心所在,來加強力度優先處理。最佳的例子之一,是香港在疫情第五波中足以冠絕全球的死亡率。基於香港已是一個高度發展的地區,這引起了世界各地的熱切關注,筆者甚至收到不少在外國的朋友和同行的問候,關心我的安全和健康,可能大家亦有類似的經歷。但把這極高死亡率的數據置於現實的情境之中,卻可以見到市面仍一切如常,甚至近日因確診數字回落而開始熱鬧起來,這是因為死亡率是一個平均的統計數字,長者才是現實中最高風險的死亡群組。

未有根據數據而及早預防、對症下藥,是第五波疫情失控的主要原因。而在保護長者上,最有用的預警數據是「長者是全港疫苗接種率至低的群組」,但政府未能收集更多數據以制定應對方案,也是使人費解和失望。其中一個政府對於低接種率的解說,是假資訊的流傳減低了長者接種疫苗的意欲,但除非政府有更具體和有力的數據支持,否則這說法較為片面,令人懷疑。根據過往的多項在疫情前的民意調查,長者是最信任政府的一群,而他們使用社交網絡的比率亦較低,受主要透過互聯網而傳播的假信息的影響,理應亦相應降低。

透過提升「數據素養」來問更正確的問題,從而收集相關的數據來制訂針對性的政策,而不是用籠統的數據尋找藉口,才是克服疫情的出路。而事實已證明,多了數據,但卻在使用數據的能力和智慧上沒有相應增加,對於解決政策難題可以是毫無幫助。

註:Bersin, Josh and Zao-Sanders, Marc. (2020).  "Boost Your Team's Data Literacy". Harvard Business Review. February 12.

作者是中文大學數據科學與政策研究課程主任

(本網發表的時事文章若提出批評,旨在指出相關制度、政策或措施存在錯誤或缺點,目的是促使矯正或消除這些錯誤或缺點,循合法途徑予以改善,絕無意圖煽動他人對政府或其他社群產生憎恨、不滿或敵意)

相關字詞﹕編輯推介 文摘

上 / 下一篇新聞