2023.07.06 淺談AI時代的台灣優勢與發展策略(林文源、王道維/清華大學人文社會AI應用與發展研究中心)

 

林文源
清華大學通識中心教授
清華大學人文社會A I應用與發展研究中心主任

王道維
清華大學物理系教授
清華大學諮商中心主任
清華大學人文社會AI應用與發展研究中心副主任

 

圖一:AI聊天機器人「ChatGPT」示意圖(取自:PIXABAY)

圖一:AI聊天機器人「ChatGPT」示意圖(取自:PIXABAY)

 

A I真的來了!2022年可以說是生成式AI(Generative AI)在全世界應用爆發的元年,台灣各界也反應熱烈,不但諸多民眾熱衷使用ChatGPT與Midjourney,驚訝AI看似無所不能的強大威力,近日還引發網路名人是用電腦繪圖還是A I繪圖的爭議。國科會更宣布即將打造台灣版的GPT,而清華大學首先宣布組成專案小組因應AI對高等教育的衝擊。

但是在這一波熱潮中,台灣是否有可能不只是看熱鬧,而是發揮優勢,儘速參與這一波AI科技的發展?而政府除了鼓勵科技產業界與技術研究單位投入外,還需要在哪些基礎設施上建造,才能開發出對我們社會有實質幫助的A I應用呢?

筆者為人文社會與理工背景,我們在幾年前開始意識到A I對各界的潛在影響,因此透過國科會計畫與許多領域的研究者一同推動「公共化A I」專案。這項專案是以促進跨領域合作為主,尤其聚焦在如何推進人文社會研究專業知識參與AI發展。我們近期的重要工作之一是建立專業資料的標註平台,並推廣人文社會團隊進行專業標註,希望及早培養未來AI發展應用的土壤。我們認為台灣各界雖然所可能需要著力的地方有所不同,但相當關鍵的是訓練符合在地需求的AI所需要的資料標註,並且開發合適的應用場域,才能將各項資源連結起來,培育AI發展更健康合適的土壤。

以車子的製造來比喻,AI是這個汽車的引擎,是最重要且不可取代的部分。但是如果車子只有引擎也不可能跑,還需要有油箱與合適的燃料輸入,更要有傳動軸與輪胎將引擎的馬力帶出來。若這台車要能載人載貨,也總是需要有椅子與坐墊才會舒服。若缺少這些,沒有人會只買一台引擎回家。簡而言之,AI公共應用所需要互相搭配的至少有三個領域:「資料來源」、「AI技術」與「應用場域」,以及兩個重要環節:「整理標註」與「系統建置」。彼此間的關係可約略用圖一來表達,而外面虛線的方框代表整個社會所需要搭配的法規環境、教育訓練與資源配置。

 

圖二:AI公共應用所需要完善的整體架構。(作者提供)

圖二:AI公共應用所需要完善的整體架構。(作者提供)

 

在這樣的架構下,筆者以下對不同單位或領域所可以加強的角色提供若干方向性的建議,希望能搭配起來一起為AI的公共應用帶來新的契機。

一、對政府科技推動單位(例如數位發展部或國科會)以台灣的資訊科技基礎,對於A I演算法的掌握應已有相當實力,人材濟濟。但較大的弱點之一反而在於對本土實際需要的資料掌握較為有限。這是由於在目前的法規以及公部門害怕犯錯等限制下,許多資料往往分散而不容易取得。因此政府若有志於將A I推展為重點科技政策,或許並不是再砸大錢作另一個GPT(難道要學微軟投資OpenAI的100億美金?),而是建立與資料有關的基礎設施,例如優先解決資料治理的法治基礎與相關規範(這也需要與司法單位討論協調),讓法令規範可以更有彈性來鼓勵學者或業界嘗試應用政府相關資料,自然有無窮機會與創意會發生。

 

圖三:OpenAI公司的「聊天機器人」ChatGPT是AlphaGo之後,最受全球矚目的人工智慧應用程式。(取自:美聯社)

圖三:OpenAI公司的「聊天機器人」ChatGPT是AlphaGo之後,最受全球矚目的人工智慧應用程式。(取自:美聯社)


 

二、對政府各部會與各級政府:目前台灣的開放政府推動已有相當成效,而各級機關與單位長年委託或自行提供的統計數據也有一定累積或公開上網。然而這些往往都是只與該單位業務工作量有關的統計,用來應付民意代表的詢問,而缺乏從研究或未來發展角度而有的完整性數據。舉例來說,最近教育單位很重視大學生的心理健康議題。但是我們並未有任何全國性的資料架構,足以讓研究者了解各校學生實際使用諮商資源的人數/人次與學校類型、系所、性別、年級、求助主題等等關係。目前只有各校自行用不同的方式來統計,無法整合也數量不足。沒有統一的數據結構來評估問題可能的原因與癥結點,就像在矇著眼打一場不知道敵人的戰爭。就算現在想要開發某些AI應用來協助改善校園心理健康,又要拿甚麼資料來訓練或評估成效呢?

當然,心理諮商的資料有隱私的問題,需要較嚴謹的倫理審查(其實可以有效的去個資),但是重點是許多沒有機密隱私的開放資料,也常常是片面不全的,只是反映相關單位作了甚麼事,而非從資料治理的角度發現還有甚麼可以知道得更完整,找出足夠的特徵(feature)來作研究分析或應用。因此關鍵的第二步是要在各中央與地方政府設置類似資料治理且有相當層級的專責單位:由具有統計或量化研究專長的主管領導,並不只是被動地蒐集統計,而是要有前瞻性的預想可能的發展方向與相關因素,將蒐集這些不直接與其單位職務相關的資料(但是間接相關)列為第一線公務人員的KPI,並以標準化的格式儲存,未來才能以原始資料形式讓AI發揮更大的功能。

三、對各級教育單位:目前各界已經意識到A I素養的重要性,但是在教育領域面對AI這種快速變化的科技,不應只是買設備或軟體,教學生如何複製使用。因為給魚很快就過期(演算法會更新),而是應該教他們如何釣魚(也就是用AI思維來評估資料與應用)。各級教育除了在逐步加強演算法能力外,應謹記AI是靠資料學習且在特定領域才能應用的,而甚麼樣的資料結構或品質往往也就決定了甚麼樣的AI發展。因此更應加強學生對資料分析的跨領域合作能力以及敏感度:包括從資料源頭的取得、清理、標註到最後的應用場域、市場、對象等等,有整體的視野,了解自己可以在哪些方面可以有獨特的貢獻(例如開發新的資料來源或發想新的應用情境),而非一窩蜂去寫程式,才是現在教育面對AI發展所欠缺的核心根本。

 

圖四:機器人、人工智慧、AI示意圖(取自:Unsplash)

圖四:機器人、人工智慧、AI示意圖(取自:Unsplash)

 

四、對人文社會領域的學者:以上提到的這些能力都與現有的人文社會各個領域密切相關,因為人社領域原本就擅長探討關於如何界定問題、分析資料,甚至參與建立各個領域的制度,而這些也是未來打造適合在地的AI所需要的重要專業。當然,各人社領域也都可能因為AI的引入而會撼動原來的研究方式或看待問題的視角。因此,人文社會專業在A I時代不會消失,反而會以不同的形式變得更為重要。尤其是若要發展一般功能的A I,台灣就資料量上很難與國際大公司或國家比較,但以語言資料為例,台灣是擁有豐富的南島語系資料,就南島語系,甚至是台語、客語等,則有相對較高優勢。此外關於台灣的各種社會治理、文化與互動的A I發展都需要在地的人社參與。從這個角度,人社學者中應該可以有更多人願意投入資料整理的工作,讓這些資料有機會被整理好且有適當的標註(見圖一)。雖然這部分的工作可能不容易直接發表到頂尖的期刊論文,但卻是未來AI相關發展的重要基石。當然國科會或政府單位應該要加大力道補助或支持學者參與若干重要資料庫的建置計畫,也要調整相關的升等與評量機制,作更長遠的投資。

五、對理工資訊領域的學者:過往理工領域的研究都是與國際標準一致,以能發表到國際一流期刊或頂尖會議(Top Conference)為榮。這部分當然是學術研究不可避免也仍然需要努力的地方,但是在AI發展在地化的脈絡下,如何將這些AI 技術打造成實際可用於我們台灣社會,解決實際面臨的如長照、醫療、司法、教育、經濟、交通或社會各面向的相關系統與使用介面(見圖一),也應該是我們理工或資通訊領域學者不可迴避的責任(總不能丟個程式碼給民眾使用吧)。但是新的AI技術往往也是由年輕學者從國外帶回,而他們卻有較大的升等與發表的壓力。所以開發系統這部分也需要國科會或政府教育單位調整資源補助方式,提供長期穩定的經費與支持,並配合學校升等與評量方式的調整,才可能持續開發維護,而不是一味追趕國際潮流,而忘卻自身優勢,以及台灣社會的利基與需求。

六、對各大學與高等教育機構:除了謹慎地戒備A I對高等教育的挑戰外,更重要的應該是積極善用高等教育過程,促使學生多元發展與AI協作的能力,以創造更好的AI社會與個人職涯發展,不應墨守於特定領域的傳統而不思變遷。畢竟未來有許多工作會因為AI而消失,也會有新的機會出現。我們不應讓學生自行去面對這樣的環境,而應更積極調整教學的內容與方向,培育長遠善用AI的能力。此外對於A I發展不可或缺的跨領域應用而言,大學內部可以藉由調整升等與評鑑的方式來鼓勵學者投入相關研究,並且結合同校或跨校的AI技術學者與人文社會領域學者,將跨領域的AI公共應用作為大學的社會責任(USR)之一。這將有助於快速累積適合台灣發展的在地化A I,而這種跨領域的整合正是大學端可以做到的獨特社會貢獻,在台灣的環境中更顯得十分重要且無法被取代。

七、對於產業界:如何直接將AI應用來產生市場價值往往是企業所關切的重點,也因此常發生業界為了市場競爭而挖角學界人才,讓AI的基礎研究產生斷層,也因此難以累積學界人才於AI的公共應用。但是細看國外許多AI公司的發展,其獲利模式往往不是直接因為AI的產品,而是搭配有AI相關的公眾服務(例如將AI技術融入搜尋引擎)。所以業界也應該認真思考如何投資AI於公共化的服務,可以與學界合作創造更大的價值與品牌形象,一起培育更多博士級學生先開發技術,然後於業界發展應用,讓整體社會享受到AI技術的果實。當然,台灣許多中小型企業相關的研發能力有限,可能不足以單獨投入,所以更應該將同類型的產業由工研院等相關研究機構來整合,將資料串接並輔導技術轉型,一起對外打團體戰來提升整體的能力。

 

圖五:對話型人工智慧ChatGPT在網路上大受歡迎、台積電在美國大動作設廠,以及其他一週商業大事(取自:ChatGPT 官方網站)

圖五:對話型人工智慧ChatGPT在網路上大受歡迎、台積電在美國大動作設廠,以及其他一週商業大事(取自:ChatGPT 官方網站)

 

八、對社會民間團體:台灣社會最寶貴的地方是擁有相當豐沛的各種社會倡議團體,以及相當數量擁有演算法技能的熱血公民。但是以目前的資料與資源分配狀況,這些民間團體多數都無能自行發展AI應用。其根本原因之一還是在於所掌握的資料不足,也沒有足夠的經驗媒合技術端與使用端,引導相關的開發。但是性質相近的民間團體若能結合起來與政府或學術界合作,將各自的資料作有效的標註與累積,甚至部分開放或串接於統一的架構,必然會大幅降低AI應用的開發門檻,也會加速連結而可以貢獻技術能力的AI技術人員,發展出獨特的生態系。這種以公民參與的科技發展模式,在台灣已有空氣盒子、各種黑客松、開放軟體社群等,也有一定的成熟度。目前AI相關社群目前也蓬勃發展中。民力無窮,應該更是台灣A I公共應用與發展的創意活泉。

當然,以上只是筆者初淺的了解與想法,可能不見得都即時可行但應該有其方向性的意義。畢竟AI技術的開發與落地是相當複雜的過程,需要各界一起參與,各司其職,才能培育出合適的土壤,將來自於全民的資料落實於全民的福祉,才是「公共化AI」的最終目的。

 

*本文同步發表於風傳媒:https://www.storm.mg/article/4738337?mode=whole