才沒那麼容易被AI取代?ChatGPT與新聞業的相愛相殺

聯合新聞網 張時健
一個老練的記者對於其採訪路線上的新聞文稿樣態與風格,已經成竹於胸,只要備齊必要的...

ChatGPT在2022年底上線後,被認為是改變社會的新里程碑,其重大突破在於能讓機器掌握複雜的人類語言與溝通過程,一面是能夠理解我們用日常話語提出的問題,另一面是能消化網上巨量資料,並再生成流暢可讀的文字回傳答案。ChatGPT能夠回答的問題形形色色,包括:

「我給你人事時地物的必要資訊,請彙整後生成一篇完整新聞報導給我。」

這個應用,和新聞業作為資訊中介者(mediator)的定位頗為切近。新聞工作者僅守中立客觀報導和忠實傳遞資訊的原則,盡可能摒除人為判斷和主觀解釋(這留待讀者決定),把查訪到的資料經過合適的編排,按固定的體例與格式撰寫成報導。這是所謂的「純淨新聞」(pure journalism),一度是新聞工作守則,也是至高標準。

也就是說,一個老練的記者對於其採訪路線上的新聞文稿樣態與風格,已經成竹於胸,只要備齊必要的新聞資訊,就可以快速完成公正的報導。這裡指的公正不只是平衡,還包括追求客觀的程序:

規格化且制式化的新聞寫作模版儘管有路線上的差異,但大體而言是必須把人為的影響去除,讓不同的記者執行相同的流程,都能完成近似的結果。而這個去人化的生產流程,正好是機器的強項。

ChatGPT在2022年底上線後,被認為是改變社會的新里程碑,其重大突破在於能...

ChatGPT普及後的新聞工作或新聞業,或許需要更專注在原生新聞的產製。示意圖,...

▌ChatGPT之前的「機器生成新聞」

而這個固定新聞體例的做法並不是ChatGPT上線後才有的。早期主要是新聞集成(news aggretation)式的媒體,提供一站取用新聞的服務,其中低下者如內容農場固然錯誤百出,卻仍為了追求點擊重覆推送聳動未經查證的內容,更可惡的是隱瞞撰文者身份和資訊來源讓人難以查證,經常成為假新聞的出處;但也有大型入口網站的首頁,以能提供即時重大且有品質的新聞取勝,而微軟(Microsoft)旗下的MSN就在2020年中,全面採用自動化的新聞集成與編輯程序,原先20餘名新聞編輯的聘雇合約因此中止

更普遍的,我們常用Google News的訂閱服務,以及在社群網站像Facebook上被推送的新聞頁面,其核心的演算法可以根據個別使用者的數位足跡以及個人資料,撈取並推薦裁剪過的新聞內容,而這個過程並不需要熟悉老讀者胃口的資深編輯判斷。可以說,機器介入了新聞改寫與編輯排版的流程,已經許久,而讀者也習以為常了。

然而值得注意的是,自動化新聞集成是早已普遍的應用,但讓機器就集成的資料再編寫為可讀文稿的技術,主要是自然語言處理以及生成(natural language processing and generation),是隨著電腦運算速度的提升到晚近才漸成熟。

在ChatGPT上線前,藉機器生成內容的新聞類型,主要是文體結構比較制式僵硬、且篇幅較短的純資訊性報導,特別是轉播數據為主的內容,比如運動賽事的即時競賽成績、財經新聞中對金融市場各指數的播報、各種天氣數據等等。為人熟知的例子是商情新聞通訊社《彭博社》(Bloomberg),為了向金融業客戶提供盡可能零時差且準確的資訊,很早就串接金融中心的數據資料庫,並大力開發自有的語言模型和機器學習,使資料生成新聞的流程自動化。

就個別新聞工作者而言,短期內使用ChatGPT協助編寫新聞,或尋找新聞資料與查證...

示意圖。ChatGPT之類的AI技術普及後,可預見將為新聞業節約人力,業者不論主...

不僅於此,隨著文字探勘領域中的主題萃取(topic extraction)技術以及關聯分析的成熟,《彭博社》的機器已能就「非數據」的純文字資料進行深度理解,為金融業客戶提供見微知著的早期商業情報,也就是在關鍵事件還在蘊釀、尚未廣為報導前,就被機器標定掌握,並生成重點式文章發送給有關客戶。

這樣的資訊服務,對於需要洞燭機先、或分秒必爭的客戶非常寶貴,類似的服務還有由前《華爾街日報》研發部門主管馬可尼爾(Francesco Marconil)新創的公司AppliedXL專門經營,號稱可以為特定產業的顧客提供關鍵事件發生前的早期訊號,讓顧客可以提早因應。

而《美聯社》則是早在2017年就展示過類似技術,在《擴增新聞的未來:智慧機器時代的新聞室指引》(The Future of Augmented Journalism: A Guide for Newsrooms in the Age of Smart Machines)報告中,《美聯社》提供了長篇文稿及其重點摘要,並請讀者自行理解文稿後比對其與摘要間的落差。在讀者都認為摘要精確地呈現文稿重點後,《美聯社》才宣布摘要是由社內開發的機器自行判讀生成的。也就是說,《美聯社》在六年前展示的「擴增式新聞」,已能使用機器模仿人類的思索與判斷的過程,以及寫作(或接近創作)的能力。

值得注意的是,相比於《彭博社》與AppliedXL專治特定領域的資訊處理(意即資訊的規律與結構較容易辨認與模仿),《美聯社》業務涵蓋的資訊面向與類型更加複雜與全面,如今已常態性地運用AI自動生成新聞。《美聯社》自詡為「推進新聞業技術革命的領頭羊」,2022年更發佈報告《地方新聞用AI:美國新聞業的AI程度調查》(Artificial Intellegence in Local News: A Survey of Newsrooms’ AI Readiness)。

這份報告顯示,用自然語言模型自動生成新聞內容的做法,在美國新聞業已經相當普及,報告內文寫著:「只要有序地填入資料到預先備妥的表單欄位中,自動寫作系統就能夠將之彙整並且生成新聞全文。」除此之外,自動生成版面、自動配圖配音等等,也都是AI著力之處。

示意圖。用自然語言模型自動生成新聞內容的做法,在美國新聞業已經相當普及,除此之外...

示意圖。若新聞工作者就同業的報導作改寫彙整,單就這項工作而言,ChatGPT能用...

▌ChatGPT對新聞業的顛覆改造

簡單回溯新聞業導入AI的軌跡後,大概可知如今ChatGPT對新聞業的意義,是完成新聞產製自動化的最後和最艱難的一哩路,也就是非特定領域的大型語言模型(large language model, LLM)的普及應用成真。這本來是《彭博社》、《美聯社》戮力開發的獨門能力,如今可以被小型媒體甚至個人新聞工作者用在日常工作流程中。舉例而言,若新聞工作者就同業的報導作改寫彙整,單就這項工作而言,ChatGPT能用更短的時間、且更準確地完成,方法是由記者或編輯抓取任兩篇以上同主題的報導,請ChatGPT彙整後生成指定字數的短稿。

除了改造記者編輯個人的新聞工作,ChatGPT對全產業可能帶來立即的衝擊已經引起普遍擔憂:如同可憎的內容農場,入口網站與Google News等新聞集成服務,可以不必再經排序後呈現或推薦原新聞出處,而是自動生成改寫後的新聞提供給讀者。這樣為資訊爆炸時代讀者設想的「貼心」服務,不論是平台業提供,或讀者自行使用,都截斷將讀者帶回新聞出處網站的導流過程,更可能因平台具備輕易「產製」新聞的能力,而影響甚至取消平台業與新聞業的廣告分潤機制,使原來經營困難的新聞出版業雪上加霜。

試想:只要有程式可以即時撈取媒體上的新聞,並串接各大機構公關部門的發稿系統,將撈取回來的資料分類餵給ChatGPT並請改寫生成新聞,就可以即時地在網路上發佈了。若再結合根據原生新聞流量或熱門關鍵字排序呈現的排版程式,或是按個別訂戶屬性,客製化的推送介面,就能為讀者更準確地提供新聞服務——即使這個過程既不產出原生內容,也沒有付費分擔原生內容的生產成本。這對於新聞業經營的傷害顯而易見,美國的新聞業者聯合會(News Media Alliance)就因此要求,這類再生成新聞的服務應當付費給產製原生新聞的媒體,並且在國會推動相關立法。

綜上,ChatGPT的普及應用對新聞業是福是禍呢?它的影響是兩面的:一方面為新聞業節約人力,業者不論主動或競爭壓力下被迫,都可以將原本人手完成的工作交給機器,讓新聞產出與發佈自動化。另一方面,是廣告營收的分潤機制遭到破壞,營業更困難。

就個別工作者而言,短期內使用ChatGPT協助編寫新聞,或尋找新聞資料與查證,是提高了工作效率,但這也意味技術門檻進一步被拉低,長期而言是配合業者節約人力的方向前進。不論是經營者或工作者,都是將行業的核心技術能力讓位科技公司了。而營業收入與人力支出的節縮,對任何一個產業與工作者來說,都是負向發展的訊號。

營業收入與人力支出的節縮,對任何一個產業與工作者來說,都是負向發展的訊號。示意圖...

如今ChatGPT對新聞業的意義,是完成新聞產製自動化的最後和最艱難的一哩路,也...

但事情未必就往這個竭澤而漁的終局前進。僅管AI可以迅速集成網上公開資訊並編成新聞發佈,但總是要有原生新聞供其編寫。也就是說,ChatGPT普及後的新聞工作或新聞業,或許需要更專注在原生新聞的產製,以及相關工作程序上——這使記者必須更專注開採一手資料,包括實地調查與訪問關鍵涉事者,或是提出通透的評論洞見,而AI是可作為記者的有力工具;ChatGPT作為新的人機介面,還大大節省了記者操作複雜運算的力氣。相對的,二手甚至三手改寫的新聞,其價值即將因為機器大量供應與介入工作程序而快速貶損。

由於科技公司提供的新聞服務無法自給自足,不得不倚重新聞媒體提供原生內容,德國大型出版商Axel Springer——《圖片報》(Bild)、《世界報》(Die Welt)等德媒的總公司——就對ChatGPT普及後的前景抱持樂觀,並表示旗下新聞媒體的數位轉型或會造成人力縮編,但「新聞記者、作者、編輯的數量不會裁減,還會投入更多資源」。

專研「新聞自動化」的西北大學學者迪亞科普洛斯(Nicholas Diakopoulos),也抱持類似判斷,認為機器不可能取代記者。但條件是記者必須學會數位思考與技能,能夠將新聞議題與事件「參數化、模型化、拆解成片段資訊,這樣就可以解放機器的潛能,提供新創產品與各種可能」。迪亞科普洛斯的意思是,在新聞業實現「自動化」之後,記者必須學會與機器共存,配合機器的邏輯製作新聞——這意味新聞業仍將存續,但工作模式可能迎來近乎顛覆的巨大改造。

ChatGPT對新聞業來說可謂是把雙面刃,端看從業人員如何思考與使用,然而科技公司如何與新聞業達成共好的局面,不會自然發生,而失去活力的新聞業將使民主制度無以為繼。在ChatGPT的應用把這個新聞業的困境加重而至存亡之際,政府所應扮演的角色,是杜絕科技公司的資訊服務搭新聞業便車的行為,使科技為人所用,令其轉向正向循環的方向前進。

ChatGPT對新聞業來說可謂是把雙面刃,端看從業人員如何思考與使用。 圖/路透...

責任編輯/賴昀

張時健

喜歡影像和正義,和研究影像與正義如何生成以及有影響力。

深度專欄

推薦文章

留言