想像您站在一個黑暗的房間裡,只有一枝蠟燭。當您將一枝蠟燭的火焰碰觸到另一枝未點燃的蠟燭時,黑暗會進一步退去,而您原本的火焰則繼續熊熊燃燒。這個動作象徵了一句古老的義大利諺語:「一根蠟燭點燃另一根蠟燭,不會失去任何東西」。這個隱喻說明了維基百科的一項轉變性創新——內容翻譯工具。就像蠟燭散發光線一樣,這個工具已協助「點燃」維基百科內超過 240 萬篇不同語言的翻譯文章。
在內容翻譯工具推出之前,代表性不足的語言維基百科中存在著巨大的知識差距。當英語和其他主要語言的維基百科版本因數以百萬計的文章來源而蓬勃發展時,代表性較低的語言維基百科卻面臨著一個嚴峻的現實,那就是來源充足的內容數量極其稀少。Scott Hales對維基百科多語言編輯者的影響和編輯模式的研究同時表明,以代表性不足的語言為母語的多語言貢獻者經常在兩個維基百科上編輯類似類型的內容。例如,西非語言(如豪薩語和伊博語)在其維基百科中的內容很少,而多語言貢獻者透過翻譯英語和其他較大語言維基百科的內容來擴展這些語言的知識。
因此,只能使用這些母語嚴重限制了人類獲取集體智慧的途徑。透過更輕鬆和更好地使用翻譯工具,更多的多語言編輯者可以為改善知識庫以及其母語貢獻者基礎做出貢獻。

在內容翻譯工具出現之前,雙語貢獻者在翻譯維基百科文章時面臨挑戰。他們必須將內容複製到單獨的文件中,在考慮上文下理的同時進行翻譯,然後使用 Wikitext 進行格式化和引用——所有這些均需要遵循編輯政策。這個繁瑣的過程妨礙了志願者的參與,尤其是在代表語言不足並數位素養往往有限的維基百科。以這些語言從頭開始撰寫文章同時非常耗時。
內容翻譯工具介紹
維基媒體基金會於 2015 年推出的內容翻譯工具使繁瑣的翻譯過程自動化,透過人工審核流程使維基百科豐富的知識更容易跨語言流動,確保內容的保留,正如加泰羅尼亞語使用者在圓桌討論中強調的那樣——這是維基百科的定義。多年來,隨著維基媒體語言和產品在地化團隊(以前稱為語言團隊)不斷完善和增強該工具,我們見證了代表性不足的語言內容創作的顯著增長,為知識公平做出了貢獻。重要的是,維基百科的知識差距不僅在於文章的數量,同時在於所涵蓋主題的多樣性。最初,南亞和西非的維基百科版本以地理條目和傳記為重點,而理工科、文化和歷史等重要主題的代表性不足。該工具正在逐步幫助彌合各子區域之間的主題差距。
知識在各大洲的傳播
透過與維基百科志願者社群的合作以及倡導知識公平的活動,貢獻者利用此工具添加了內容並增加了各個維基百科的文章數量和覆蓋範圍,取得了重大進展。例如:
- 憑藉對伊博語和豪薩語維基百科的獨特貢獻,該工具創造了 80% 的內容,闡明了以前這些語言無法觸及的理工科、文化、歷史和社會等關鍵主題。來自奈及利亞的志願者編輯Aliyu在一篇文章中分享道,在使用該工具之前,他無法想像將與健康主題有關的文章從英文手動翻譯為豪薩語維基百科會是什麼樣子。
- 印度語維基百科(如泰盧固語、泰米爾語、尼泊爾語、孟加拉語、卡納達語、馬拉地語、烏爾都語、奧裡亞語、阿薩姆語和克什米爾語維基百科)的翻譯文章數量逐年穩定成長。 這些語言的維基百科在南亞被廣泛使用,在短短三年內,其翻譯的理工科主題文章數量已從不到11,000篇增加到超過 59,641篇。

- 在2019冠狀病毒病疫情期間,該工具可協助翻譯工作小組在短時間內將維基百科2019冠狀病毒病疫情專案中的2019冠狀病毒病疫情文章翻譯成 130 多種語言。這有助於降低有關2019冠狀病毒病疫情的錯誤訊息風險,並在封鎖期間和之後向世界提供可靠的資訊。
值得注意的是,透過翻譯工具創建的文章被刪除的可能性比從頭開始創建的文章更小。這表明經過人工仔細編輯和審核後,這些機器輔助輸出可以在多種語言的維基百科中產生高品質的內容。
十年來的持續改進
就像園丁培育幼苗一樣,維基媒體語言和產品在地化團隊在過去十年中培育了內容翻譯工具。正如中國諺語所說的一樣——「千里之行,始於足下」。最小可行產品的推出標誌著第一步——在維基百科的廣闊花園中播下種子。每次增強都使工具不斷發展,帶來顯著的改進:
- Google機器翻譯整合(2016)透過整合Google翻譯的自動初稿,加快了更多語言維基百科的翻譯過程。您可以閱讀有關研究人員研究結果的更多資訊。
- 改良的模板和引用處理(2018)可在翻譯過程中輕鬆轉換與科學主題相關的文章中的複雜模板,同時保留參考文獻和內容完整性。
- 協作翻譯行動體驗(2021)讓多個編輯者同時處理同一篇文章的不同部分,從而提高協作能力。
到 2021 年,該工具已經發展到可以同時應對社會學和技術上的挑戰,成為一個強大的工具,供桌面和行動使用者逐節協作翻譯文章,同時偵測機器翻譯的濫用。
進一步的技術發展繼續擴大了該工具的適用範圍:
- MinT 機器翻譯:將翻譯支援擴展至超過 40,000 個語言配對。這提高了首次獲得 MinT 翻譯支援的 55 個維基百科語言版本翻譯人員的工作效率。請參考這篇文章以閱讀更多詳細資訊。
- 個人化翻譯建議功能:這是團隊最近的改進。這項工作改進了內容翻譯工具的文章建議清單支持,使用戶能夠根據41 個基於主題的過濾器自訂和接收文章推薦。這意味著他們可以發現和翻譯他們感興趣和專業領域的文章,以及發現受內容成長活動計劃啟發的社群策劃清單(稱為「集合」)。目前,該功能已有約 50 個集合,並且同時在不斷增加,並且正在進一步改進中。
- 統一的儀表板使得在桌面和行動裝置上存取相同的功能變得更加容易。透過此功能,桌面用戶可以逐節翻譯文章,並使用個人化過濾器來取得符合他們興趣領域的翻譯建議。

您在知識公平中的作用角色
該工具的演變反映了對持續改進的承諾,擴大了對各個領域(包括理工科、文化和歷史)的高品質並由人工審查資訊的存取。每篇翻譯的文章均會建立新的聯繫並鼓勵更多的人參與這項全球性的工作。參與方式如下:
對於多語言編輯者:使用內容翻譯工具將文章翻譯成您了解的語言。每一篇文章均可以幫助人們找到用其母語表達的訊息。
對於內容成長活動的組織者:舉辦專注於代表性不足語言的重要主題翻譯活動,並使用頁面集合標籤來吸引更多翻譯人員翻譯您的文章清單。
內容翻譯工具體現了維基百科致力於讓每個人都能獲得知識的承諾。我們可以共同分享知識,為他人照亮道路,以擴大所有人的好奇心和理解力。

Can you help us translate this article?
In order for this article to reach as many people as possible we would like your help. Can you translate this article to get the message out?
Start translation